摘要:
一转眼好几年岁月如烟身边的朋友啊想念却好久不见过去画面就像黑白的照片如今的笑容却那么困难下一站离梦想还有多远前行的路好长一眼望不到边得到的失去的无法计算心中的快乐却不如从前北京的夜色照亮了谁的孤单有一种声音在悄悄的蔓延霓虹下一群寂寞的人举杯换盏只想安静的吃一顿晚餐北京啊北京有多少人在默默的期盼有一种信念燃烧在心间不许哭不流泪不把痛放到嘴边混在北京没那么简单 阅读全文
摘要:
数据挖掘能干什么?
分类 分类可以把大量数据(在数据挖掘中也称为事例CASE)分成多个类别,而分类的依据就是这些事例中的属性。
聚类 分类有一个同胞兄弟就是聚类,聚类相对分类更加自动,聚类也将大量实例分成多个类别,不过这次是根据属性值的相似程度自动汇聚成不同的类别。通常把分类成为有监督的算法,而聚类则被称为无监督的算法,主要原因就是分类在执行前就已经有了明确的类别,而聚类在分析前还不知道有多少分类,而是通过不断的迭代使得各分类之间的边界更加清晰,然后再分析这些分类之间的差别,因此聚类也成为无监督的算法。
关联 关联是找到事例中出现频率较高的组合规则。
序列 提到关联,另外一个同胞兄弟就是序列。序列也是发现组合规律的,不过关联中所提到的规律不涉及到先后次序,而序列则是有先后次序的。
回归 对连续的结果值(不依靠人为分段Discretize)进行预测的算法归为回归。 阅读全文
摘要:
从技术层面来说,按照数据挖掘产出的知识可以粗分为两大类:描述型挖掘和预测型挖掘。 阅读全文