摘要:
流数据模型和传统的关系模型(Relational Model)有几个重要的区别: (1) 数据流的数据元素持续到达 (2) 流数据处... 阅读全文
摘要:
AdaBoost 是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器,即弱分类器,然后把这些弱分类器集合起来,构造一个更强... 阅读全文
摘要:
流式处理(Stream Processing) 是针对 批处理(Batch Processing)来讲的,即它们是两种截然不同的数据... 阅读全文
摘要:
关联规则的几个概念: 关联规则是形如 X -> Y 的蕴含式,表示通过 X 可以推导出 Y,X称为关联规则的左部(Left Hand... 阅读全文
摘要:
在二维平面上,把两类数据分开需要一条直线。到了3微空间,要把两类数据分开,就需要一个平面。把上述分类机制扩展到基本情形,在高维空间... 阅读全文
摘要:
K-Means 算法是最简单的一种聚类算法,属于无监督学习算法。 聚类和分类最大的不同在于:分类的目标是事先已知的,而聚类则不一样,... 阅读全文
摘要:
决策树表示对象属性(比如贷款用户的年龄、是否有工作、是否有房产、信用评分等)和对象类别(是否批准其贷款申请)之间的一种映射。使用层层... 阅读全文
摘要:
机器学习的目的是预测(包括分类和回归)。 分类是根据输入数据,判别这些数据隶属于哪个类别。 回归则是根据输入数据,计算出一个输出值... 阅读全文