数据挖掘的一些经典算法

数据挖掘能做以下七种不同事情
(分析方法):

数据挖掘能做以下七种不同事情

· 分类 (Classification)
· 估计(Estimation)
· 预测(Prediction)
· 相关性分组或关联规则(Affinity grouping or association rules)
· 聚类(Clustering)
· 描述和可视化(Description and Visualization)
· 复杂数据类型挖掘(Text, Web ,图形图像,视频,音频等)
 
经典算法
 
1. C4.5:是机器学习算法中的一种分类决策树算法,其核心算法是ID3算法。
2. K-means算法:是一种聚类算法。
3. SVM:一种监督式学习的方法,广泛运用于统计分类以及回归分析中
4. Apriori :是一种最有影响的挖掘布尔关联规则频繁项集的算法。
5. EM:最大期望值法。
6. Pagerank:是google算法的重要内容。
7. Adaboost:是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器然后把弱分类器集合起来,构成一个更强的最终分类器。
8. KNN:是一个理论上比较成熟的的方法,也是最简单的机器学习方法之一。
9. Naive Bayes:在众多分类方法中,应用最广泛的有决策树模型和朴素贝叶斯(Naive Bayes)
10.Cart:分类与回归树,在分类树下面有两个关键的思想,第一个是关于递归地划分自变量空间的想法,第二个是用验证数据进行减枝。
 
posted @ 2013-03-24 20:10  盖文  阅读(139)  评论(0编辑  收藏  举报