大数据开发常用算法（转）

3.大数据开发常用算法

无论是机器学习，模式识别，数据挖掘，统计学习，计算机视觉，语音识别，自然语言处理都涉及到算法。

1.树：决策树（决策树）是在已知各种情况发生概率的基础上，通过构成决策树来求取净现值的期望值大于等于零的概率，评价项目风险，判断其可行性的决策分析方法，是直观运用概率分析的一种图解法。由于这种决策分支画成图形很像一棵树的枝干，故称决策树。在机器学习中，决策树是一个预测模型，他代表的对象属性与对象值之间的一种映射关系。熵=系统的凌乱程度，使用算法ID3，C4.5和C5.0生成树算法使用熵。这一度量是基于信息学理论中熵的概念。

基于R语言和SPSS的决策树算法介绍及应用：

http://www.docin.com/p-1363155713.html

机器学习从入门到放弃之决策树算法：

http://python.jobbole.com/85555/

算法杂货铺 - 分类算法之决策树（决策树）：https://www.cnblogs.com/leoo2sk/archive/2010/09/19/decision-tree.html

集体智慧编程-决策树建模（上）：

https://www.cnblogs.com/itdyb/p/5020370.html

集体智慧编程-决策树建模（下）：

https://www.cnblogs.com/itdyb/p/5022134.html

2.回归：在大部分机器学习课程中，回归算法都是介绍的第一个算法原因有两个：。一回归算法比较简单，介绍它可以让人平滑地从统计学迁移到机器学习中。二回归算法是后面若干强大算法的基石，如果不理解回归算法，无法学习那些强大的算法回归算法有两个重要的子类：。即线性回归和逻辑回归。

你应该掌握的七种回归技术：

https://www.csdn.net/article/2015-08-19/2825492

说说高斯过程回归：

https://blog.csdn.net/greenapple_shan/article/details/52402051

3.贝叶斯：贝叶斯定理用于投资，决策，分析是在已知相关项目乙的资料，而缺乏论证项目甲的直接资料时，通过对乙项目的有关状态及发生概率分析推导甲项目的状态及发生概率。贝叶斯公式（发表于1763年）为：P（H [i] / A）= P（H [i]）* P（A│H[i]）/ {P H [1]）* P（A│H[1]）+ P（H [2]）* P（A│H[2]）+ ... + P（H [n]）* P（A│H[ N]）}

算法杂货铺 - 分类算法之贝叶斯网络（贝叶斯网络）：

https://blog.csdn.net/davidni619/article/details/80606409

算法杂货铺 - 分类算法之朴素贝叶斯分类（朴素贝叶斯分类）：

https://blog.csdn.net/dunm_kgy314/article/details/17449055

多种贝叶斯模型构建及文本分类的实现：

https://cloud.tencent.com/developer/article/1058137

朴素贝叶斯分类之垃圾短信识别：

https://zhuanlan.zhihu.com/p/28059124

R语言与数据分析之三：分类算法1：

https://blog.csdn.net/howardge/article/details/41800091

4 svm：支持向量机算法是诞生于统计学习界，同时在机器学习界大放光彩的经典算法。

支持向量机：https://blog.csdn.net/github_38325884/article/details/74418365