[机器学习实战] 机器学习简介
1. 算法及解决问题介绍
算法选择:
如果想要预测目标变量的值,则可以选择监督学习算法, 否则可以选择无监督学习算法。确定选择监督学习算法之后,需要进一步确定目标变量类型,如 果目标变量是离散型,如是/否、1/2/3、A/B/C或者红/黄/黑等,则可以选择分类器算法;如果目 标变量是连续型的数值,如0.0~100.00、999~999或者+∞~∞等,则需要选择回归算法。
如果不想预测目标变量的值,则可以选择无监督学习算法。进一步分析是否需要将数据划分 为离散的组。如果这是唯一的需求,则使用聚类算法;如果还需要估计数据与每个分组的相似程 度,则需要使用密度估计算法。
2. 开发机器学习程序的基本步骤:
1)收集数据。
2)准备输入数据。保证格式相符。
3)分析输入数据。保证数据有效性。
4)训练算法。
3. 开发环境
1)python
2)Numpy函数库