[机器学习实战] 机器学习简介

1. 算法及解决问题介绍

算法选择:

    如果想要预测目标变量的值,则可以选择监督学习算法, 否则可以选择无监督学习算法。确定选择监督学习算法之后,需要进一步确定目标变量类型,如 果目标变量是离散型,如是/否、1/2/3、A/B/C或者红/黄/黑等,则可以选择分类器算法;如果目 标变量是连续型的数值,如0.0~100.00、999~999或者+∞~∞等,则需要选择回归算法。

    如果不想预测目标变量的值,则可以选择无监督学习算法。进一步分析是否需要将数据划分 为离散的组。如果这是唯一的需求,则使用聚类算法;如果还需要估计数据与每个分组的相似程 度,则需要使用密度估计算法。

2. 开发机器学习程序的基本步骤:

  1)收集数据。

  2)准备输入数据。保证格式相符。

  3)分析输入数据。保证数据有效性。

  4)训练算法。

3. 开发环境

  1)python

  2)Numpy函数库

 

posted on 2017-07-17 18:34  霏霏暮雨  阅读(218)  评论(0编辑  收藏  举报

导航