《机器学习》第一周 Introduction | 监督学习与非监督学习的基本概念

课程视频地址：https://www.coursera.org/learn/machine-learning/lecture/1VkCb/supervised-learning

Supervised Learning 监督学习

监督学习：给出一个算法，需要部分数据集已经有正确答案。比如给出给定房价数据集，对于里面每个数据，算法都能计算出对应的正确房价。算法的结果就是短处更多的正确价格。

像房价预测问题这样的监督学习又叫回归学习（一般是监督学习的一种）。

Supervised Learning：“right and answers given”

监督学习：给出训练集

Regression Learning：Predict continuous valued output（eg：price）

回归学习：预测输出是连续值，比如说价格。

Classification： Discrete value output ( 0 or 1 )

分类问题：离散值输出，有时可以不止两个特征，甚至无穷个特征。

答案是C。

　　在无监督学习中，我们用到的数据和监督学习中的不一样。在无监督学习中，没有属性或者说标签的概念，只有一个数据集。

　　对于给定的数据集，无监督学习算法通过数据中存在的内在结构可能判定，该数据集包含几个不同的聚类，然后把数据分到这几个聚类中。这就是聚类算法（clustering algorithm）。聚类算法的实际用例有谷歌新闻每天搜索成千上万条新闻，然后把同一个事件的新闻报道聚集在一起。

　　历史上，由于聚类问题和无监督学习关联更紧密，所以时常将两者概念混在一起。但事实上，无监督学习还有另一种算法——关联规则挖掘。实例如鸡尾酒宴问题。关联规则挖掘也是无监督学习。

posted @ 2016-10-09 15:52 danscarlett 阅读(937) 评论(1) 收藏举报

刷新页面返回顶部