1-4 无监督学习(Unsupervised Learning)

无监督学习定义:

  1. 【无监督学习】中没有任何的标签或者是有相同的标签或者就是没标签。所以我们已知数据集,却不知如何处理,也未告知每个数据点是什么。别的都不知道,就是一个数据集。你能从数据中找到某种结构吗?
  2. 针对数据集,无监督学习就能判断出数据有两个不同的聚集簇。这是一个类,那是另一个类,二者不同。是的,无监督学习算法可能会把这些数据分成两个不同的簇。所以叫做【聚类算法clustering algorithm】
  3. 聚类只是无监督学习的一种

聚类应用:

  1. 谷歌新闻:把不同新闻分成不同类别
  2. 基因分类:输入一组不同个体,对其中的每个个体,你要分析出它们是否有一个特定的基因。
  3. 给社交网络朋友自动分组
  4. 顾客数据分类,划分到不同细分市场
  5. 天文数据分析
  6. 分离出一屋子人不同说话声(分离算法:[W,s,v] = svd((repmat(sum(x.*x,1),size(x,1),1).*x)*x');

6.说明:

研究人员花费了大量时间才最终实现这行代码。我不是说这个是简单的问题,但它证明
了,当你使用正确的编程环境,许多学习算法是相当短的程序。所以,这也是为什么在本课
中,我们打算使用 Octave 编程环境。Octave,是免费的开源软件,使用一个像 Octave 或 Matlab
的工具,许多学习算法变得只有几行代码就可实现。

 

posted @ 2019-05-15 15:56  晨光曦微  阅读(390)  评论(0编辑  收藏  举报