机器学习笔记15-----聚类
1.聚类的主要内容
决策树、随机森林、SVM等算法用于回归和分类问题,都是给定输入x,和对应的给定结果值y(有监督),通过训练得到模型y=f(x),通过模型得到y的预测值,比较预测值与真实值。
聚类(无监督)是对输入的(x1,x2,...xm),若x为n维,则该数据实际是m*n维的矩阵,当对m个数据进行处理,分别归到k个簇中,则数据会转换为m*k维矩阵,这就实现了降维。
2.聚类的定义
注意:当p=2时,就是欧式距离。
3.聚类的基本事项
k-means算法进行聚类,初值对聚类结果是有影响的,要注意初值的选取。
4.层次聚类方法
5.密度聚类