2019 年 10月 30 日随笔档案 - Jude_h

2019年10月30日

摘要： 1、概述该方法属于无监督学习算法（无y值）。根据已有的数据，利用距离远近的思想将目标数据集聚为指定的k个簇。簇内样本越相似，聚类的效果越好。需要注意的是如若数据存在量纲上的差异，必须先进行标签化处理。或者数据集中含有离散型字符变量，需先设置成哑变量或进行数值化。对于未知簇个数的数据集，需要先确定簇阅读全文

posted @ 2019-10-30 22:48 Jude_h 阅读(2208) 评论(0) 推荐(0) 编辑

公告