会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
我见众生皆草木,唯你是青山
博客园
首页
新随笔
联系
订阅
管理
2019年10月30日
Kmeans算法
摘要: 1、概述 该方法属于无监督学习算法(无y值)。根据已有的数据,利用距离远近的思想将目标数据集聚为指定的k个簇。簇内样本越相似,聚类的效果越好。需要注意的是如若数据存在量纲上的差异,必须先进行标签化处理。或者数据集中含有离散型字符变量,需先设置成哑变量或进行数值化。对于未知簇个数的数据集,需要先确定簇
阅读全文
posted @ 2019-10-30 22:48 Jude_h
阅读(2208)
评论(0)
推荐(0)
编辑
公告