随笔分类 -  Machine learning

机器学习算法实践及经验总结
摘要:作者: peghoty出处:http://blog.csdn.net/peghoty/article/details/9286905社区发现(Community Detection)算法用来发现网络中的社区结构,也可以看做是一种聚类算法。博客上看到一篇优秀的介绍社区发现的PPT,转载过来分享: ... 阅读全文
posted @ 2016-01-20 09:44 whgiser 阅读(1230) 评论(0) 推荐(0) 编辑
摘要:一、标准化(Z-Score),或者去除均值和方差缩放公式为:(X-mean)/std 计算时对每个属性/每列分别进行。将数据按期属性(按列进行)减去其均值,并除以其方差。得到的结果是,对于每个属性/每列来说所有数据都聚集在0附近,方差为1。实现时,有两种不同的方式:使用sklearn.preproc... 阅读全文
posted @ 2015-06-01 11:03 whgiser 阅读(1160) 评论(0) 推荐(0) 编辑
摘要:聚类分析就仅根据在数据中发现的描述对象及其关系的信息,将数据对象分组(簇)。其目标是,组内的对象相互之间是相似的,而不同组中的对象是不同的。组内相似性越大,组间差别越大,聚类就越好。 先介绍下聚类的不同类型,通常有以下几种: (1)层次的与划分的:如果允许簇具有子簇,则我们得到一个层次聚类。层次聚类 阅读全文
posted @ 2015-04-05 21:25 whgiser 阅读(9171) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示