随笔分类 - Machine learning
机器学习算法实践及经验总结
摘要:作者: peghoty出处:http://blog.csdn.net/peghoty/article/details/9286905社区发现(Community Detection)算法用来发现网络中的社区结构,也可以看做是一种聚类算法。博客上看到一篇优秀的介绍社区发现的PPT,转载过来分享: ...
阅读全文
摘要:一、标准化(Z-Score),或者去除均值和方差缩放公式为:(X-mean)/std 计算时对每个属性/每列分别进行。将数据按期属性(按列进行)减去其均值,并除以其方差。得到的结果是,对于每个属性/每列来说所有数据都聚集在0附近,方差为1。实现时,有两种不同的方式:使用sklearn.preproc...
阅读全文
摘要:聚类分析就仅根据在数据中发现的描述对象及其关系的信息,将数据对象分组(簇)。其目标是,组内的对象相互之间是相似的,而不同组中的对象是不同的。组内相似性越大,组间差别越大,聚类就越好。 先介绍下聚类的不同类型,通常有以下几种: (1)层次的与划分的:如果允许簇具有子簇,则我们得到一个层次聚类。层次聚类
阅读全文