Fork me on GitHub
摘要: 2013-12-13 20:00:58 Yanjun K-means算法是很典型的基于距离的聚类算法,采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。该算法认为簇是由距离靠近的对象组成的,因此把得到紧凑且独立的簇作为最终目标。 对于聚类问题,我们事先并不知道给定的一个训练数据 阅读全文
posted @ 2016-10-28 20:43 stardsd 阅读(655) 评论(0) 推荐(0) 编辑
摘要: 聚类分析(英语:Cluster analysis,亦称为群集分析) K-means也是聚类算法中最简单的一种了,但是里面包含的思想却是不一般。最早我使用并实现这个算法是在学习韩爷爷那本数据挖掘的书中,那本书比较注重应用。看了Andrew Ng的这个讲义后才有些明白K-means后面包含的EM思想。 阅读全文
posted @ 2016-10-28 20:39 stardsd 阅读(434) 评论(0) 推荐(0) 编辑
摘要: http://ufldl.stanford.edu/tutorial/ 阅读全文
posted @ 2016-10-28 14:50 stardsd 阅读(256) 评论(0) 推荐(0) 编辑
摘要: 当使用学习算法时,一段更快的代码通常意味着项目进展更快。例如,如果你的学习算法需要花费20分钟运行完成,这意味着你每个小时能“尝试”3个新主意。但是假如你的程序需要20个小时来运行,这意味着你一天只能“尝试”一个新主意,因为你需要花费这么长时间来等待程序的反馈。对于后者,假如你可以提升代码的效率让其 阅读全文
posted @ 2016-10-28 14:49 stardsd 阅读(2110) 评论(0) 推荐(0) 编辑
摘要: 作者: 阮一峰 日期: 2012年4月 6日 作者: 阮一峰 日期: 2012年4月 6日 诞生50多年之后,函数式编程(functional programming)开始获得越来越多的关注。 不仅最古老的函数式语言Lisp重获青春,而且新的函数式语言 层出不穷,比如Erlang、clojure、S 阅读全文
posted @ 2016-10-28 14:43 stardsd 阅读(304) 评论(0) 推荐(0) 编辑