摘要: 1* 最固执的,是一个人的心。 你可以说服所有人,却说服不了自己的心。 你说你要放弃,你说你要忘记, 你说你过得很好,你总是笑颜如花, 连别人都觉得你是真的很开心, 那么你的心呢? 是真的快乐吗? 呵呵 没事,自己懂就好。 你很快乐,不是吗? 2* 好听的话谁都会说, 可是说完之后谁又记得, 谁说谁一直都在, 谁说谁不会离开, 可是现在呢? 谁在你身边说着不离? 你又在谁的身边说着不弃? 诺言之类只有听的人才会记得。 蒲色号一七一一三一五零五零 3* 这个世界上, 有喜欢你的人, 自然也有不喜欢你的人。 可是呢?有多少人在纠结着自己。 爱你... 阅读全文
posted @ 2012-06-08 12:58 跳刀的兔子 阅读(434) 评论(0) 推荐(0) 编辑
摘要: 第九章聚类算法9.1 K-means聚类 K-means需要用户设定一个聚类个数(k)作为输入数据,有时k值可能非常大(10,000),这是Mahout闪光的(shines)地方,它确保聚类的可测量性。 为了用k-means达到高质量的聚类,需要估计一个k值。估计k值一种近似的方法是根据你需要的聚类个数。比如100万篇文章,如果平均500篇分为一类,k值可以取2000(1000000/500)。这种估计聚类个数非常模糊,但k-means算法就是生成这种近似的聚类。9.1.1 All you need to know about k-means 下面看一下k-means算法的细节,K-me... 阅读全文
posted @ 2012-06-08 12:43 跳刀的兔子 阅读(3311) 评论(0) 推荐(0) 编辑
摘要: 第八章 数据准备8.1.2 准备Mahout使用的vector 所有的Vectors都以SequenceFile格式写入,并且被Mahout算法读入。SequenceFile是Hadoop类库按key-value对编码的一种格式。Keys实现WritableComparable,values实现Writable.这两个接口相当于Java的Comparable和Serializable接口。 下面这个例子把Vector的名字或者描述作为key,vector本身作为value。Mahout的Vector类不能实现Writable接口,避免直接与Hadoop挂钩。但是,可以采用VectorWri.. 阅读全文
posted @ 2012-06-08 11:54 跳刀的兔子 阅读(1263) 评论(0) 推荐(0) 编辑