摘要: 推荐系统 协同 阅读全文
posted @ 2013-11-20 10:51 无脚的鸟 阅读(724) 评论(0) 推荐(0) 编辑
摘要: 这样写,会出现乱码。原因是文件时gbk格式的,BufferedReader br = new BufferedReader(new FileReader(indir)); BufferedWriter bw = new BufferedWriter(new FileWriter(outpath,true)); 所以可以这样改://用fileinputstream才能解决读写文件乱码问题.视文件是gbk还是utf32而更改下面对应的字符。BufferedReader br = new BufferedReader(new InputStreamReader(new F... 阅读全文
posted @ 2013-11-19 12:04 无脚的鸟 阅读(331) 评论(0) 推荐(0) 编辑
摘要: vsm,熵,tf-idf,余弦,lucene,相似性 阅读全文
posted @ 2013-11-17 20:11 无脚的鸟 阅读(1361) 评论(0) 推荐(0) 编辑
摘要: 共轭先验 阅读全文
posted @ 2013-11-14 16:37 无脚的鸟 阅读(2596) 评论(0) 推荐(0) 编辑
摘要: 来源:http://hi.baidu.com/vyfrcemnsnbgxyd/item/2f10ecc3fc35597dced4f88bDirichlet Process(DP)是一个很重要的统计模型,其可以看做是Dirichlet分布的一种在连续空间的推广过程。在统计学习中,DP尤其是其变形有很多 重要应用,是非参贝叶斯学习的重要方法。不过目前缺乏对于这样一个模型的入门级的介绍,本文将会介绍如何从Dirichlet分布演变到 Dirichlet Process,从而帮助大家更容易地踏入这个领域。其中也会有很多疏漏,请读者指正。另一篇关于Dirichlet Distribution的博文The 阅读全文
posted @ 2013-11-14 15:24 无脚的鸟 阅读(247) 评论(0) 推荐(0) 编辑
摘要: LDA DP 学习资料 阅读全文
posted @ 2013-11-14 15:16 无脚的鸟 阅读(624) 评论(0) 推荐(0) 编辑
摘要: DP HDP 阅读全文
posted @ 2013-11-14 15:12 无脚的鸟 阅读(1760) 评论(0) 推荐(0) 编辑
摘要: DP 随机过程 狄利克雷 阅读全文
posted @ 2013-11-14 15:04 无脚的鸟 阅读(1021) 评论(0) 推荐(0) 编辑
摘要: LDA 阅读全文
posted @ 2013-11-14 14:37 无脚的鸟 阅读(2069) 评论(0) 推荐(0) 编辑
摘要: hadoop 阅读全文
posted @ 2013-11-13 21:31 无脚的鸟 阅读(250) 评论(0) 推荐(0) 编辑