Mengdong的技术博客

学习,记录,分享

导航

2011年7月18日 #

《Data-intensive Text Processing with MapReduce》读书笔记第3章:MapReduce算法设计(3)

摘要: 本读书笔记的目录地址:http://www.cnblogs.com/mdyang/archive/2011/06/29/data-intensive-text-prcessing-with-mapreduce-contents.html3.3 计算相对频度(relative frequency,频率)改进共现矩阵:使用相对频度回顾上一节的内容,对于n×n的共现矩阵(co-orrurancematrix)m,mij的值是单词wi与wj在指定上下文范围内共现(co-orrurance)的次数。考虑现实中的一种情况:有的单词在本文中出现的次数远远多于其他单词(例如the)就会发现,使用这种 阅读全文

posted @ 2011-07-18 11:37 mdyang 阅读(1089) 评论(0) 推荐(1) 编辑