摘要: 这篇博客源自对一个内存无法处理的词频统计问题的思考,最后给出的解决办法是自己想的,可以肯定这不是最好的解法。但是通过和同学的讨论,仍然感觉这是一个有意义及有意思的问题,所以和大家分享与探讨。如果有误,请大家指正。如果有更好的方法,望不吝赐教。1、提出问题实际问题:当前有10T中文关键词数据,需要统计... 阅读全文
posted @ 2015-01-04 22:17 Roly-Poly 阅读(2063) 评论(8) 推荐(3) 编辑