摘要: 造成问题的原因是处理的文本文档有2g大小。 解决方法: 对文件的内容进行hash,分解成多个小文件。 然后合并小文件里面重复的词。 再把小文件写到一个文件里面。 阅读全文
posted @ 2016-10-21 10:43 viola 阅读(1347) 评论(0) 推荐(0) 编辑