摘要: 因为词云有利于体现文本信息,所以我就将那天无聊时爬取的《悲伤逆流成河》的评论处理了一下,生成了词云。 关于爬取影评的爬虫大概长这个样子(实际上是没有爬完的): 在获取到文本之后我们就可以开始下面的工作了。 先说一下总体流程: 获取文本-->对文本进行处理,分词(将完整的句子分割成一个一个的词语)-- 阅读全文
posted @ 2018-10-22 18:51 宋讼颂 阅读(4438) 评论(1) 推荐(3) 编辑