2013年6月14日

互联网产品评论语料的观点挖掘

摘要: 前阵子看到淘宝、百度等出了一个新的产品,用户评论观点挖掘的具体的可看下面的图片刚好手头上也有一些类似的评论语料数据,于是自己也摸索出了一些方法下面简单的介绍介绍一、 数据需求相关网站产品评论数据以下数据是通过爬虫抓取的,数据的字段如下产品型号评论标题优点缺点总结二、 算法通过观测百度的那个产品,发现主要的做法就是产品特征+观点组成的,为止,首先要找出产品的特征词,然后再寻找搭配词,基本上就是这么一个过程,具体如下......2.1特征词挖掘 通过开源分词软件分别对评论标题、优点、缺点、总结进行分词,统计出每个词(不区分词性)的词频,记为WordBag,WordBag包括俩个字段,词+词频。.. 阅读全文

posted @ 2013-06-14 15:13 JueFan_C 阅读(1026) 评论(3) 推荐(0) 编辑

导航