随笔分类 - 酒店评论情感分析系统
对酒店的评论进行文本倾向性分析,分析对酒店的评价(包括总评和细评,细评包括价格、卫生、服务、环境四个方面)是褒还是贬。
摘要:酒店评论情感分析系统(五)——【整合】基于机器学习的酒店评论文本倾向性分析本文主要是对之前的第三、四节所介绍的各分块进行整合。流程:对GUI界面输入的评论文本,先进行中文分词和去停用词,然后再按“环境,价格,卫生,服务”四个方面分类;同时通过调用LingPipe中的DynamicLMClassifi...
阅读全文
摘要:酒店评论情感分析系统(三)——将分词和去停用词后的评论文本基于“环境、卫生、价格、服务”分类思想:将进行了中文分词和去停用词之后得到的词或短语按序存在一个数组(iniArray)中,从中找出所有和“环境、卫生、价格、服务”四个方面相关的词或短语,并记录下其位置信息(sortRefNum)。然后按照位...
阅读全文
摘要:酒店评论情感分析系统(四)——基于机器学习(分类)的酒店评论倾向性分析 本项目通过调用LingPipe中的DynamicLMClassifier,对已标注的“中文情感挖掘酒店评论语料”库的学习,构造一个基本极性分析的分类器。然后用此分类器对GUI界面输入的评论文本进行基本极性分析(Positive...
阅读全文
摘要:酒店评论情感分析系统(四)——基于LingPipe的文本基本极性分析【demo】(Positive (favorable) vs. Negative (unfavorable))这篇文章为LingPipe官方网站对于Sentiment Ananlysis的学习所给出学习材料;http://alias...
阅读全文
摘要:酒店评论情感分析系统(四)——LingPipe在Eclipse中的运行 本来打算在做这个项目的时候,使用基于语义的文本倾向性分析方法,即先通过对评论文本进行中文分析,去停用词,然后在倾向性语义模式库的帮助下对抽取出来的形容词或短语逐一进行倾向性判断并赋予一个倾向值,最后将上述所有倾向值累加起来得到...
阅读全文
摘要:酒店评论情感分析系统——用ictclas4j进行中文分词,并去除停用词 ictclas4j是中科院计算所开发的中文分词工具ICTCLAS的Java版本,因其分词准确率较高,而备受青睐。 注:ictclas4j缺点: a.在eclipse里的java文件一定要保存为gbk编码才可以正常运...
阅读全文
摘要:酒店评论情感分析系统(二)——Nutch安装一、需求部分Nutch是Java开发的所以需要下载JavaJDK。 下载地址http://java.sun.com/javase/downloads/index.jsp 2. Nutch的演示搜索页面是Jsp的,需要Tomcat做服务器。 下载地...
阅读全文
摘要:酒店评论情感分析系统(一)——文本倾向性分析综述题目:对酒店的评论进行文本倾向性分析,分析对酒店的评价(包括总评和细评,细评包括价格、卫生、服务、环境四个方面)是褒还是贬。 在学《搜索引擎》这门课的时候,老师布置的一个小型project。本科的时候一直没接触过这块,所以现在只能是从一只菜鸟一步步慢...
阅读全文