LakeLight

一步一个脚印

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2013年7月8日

摘要: 一种全面的基于词典的观点挖掘方法 1,能处理上下文相关(Context Depend)的观点词 2,能处理一些能通过其语法模式(Linguistic Pattern)影响观点的特殊词(Words)、短语(Phrase)以及语言结构(Language Structure)。 3,提供了一个有效的函数能综合句子中多个互相冲突的观点词 本文只考虑判断句子的情感倾向(Sentiment Orienta... 阅读全文
posted @ 2013-07-08 14:54 LakeLight 阅读(831) 评论(1) 推荐(0) 编辑

2013年7月4日

摘要: 将文档看作一个整体,得到该文档的整体情感倾向,可以看作是对实体Entity的整体GENERAL方面Aspect进行情感分类。基本假设:文档只是一个观点持有者对一个实体进行的情感表达。此假设对于商品评论比较合适,但对于论坛、博客等不太适合。 有监督的情感分类方法: 情感分类可以简单的归于一个二分类问题:Positive 和 Negative。训练集和测试集可以用商品的评论数据,商品的评论一般有整... 阅读全文
posted @ 2013-07-04 11:32 LakeLight 阅读(571) 评论(0) 推荐(0) 编辑

2013年7月3日

摘要: 问题定义: 观点(Opinion):观点是一个四元组(g, s, h, t),其中:g是观点针对的目标,s为情感倾向,正向、负向、中立会一个表示情感强度的浮点数,h为观点所有者,t为观点发表的时间。 实体(Entity):实体可以是一个产品、服务、事件、主题、人或组织等。用一个二元组(T,W)表示,其中T为实体或实体的一个方面Aspect,W为T的属性。 观点(Opinion):(e, a,... 阅读全文
posted @ 2013-07-03 16:50 LakeLight 阅读(463) 评论(0) 推荐(0) 编辑

摘要: 从今天开始,阅读Bing Liu的Sentiment Analysis and Opinion Mining, Morgn & Claypool Publishers, May 2012. 为督促自己,记下学习笔记。 Sentiment Analysis and Opinion Mining(情感分析和观点挖掘)主要研究人们针对相关实体如:商品、服务、组织、个人、事件以及实体的相关属性的观点、... 阅读全文
posted @ 2013-07-03 16:06 LakeLight 阅读(496) 评论(0) 推荐(0) 编辑

2013年7月2日

摘要: Document是Lucene Core中的几个核心Package之一,也是最重要的一个实体对象。网民使用搜索引擎的目的就是为了找到相关的文档即Document。 Lucene中一个Document由多个Field组成,如一个文档可以有多个属性,如路径、标题、内容、修改时间、作者等,每个属性就是一个Field。相关UML图如下: Field是一个基类,实现了IndexableField接... 阅读全文
posted @ 2013-07-02 16:23 LakeLight 阅读(337) 评论(0) 推荐(0) 编辑

摘要: 在网上搜索了很多,也试用了一些,个人觉得最靠谱和最好使用的是ModelGoon,可惜被GFW了,自己想办法。 *ModelGoon是什么?它是一个Eclipse插件,用于基于UML图的模型设计,以及逆向工程(即从已有源代码生成类图等,以作为代码分析或者文档使用)。*适用条件ModelGoon目前最新的版本是3.0.0,适用于Eclipse3.4+,包括最新的Eclipse 3.6版本*如何安装推荐... 阅读全文
posted @ 2013-07-02 14:54 LakeLight 阅读(1183) 评论(0) 推荐(0) 编辑

摘要: Lucene是一个高性能的,可扩展的信息检索库,能让你轻松到在自己的应用中增加全文检索功能。简单的说,Lucene就是实现了搜索引擎功能的基础库。 Lucene是一个高性能的,可扩展的信息检索库,能让你轻松到在自己的应用中增加全文检索功能。简单的说,Lucene就是实现了搜索引擎功能的基础库。搜索引擎就一个功能,根据网名输入的Query,找到相关的文档。文档成千上万上亿,直接字符串匹配顺序查找... 阅读全文
posted @ 2013-07-02 14:22 LakeLight 阅读(832) 评论(0) 推荐(0) 编辑

摘要: 1,系统准备 安装ant和ivy,到官方下载apache-ant-1.9.1-bin和apache-ivy-2.3.0-bin,将ant的bin目录加入到环境变量PATH中,将ivy-2.3.0.jar拷贝到ant的lib目录下即可。 2,Checkout代码 使用SVN客户端,如TortoiseSVN,下载源码https://svn.apache.org/repos/asf/lucene/jav... 阅读全文
posted @ 2013-07-02 11:45 LakeLight 阅读(1496) 评论(0) 推荐(0) 编辑