摘要: Hadoop例子——运行example中的wordCount例子一、 需求说明单词计数是最简单也是最能体现MapReduce思想的程序之一,可以称为 MapReduce版"Hello World",该程序的完整代码可以在Hadoop安装包的"src/examples"目录下找到。单词计数主要完成功能... 阅读全文
posted @ 2015-01-21 20:15 CherishFu 阅读(6212) 评论(0) 推荐(0) 编辑
摘要: Hadoop1.2.1安装——单节点方式和单机伪分布方式一、 需求部分在Linux上安装Hadoop之前,需要先安装两个程序:1)JDK 1.6(或更高版本)。Hadoop是用Java编写的程序,Hadoop的编译及MapReduce的运行都需要使用JDK。因此在安装Hadoop前,必须安装JDK ... 阅读全文
posted @ 2015-01-21 19:42 CherishFu 阅读(991) 评论(0) 推荐(0) 编辑
摘要: 问题:VMware虚拟机安装了ubuntu11.04,在使用apt-get安装软件时一直提示E:Unabletolocatepackage。 百度了原因,说是要更新源,使用命令:sudoapt-getupdate更新了,但更新之后问题还是存在; 解决方案:主要还是源的问题,目前网上找的很多源都... 阅读全文
posted @ 2014-12-29 20:18 CherishFu 阅读(4375) 评论(0) 推荐(0) 编辑
摘要: 前提条件:a. 确保VMware Network Adapter for VMnet8 处于启用状态,这个是NAT网络模式要用的虚拟网卡。注意这个网卡的IP地址,不需要做手动设置b. 确保 VMware DHCP Service 和VMware NAT Service 服务已经启动c. 确保把VMn... 阅读全文
posted @ 2014-12-29 14:52 CherishFu 阅读(675) 评论(0) 推荐(0) 编辑
摘要: 1.ubuntu11下安装.run文件首先右键单击这个文件,在properties-permissions那里选择允许以程序执行(打钩Allow executing file as program),然后在终端中进入这个文件所在的目录。然后执行命令sudo ./文件名.run即可。 阅读全文
posted @ 2014-11-26 11:21 CherishFu 阅读(214) 评论(0) 推荐(0) 编辑
摘要: 酒店评论情感分析系统(五)——【整合】基于机器学习的酒店评论文本倾向性分析本文主要是对之前的第三、四节所介绍的各分块进行整合。流程:对GUI界面输入的评论文本,先进行中文分词和去停用词,然后再按“环境,价格,卫生,服务”四个方面分类;同时通过调用LingPipe中的DynamicLMClassifi... 阅读全文
posted @ 2014-10-24 20:42 CherishFu 阅读(1276) 评论(0) 推荐(0) 编辑
摘要: 酒店评论情感分析系统(三)——将分词和去停用词后的评论文本基于“环境、卫生、价格、服务”分类思想:将进行了中文分词和去停用词之后得到的词或短语按序存在一个数组(iniArray)中,从中找出所有和“环境、卫生、价格、服务”四个方面相关的词或短语,并记录下其位置信息(sortRefNum)。然后按照位... 阅读全文
posted @ 2014-10-20 19:44 CherishFu 阅读(1265) 评论(1) 推荐(0) 编辑
摘要: 酒店评论情感分析系统(四)——基于机器学习(分类)的酒店评论倾向性分析 本项目通过调用LingPipe中的DynamicLMClassifier,对已标注的“中文情感挖掘酒店评论语料”库的学习,构造一个基本极性分析的分类器。然后用此分类器对GUI界面输入的评论文本进行基本极性分析(Positive... 阅读全文
posted @ 2014-10-17 16:05 CherishFu 阅读(1801) 评论(9) 推荐(1) 编辑
摘要: 酒店评论情感分析系统(四)——基于LingPipe的文本基本极性分析【demo】(Positive (favorable) vs. Negative (unfavorable))这篇文章为LingPipe官方网站对于Sentiment Ananlysis的学习所给出学习材料;http://alias... 阅读全文
posted @ 2014-10-15 20:40 CherishFu 阅读(1471) 评论(2) 推荐(0) 编辑
摘要: 酒店评论情感分析系统(四)——LingPipe在Eclipse中的运行 本来打算在做这个项目的时候,使用基于语义的文本倾向性分析方法,即先通过对评论文本进行中文分析,去停用词,然后在倾向性语义模式库的帮助下对抽取出来的形容词或短语逐一进行倾向性判断并赋予一个倾向值,最后将上述所有倾向值累加起来得到... 阅读全文
posted @ 2014-10-14 16:48 CherishFu 阅读(1623) 评论(3) 推荐(1) 编辑