Terry's blog

Focus on bigdata and cloud.

博客园 首页 新随笔 联系 订阅 管理

随笔分类 -  Nutch

摘要:Windows 环境下,Netbeans下导入Nutch1.2。 测试环境:  Nutch 1.2  Netbean7.4  Java 1.8.0_20 cygwin安装步骤: 1.安装:Cygwin •下载 Nutch1.2 (下载地址:http://archive.apac... 阅读全文
posted @ 2014-10-17 14:55 王晓成 阅读(910) 评论(0) 推荐(0) 编辑

摘要:读取nutch内容有如下两种方法:1 通过Nutch apiSegmentReader读取。publicContentreadSegment(StringsegPath,Stringurl){ Textkey=newText(url);Pathpath=newPath(segPath);Conten... 阅读全文
posted @ 2014-09-05 10:00 王晓成 阅读(1101) 评论(0) 推荐(0) 编辑

摘要:修改apache-tomcat-7.0.55\webapps\nutch-1.2下的cached.jsp将content = new String(bean.getContent(details))修改为content = new String(bean.getContent(details),"... 阅读全文
posted @ 2014-09-05 09:49 王晓成 阅读(325) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示