05 2013 档案

基于hadoop+nutch+solr的搜索引擎环境搭载<三>hadoop,nutch,solr整合到eclipse上开发
摘要:版本: eclipse: eclipse-jee-juno-SR2-linux-gtk tomcat7: apache-tomcat-7.0.39一,下载安装eclipse,tomcat 下载安装eclipse后,解压,运行eclipse 在菜单栏里 window->preferences->server->runtime environment add tomcat7二,集成hadoop。 hadoop之前的版本有集成好的eclipse插件,现在需要自己编译,具体步骤可以百度。 这里是我用的插件。 将hadoop-eclipse-p... 阅读全文

posted @ 2013-05-07 21:57 sleeper_qp 阅读(2608) 评论(1) 推荐(1) 编辑

基于hadoop+nutch+solr的搜索引擎环境搭载<二>nutch+solr整合以及搭载在hadoop上
摘要:官方文档:nutch+hadoop nutch+solr 版本: nutch:nutch1.6 solr: solr3.6.2 可以参照hadoop1.0.4+nutch1.6“单机”配置 一,ant编译nutch 下载apache-nutch-1.6-src.tar.gz,解压之。 在nutch1.6/conf下先修改 nutch-default.xml中http.agent.name和http.robots.agents,value值随意,但是要保持一致<name>http.agent.name</name> <value>sleeper_qp</ 阅读全文

posted @ 2013-05-06 15:43 sleeper_qp 阅读(3012) 评论(0) 推荐(1) 编辑

基于hadoop+nutch+solr的搜索引擎环境搭载<一>hadoop完全分布式环境搭建
摘要:hadoop完全分布式环境搭建还算那句话:能看官方文档就尽量看官方文档 hadoop1.0.4完全分布式官方文档先扯点题外话,这个项目是我的比赛项目,可能比较简陋,主要还是想学习关于hadoop和搜索引擎方面的一些知识。这一两个月看了<hadoop实战>,<hadoop权威指南><信息检索导论>等一些书吧,初步了解了一下hadoop和搜索引擎。马上项目就要上交了,所以昨天把两个月的心血给删了,重新来一遍,重装系统,复习一遍之前的吧。好了,正文开始了。环境版本:ubuntu:ubuntu 12.0.4 32bithadoop:hadoop1.0.4jdk:jd 阅读全文

posted @ 2013-05-05 13:54 sleeper_qp 阅读(2925) 评论(0) 推荐(0) 编辑

导航

< 2025年2月 >
26 27 28 29 30 31 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 1
2 3 4 5 6 7 8
点击右上角即可分享
微信分享提示