2013年11月4日

nutch2.2.1+ hadoop1.2.1 + mysql5.6.13

摘要: 1、首先搭建好hadoop环境,具体过程不详细说了,网上的教程很多。2、下载nutch,在其目录下面运行ant,将会产生runtime目录。然后配置nutch-site.xml等文件,可以参考http://wiki.apache.org/nutch/NutchHadoopTutorial。注意的是runtime下面有一个local目录和一个deploy目录,一般博客写的都是在local目录下面运行的,这个是单机运行。而deploy目录下面运行是分布式运行。3、nutch连接数据库mysql。只是需要修改几个配置文件即可,还要注意编码问题。4、分布式下面运行nutch。是在deploy目录下面运 阅读全文

posted @ 2013-11-04 15:37 fengjiaoan 阅读(969) 评论(0) 推荐(0) 编辑

导航