nutch 安装配置
摘要:
之前接触过一些爬虫的东西,主要是编写脚本,爬取网页上想要的信息。最近了解了一个开源搜索引擎,这几天主要配置。遇到了一些问题。下面介绍一下安装的流程:1、安装cygwin,主要用于window下提供linux的环境。具体安装过程可以参考http://hi.baidu.com/www100/item/b79723f239cf9449932af29f。注意选择需要的工具包。2、cygwin中安装ssh,最好配置为不需要密码即可登陆。3、下载hadoop1.2.1,安装jdk,配置好环境变量。注意路径下有空格的时候,配置的时候要注意。可以参考http://blog.csdn.net/liu_jas.. 阅读全文
posted @ 2013-09-30 19:46 fengjiaoan 阅读(595) 评论(0) 推荐(0) 编辑