文章分类 -  Nutch

nutch 链接
摘要:http://www.cnblogs.com/xia520pi/category/370858.html 阅读全文

posted @ 2016-03-22 22:24 1130136248 阅读(62) 评论(0) 推荐(0) 编辑

Nutch搜索引擎(第1期)_ Nutch简介及安装
摘要:Nutch是一个由Java实现的,开放源代码(open-source)的web搜索引擎。主要用于收集网页数据,然后对其进行分析,建立索引,以提供相应的接口来对其网页数据进行查询的一套工具。其底层使用了Hadoop来做分布式计算与存储,索引使用了Solr分布式索引框架来做,Solr是一个开源的全文索引 阅读全文

posted @ 2016-03-22 22:23 1130136248 阅读(174) 评论(0) 推荐(0) 编辑

Nutch教程——导入Nutch工程,执行完整爬取 by 逼格DATA
摘要:在使用本教程之前,需要满足条件: 1)有一台Linux或Linux虚拟机 2)安装JDK(推荐1.7) 3)安装Apache Ant 推荐使用Nutch 1.9,官方下载地址:http://mirrors.hust.edu.cn/apache/nutch/1.9/apache-nutch-1.9-s 阅读全文

posted @ 2016-03-22 22:17 1130136248 阅读(220) 评论(0) 推荐(0) 编辑

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

导航

统计

点击右上角即可分享
微信分享提示