2011年10月3日
摘要: 概述:该项目分成4个模块:爬取模块、解析模块、索引模块、搜索模块。 功能:爬取智联招聘和前程无忧两个网站上的招聘信息,解析并保存,在本地建立索引,最后提供web界面和各种搜索功能。 技术:heritrix3.0 、 hbase-writer0.9 、 hbase0.9、hadoop0.20.2、HTMLParser2.0 、 lucene3.3 、 bobo-browse2.5 、struts2.2 、 freemarker2.3 、 jquery 阅读全文
posted @ 2011-10-03 15:33 歪步 阅读(2795) 评论(7) 推荐(3) 编辑