摘要:
概述:该项目分成4个模块:爬取模块、解析模块、索引模块、搜索模块。
功能:爬取智联招聘和前程无忧两个网站上的招聘信息,解析并保存,在本地建立索引,最后提供web界面和各种搜索功能。
技术:heritrix3.0 、 hbase-writer0.9 、 hbase0.9、hadoop0.20.2、HTMLParser2.0 、 lucene3.3 、 bobo-browse2.5 、struts2.2 、 freemarker2.3 、 jquery 阅读全文
![](/skins/gray/images/separator.gif)