java网络爬虫爬虫小栗子

简要介绍:

  使用java开发的爬虫小栗子,存储到由zookeeper协调的hbase中

  主要过程是模拟Post请求和get请求,html解析,hbase存储

  源码:https://github.com/husky00/worm/tree/master/ViewNoticeContent

  注:maven 3.3.9 构建的项目,内附较为详细的开发和使用说明,请勿用作不和谐用途!

posted @ 2017-01-20 14:52  时光舟  阅读(206)  评论(0编辑  收藏  举报