摘要: 需求: 需要采集js渲染的页面,有些网站的页面是js渲染的 实现: 基于HtmlUnit实现: maven依赖: 说明: Nutch插件:nutch-htmlunit用于替换Nutch自身的Http Fetch组件 阅读全文
posted @ 2017-05-22 17:11 疯子110 阅读(6250) 评论(1) 推荐(0) 编辑