07 2016 档案

摘要:官方有详细的使用文档:http://webmagic.io/docs/zh/ 简介:这只是个java爬虫框架,具体使用需要个人去定制,没有图片验证,不能获取js渲染的网页,但简单易用,可以通过xpath和css选择符获取网页内容,官方也有超详细的文档,适合爬取简单的网页和新手学习爬虫。图片验证和js 阅读全文
posted @ 2016-07-09 21:49 渚之汐酱 阅读(300) 评论(0) 推荐(0) 编辑