摘要: gecco爬虫 如果对gecco还没有了解可以参看一下gecco的github首页。gecco爬虫十分的简单易用,JD全部商品信息的抓取9个类就能搞定。 JD网站的分析 要抓取JD网站的全部商品信息,我们要先分析一下网站,京东网站可以大体分为三级,首页上通过分类跳转到商品列表页,商品列表页对每个商品 阅读全文
posted @ 2016-06-30 11:23 魔流剑 阅读(1694) 评论(0) 推荐(0) 编辑
摘要: 主要代码: 阅读全文
posted @ 2016-06-30 11:17 魔流剑 阅读(1155) 评论(0) 推荐(0) 编辑
摘要: 写在前面 最近看到Gecoo爬虫工具,感觉比较简单好用,所有写个DEMO测试一下,抓取网站 http://zj.zjol.com.cn/home.html,主要抓取新闻的标题和发布时间做为抓取测试对象。抓取HTML节点通过像Jquery选择器一样选择节点,非常方便,Gecco代码主要利用注解实现来实 阅读全文
posted @ 2016-06-30 11:15 魔流剑 阅读(1048) 评论(0) 推荐(0) 编辑