2016 年 8月 30 日随笔档案 - 罗兵

摘要：说明：本文参照了 "官网" 的 dmoz 爬虫例子。不过这个例子有些年头了，而 dmoz.org 的网页结构已经不同以前。所以我对也相应地进行了修改。概要：本文提出了scrapy 的三个入门应用场景 1. 爬取单页 2. 根据目录页面，爬取所有指向的页面 3. 爬取第一页，然后根据阅读全文

posted @ 2016-08-30 12:13 罗兵阅读(3081) 评论(0) 推荐(1) 编辑