2018 年 10月 9 日随笔档案 - 25班Ph201805201

2018年10月9日

潭州课堂25班：Ph201805201 爬虫高级第四课 sclapy 框架 crawispider类 (课堂笔记）

摘要：以上内容以 spider 类获取 start_urls 里面的网页在这里平时只写一个，是个入口，之后通过 xpath 生成 url，继续请求， crawispider 中多了个 rules rules 中的参数 link_extractor 用来定义需要提取的连接 allow=() 满足（）阅读全文

posted @ 2018-10-09 08:26 25班Ph201805201 阅读(170) 评论(0) 推荐(0) 编辑

gdwz922

公告