摘要: 以上内容以 spider 类 获取 start_urls 里面的网页 在这里平时只写一个,是个入口,之后 通过 xpath 生成 url,继续请求, crawispider 中 多了个 rules rules 中的参数 link_extractor 用来定义需要提取的连接 allow=() 满足() 阅读全文
posted @ 2018-10-09 08:26 25班Ph201805201 阅读(170) 评论(0) 推荐(0) 编辑