摘要: 在爬取某站时并做简单分析时,遇到如下问题和大家分享,避免犯错: 一丶网站的path为 /info/1013/13930.htm ,其中13930为不同新闻的 ID 值,但是这个数虽然为升序,但是没有任何规律的升序。 解决办法: 使用 range 顺序爬取,错误的网站在页面会报如图错误: 这时我们首先 阅读全文
posted @ 2020-02-27 13:27 riyir 阅读(4445) 评论(0) 推荐(0) 编辑