摘要: 思路: 使用搜狗搜索爬取微信文章时由于官方有反爬虫措施,不更换代理容易被封,所以使用更换代理的方法爬取微信文章,代理池使用的是GitHub上的开源项目,地址如下:https://github.com/jhao104/proxy_pool,代理池配置参考开源项目的配置。 步骤: 1)分析网页结构,拿到 阅读全文
posted @ 2018-03-15 18:21 希希里之海 阅读(1329) 评论(0) 推荐(0) 编辑