11 2018 档案

爬虫——为什么有代理
摘要:我们在做爬虫的过程中经常会遇到这样的情况,最初爬虫正常运行,正常抓取数据,一切看起来都是那么美好,然而一杯茶的功夫可能就会出现错误,比如403 Forbidden,这时候打开网页一看,可能会看到“您的IP访问频率太高”这样的提示。出现这种现象的原因是网站采取了一些反爬虫措施。比如,服务器会检测某个I 阅读全文

posted @ 2018-11-26 10:43 王大拿 阅读(386) 评论(0) 推荐(0) 编辑

re正则匹配城市名
摘要:匹配城市名称,只要第一次出现之后的数据 阅读全文

posted @ 2018-11-16 16:35 王大拿 阅读(1208) 评论(0) 推荐(0) 编辑

mac上遇到的坑
摘要:mac上有两个python版本 当我执行命令时提示 command not found 但是我已经安装了包了 但是由于有两个python版本 当前项目用的时python3所以需要使用pip3 来安装相应的包 才能正常执行命令 阅读全文

posted @ 2018-11-15 15:30 王大拿 阅读(209) 评论(0) 推荐(0) 编辑

导航