摘要: 学用python也有3个多月了,用得最多的还是各类爬虫脚本:写过抓代理本机验证的脚本,写过在discuz论坛中自动登录自动发贴的脚本,写过自动收邮件的脚本,写过简单的验证码识别的脚本,本来想写google music的抓取脚本的,结果有了强大的gmbox,也就不用写了。 这些脚本有一个共性,都是和w 阅读全文
posted @ 2017-05-24 18:58 御虫师 阅读(247) 评论(0) 推荐(0) 编辑
摘要: 在CMD命令行中,输入 “python” + “空格”,即 ”python “; 将已经写好的脚本文件拖拽到当前光标位置,然后敲回车运行即可 在CMD命令行中,输入 “python” + “空格”,即 ”python “; 将已经写好的脚本文件拖拽到当前光标位置,然后敲回车运行即可 在CMD命令行中 阅读全文
posted @ 2017-05-24 13:51 御虫师 阅读(349) 评论(0) 推荐(0) 编辑
摘要: 前言 方法1:设置等待时间 有一些网站的防范措施可能会因为你快速提交表单而把你当做机器人爬虫,比如说以非常人的速度下载图片,登录网站,爬取信息。 常见的设置等待时间有两种,一种是显性等待时间(强制停几秒),一种是隐性等待时间(看具体情况,比如根据元素加载完成需要时间而等待) 1.显性等待时间 而且尽 阅读全文
posted @ 2017-05-24 10:17 御虫师 阅读(5441) 评论(0) 推荐(0) 编辑