2017年4月24日

我的Python之路:浏览器模拟

摘要: 一、浏览器模拟——Header属性 有的时候,我们无法爬取一些网页,也就是说会出现403错误,这是因为这些网页为了防止有人恶意去采集其信息所以进行了一些反爬虫的设置。 为了可以获取这些数据我们使用一些两种方法: 1、使用 build opener() 由于urlopen()不支持HTTP的高级运用所 阅读全文

posted @ 2017-04-24 23:18 回=眸一笑 阅读(139) 评论(0) 推荐(0) 编辑

导航