摘要: 1. Python3 使用urllib库请求网络 1.1 基于urllib库的GET请求 请求百度首页www.baidu.com ,不添加请求头信息: 输出显示百度首页的源码。但是有的网站进行了反爬虫设置,上述代码可能会返回一个40X之类的响应码,因为该网站识别出了是爬虫在访问网站,这时需要伪装一下 阅读全文
posted @ 2018-06-26 21:46 StrivePy 阅读(14649) 评论(0) 推荐(0) 编辑