随笔分类 -  spider

摘要:1、爬取ajax请求的数据(循环): 2、忽略证书问题: 3、proxy代理: 1) 自己创建build_opener对象,调用open方法: 2) 代理ip:防止自己的ip被封 : 4、cookies: 1)、使用自己登录的cookies: 2)、使用写代码登录的cookies: 3)、使用coo 阅读全文
posted @ 2019-01-23 18:09 fangsheng420 阅读(203) 评论(0) 推荐(0)
摘要:1、爬虫介绍: 2、第一个爬虫程序: 3、Request请求信息: 4、random中choice: 5、get请求之中文处理: 6、爬取贴吧: 7、post请求之登录: 阅读全文
posted @ 2019-01-23 17:30 fangsheng420 阅读(121) 评论(0) 推荐(0)