摘要: 爬虫入门总结 by 婉约在风里 核心:urllib模块中的request 方法,urlopen(打开链接),Request(模仿请求),在爬取网页之后记得.read()进行内容读取,后面也有header,报头模拟,解决403问题,利用正则表达式和compile().findall()方法进行制定内容 阅读全文
posted @ 2019-01-24 15:50 婉约在风里 阅读(136) 评论(0) 推荐(0) 编辑