爬虫基础

获取网页

urllib

提取信息

正则表达式
lxml、XPath
Beautiful Soap（html、xml解析器）

保存数据

自动化程序

异常处理错误重试

代理

Ref.

python3 网络爬虫开发实战崔庆才
https://cuiqingcai.com/1052.html

posted @ 2019-09-14 19:41 youqia 阅读(116) 评论(0) 收藏举报

刷新页面返回顶部