6.3日周四个人作业二每日总结
6.3日周四个人作业二每日总结
今日收获:学习爬虫知识
Python urllib
Python urllib 库用于操作网页 URL,并对网页的内容进行抓取处理。
本文主要介绍 Python3 的 urllib。
urllib 包 包含以下几个模块:
- urllib.request - 打开和读取 URL。
- urllib.error - 包含 urllib.request 抛出的异常。
- urllib.parse - 解析 URL。
- urllib.robotparser - 解析 robots.txt 文件。
遇到问题:因为没有设置headers爬取不出网页源码