6.3日周四个人作业二每日总结

6.3日周四个人作业二每日总结

今日收获:学习爬虫知识

Python urllib

Python urllib 库用于操作网页 URL,并对网页的内容进行抓取处理。

本文主要介绍 Python3 的 urllib。

urllib 包 包含以下几个模块:

  • urllib.request - 打开和读取 URL。
  • urllib.error - 包含 urllib.request 抛出的异常。
  • urllib.parse - 解析 URL。
  • urllib.robotparser - 解析 robots.txt 文件。

遇到问题:因为没有设置headers爬取不出网页源码

 

posted on 2021-06-03 14:59  风中明月  阅读(28)  评论(0编辑  收藏  举报