摘要: Python urllib Python urllib 库用于操作网页 URL,并对网页的内容进行抓取处理。 本文主要介绍 Python3 的 urllib。 urllib 包 包含以下几个模块: urllib.request - 打开和读取 URL。 urllib.error - 包含 urlli 阅读全文
posted @ 2021-12-14 19:21 巩云龙 阅读(31) 评论(0) 推荐(0) 编辑
摘要: 模拟头部信息 我们抓取网页一般需要对 headers(网页头信息)进行模拟,这时候需要使用到 urllib.request.Request 类: class urllib.request.Request(url, data=None, headers={}, origin_req_host=None 阅读全文
posted @ 2021-12-14 19:21 巩云龙 阅读(63) 评论(0) 推荐(0) 编辑
摘要: urllib.parse urllib.parse 用于解析 URL,格式如下: urllib.parse.urlparse(urlstring, scheme='', allow_fragments=True) urlstring 为 字符串的 url 地址,scheme 为协议类型, allow 阅读全文
posted @ 2021-12-14 19:21 巩云龙 阅读(48) 评论(0) 推荐(0) 编辑
摘要: Python3 面向对象 Python从设计之初就已经是一门面向对象的语言,正因为如此,在Python中创建一个类和对象是很容易的。本章节我们将详细介绍Python的面向对象编程。 如果你以前没有接触过面向对象的编程语言,那你可能需要先了解一些面向对象语言的一些基本特征,在头脑里头形成一个基本的面向 阅读全文
posted @ 2021-12-14 19:20 巩云龙 阅读(43) 评论(0) 推荐(0) 编辑