摘要: Requests的使用 requests的常用七大方法 创建一个请求,是支撑其他方法的基础。 获取网页的主要方法,对应于HTPP的GET 获取网页的头信息。对应HTTP的HEAD 向HTML网页提交Post请求的方法。对应于HTPP的POST 向HTML网页提交PUT请求的方法。对应于HTTP的PU 阅读全文
posted @ 2018-07-06 23:21 まだまだだわ 阅读(170) 评论(0) 推荐(0) 编辑
摘要: The WebSite is the api... 以下5个步骤逐步加深 Requests 实现自动爬去网络页面,自动网络请求提交。 Robots协议 仔细阅读每个平台的robots协议,了解那些爬虫是被拒绝的。 BeautifulSoup 解析获得的每个HTML页面。 RE 正则表达式详情,提取每 阅读全文
posted @ 2018-07-06 18:14 まだまだだわ 阅读(1749) 评论(0) 推荐(0) 编辑
摘要: Python中的文件操作 文件的类型 文件是存储在辅助存储器在数据序列,文件是数据存储的一种形式。形式上所有文件都在采用二进制或者文本文件形式来表示的。 文本文件 二进制文件 文件的打开与关闭 常见的打开方式有 关闭使用的方法 文件的读出 读出全部内容,如果给出参数就读出size长度。 读入一行数据 阅读全文
posted @ 2018-07-06 18:03 まだまだだわ 阅读(166) 评论(0) 推荐(0) 编辑
摘要: Python中的序列类型使用 元组类型 一旦被创建,就无法被修改。 创建 使用()或者tuple()创建 列表类型 列表类型是一种可以被随意修改的序列类型 创建 使用[]或者list()来创建,元素间采用,来分割。 序列类型的操作符 x in s 如果x是s中的元素,返回true,否则返回false 阅读全文
posted @ 2018-07-06 17:03 まだまだだわ 阅读(570) 评论(0) 推荐(0) 编辑
摘要: Python字典类型 字典是一种键值对的集合,键值对之间无序 字典类型的定义 采用{}或者dict()来创建字典对象,键值对之间使用:进行分隔。 字典类型的操作符 通过=来对字典对象中键值对进行赋值。 del d[k] 删除字典d中键k对应的数据值。 k in d 判断键k是否在字典d中。 处理字典 阅读全文
posted @ 2018-07-06 11:38 まだまだだわ 阅读(242) 评论(0) 推荐(0) 编辑