摘要: Urllib库详解 什么是Urllib: Python内置的HTTP请求库 urllib.request 请求模块 urllib.error 异常处理模块 urllib.parse url 解析模块 urlopen url 传入url data 用于POST提交数据 timeout 设置最大响应接受 阅读全文
posted @ 2020-04-09 20:09 DengSchoo 阅读(169) 评论(0) 推荐(0) 编辑
摘要: 爬虫基本原理 爬虫定义: 请求 网站并 提取 数据的 自动化 程序 爬虫基本流程: 1. 发送请求:通过HTTP库向目标站点发起请求,即发送一个Request,请求可以包含额外的headers等信息,等待服务器响应。 2. 获取响应内容是:如果服务器能正常响应,会得到一个Response,Respo 阅读全文
posted @ 2020-04-09 18:03 DengSchoo 阅读(138) 评论(0) 推荐(0) 编辑
摘要: 图的遍历dfs和bfs 深度优先遍历图的主要思想就是: 首先以一个未被访问过的顶点作为起始顶点,沿当前顶点的边走到未访问过的顶点:当没有未访问过的顶点时,则回到上一个顶点,继续试探访问别的顶点,知道所以的顶点都被访问过。 对于深度优先遍历图来说: 就是沿着一个分支走到底,发现无顶点可访问,则回溯一个 阅读全文
posted @ 2020-04-09 10:34 DengSchoo 阅读(216) 评论(0) 推荐(0) 编辑