摘要: 前情摘要 一、web请求全过程剖析 我们浏览器在输入完网址到我们看到网页的整体内容, 这个过程中究竟发生了些什么? 我们看一下一个浏览器请求的全过程 接下来就是一个比较重要的事情了. 所有的数据都在页面源代码里么? 非也~ 这里要介绍一个新的概念 那就是页面渲染数据的过程, 我们常见的页面渲染过程有 阅读全文
posted @ 2023-03-18 10:42 凫弥 阅读(64) 评论(0) 推荐(0) 编辑
摘要: xpath 1、xpath安装与使用 安装 安装lxml库 pip install lxml -i pip源 2、解析流程与使用 from lxml import etree # 解析本地HTML文件 # parser = etree.HTMLParser(encoding="utf-8") # t 阅读全文
posted @ 2023-03-18 10:21 凫弥 阅读(92) 评论(0) 推荐(0) 编辑
摘要: beautifulsoup 一、beautifulsoup的简单使用 简单来说,Beautiful Soup是python的一个库,最主要的功能是从网页抓取数据。官方解释如下: Beautiful Soup提供一些简单的、python式的函数用来处理导航、搜索、修改分析树等功能。 它是一个工具箱,通 阅读全文
posted @ 2023-03-18 10:14 凫弥 阅读(53) 评论(0) 推荐(0) 编辑
摘要: 一、正则基础 1 [] 原子表 [a] 匹配小写字母a [x] 匹配小写字母x [ab] 匹配小写字母a或b [abc] 匹配小写字母a或者b或者c [0123456789] 匹配任意一位数字 [0-9] 匹配任意一位数字 [a-z] 匹配任意一位小写字母 [A-Z] 匹配任意一位大写字母 [a-z 阅读全文
posted @ 2023-03-18 10:05 凫弥 阅读(39) 评论(0) 推荐(0) 编辑