摘要: 目录 简介 常用规则 XPath使用方法(lxml.etree) 01 获取父节点 02 获取节点文本 03 属性多值匹配 04 多属性匹配 简介 XPath即为XML路径语言(XML Path Language),它是一种用来确定XML文档中某部分位置的语言。(来源于百度百科) 常用规则 符号含义 阅读全文
posted @ 2020-07-17 23:39 12218 阅读(52) 评论(0) 推荐(0) 编辑
摘要: 目录 简介 常用匹配规则 01 普通字符 02 元字符 03 限定符 04 特殊字符 05 修饰符 re库的部分方法 01 match 02 search 03 findall 04 compile 代码下载 简介 正则表达式,又称规则表达式。(英语:Regular Expression,在代码中常 阅读全文
posted @ 2020-07-17 16:58 12218 阅读(60) 评论(0) 推荐(0) 编辑
摘要: 目录 爬虫的概念 爬虫常用库 Requests库基础用法 01 安装 02 GET请求基本使用 (1) 基本操作 (2) 携带参数 (3) 添加请求头 03 POST请求基本使用 爬虫的概念 网络爬虫(又称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自 阅读全文
posted @ 2020-07-17 09:06 12218 阅读(72) 评论(0) 推荐(0) 编辑