摘要: 重点推荐这种解析方式,xpath是最常用且最便捷高效的一种解析方式,通用性 1、解析原理 1、实例化一个etree的对象,且需要将被解析的页面源码数据加载到改对象中。 2、调用etree对象中的xpath方法结合表达式实现标签的定位和内容的捕获 2、环境的安装 1、pip install lxml 阅读全文
posted @ 2020-06-25 22:54 等风者 阅读(176) 评论(0) 推荐(0) 编辑
摘要: 1、bs4进行数据解析 数据解析的原理 1、标签定位 2、提取标签,标签属性中存储的数据值 bs4数据解析的原理 1、实例化一个BeautifulSoup对象,并且将页面源码数据加载到该对象中 2、通过调用BeautifulSoup对象中相关的属性或者方法进行标签的定位和数据的提取 2、环境安装 - 阅读全文
posted @ 2020-06-25 21:50 等风者 阅读(575) 评论(0) 推荐(0) 编辑
摘要: 1、今日学习提纲 聚焦爬虫、正则、bs4、xpath 2、聚焦爬虫:爬取页面中指定的页面内容 --编码流程: --指定url -- 发起请求 --获取响应数据 --数据解析 --持久化存储 3、数据解析分类 --正则 --bs4 --xpath(***** 通用性最强) 4、数据解析原理概述 解析的 阅读全文
posted @ 2020-06-25 13:19 等风者 阅读(199) 评论(0) 推荐(0) 编辑