摘要: 一、xpath解析原理: 实例化一个etree的对象,且需要将被解析的页面源码数据加载到该对象中 调用etree对象中的xpath方法结合着xpath表达式实现标签的定位和内容的捕获 二、环境的安装: pip install lxml 三、如何实例化一个etree对象 from lxml.html 阅读全文
posted @ 2020-05-22 14:33 南啾 阅读(554) 评论(0) 推荐(0) 编辑
摘要: bs4数据解析的原理 实例化一个BeautifulSoup对象,并且将页面源码数据加载到该对象中 通过调用BeautifulSoup对象中相关的属性或者方法进行标签定位和数据提取 环境安装: pip install bs4 pip install lxml 如何实例化BeautifulSoup对象 阅读全文
posted @ 2020-05-22 12:59 南啾 阅读(235) 评论(0) 推荐(0) 编辑
摘要: import requests import re import os if __name__ == '__main__': # 创建一个文件夹,用来保存所有的图片 if not os.path.exists('./qiutuLibs'): os.mkdir('./qiutuLibs') url = 阅读全文
posted @ 2020-05-22 12:56 南啾 阅读(158) 评论(0) 推荐(0) 编辑
摘要: 数据解析分类 正则 bs4 xpath(重点) 数据解析原理概述: 解析的局部的文本内容都会在标签或者标签对应的属性中进行存储 进行指定标签的定位 对标签或者标签对应的属性中存储的数据进行提取(解析) 阅读全文
posted @ 2020-05-22 12:54 南啾 阅读(202) 评论(0) 推荐(0) 编辑