2020 年 5月 22 日随笔档案 - 南啾

2020年5月22日

摘要：一、xpath解析原理：实例化一个etree的对象，且需要将被解析的页面源码数据加载到该对象中调用etree对象中的xpath方法结合着xpath表达式实现标签的定位和内容的捕获二、环境的安装： pip install lxml 三、如何实例化一个etree对象 from lxml.html 阅读全文

posted @ 2020-05-22 14:33 南啾阅读(554) 评论(0) 推荐(0) 编辑

bs4使用与实战

摘要： bs4数据解析的原理实例化一个BeautifulSoup对象，并且将页面源码数据加载到该对象中通过调用BeautifulSoup对象中相关的属性或者方法进行标签定位和数据提取环境安装： pip install bs4 pip install lxml 如何实例化BeautifulSoup对象阅读全文

posted @ 2020-05-22 12:59 南啾阅读(235) 评论(0) 推荐(0) 编辑

正则解析

摘要： import requests import re import os if __name__ == '__main__': # 创建一个文件夹，用来保存所有的图片 if not os.path.exists('./qiutuLibs'): os.mkdir('./qiutuLibs') url = 阅读全文

posted @ 2020-05-22 12:56 南啾阅读(158) 评论(0) 推荐(0) 编辑

数据解析分类、原理

摘要：数据解析分类正则 bs4 xpath（重点）数据解析原理概述：解析的局部的文本内容都会在标签或者标签对应的属性中进行存储进行指定标签的定位对标签或者标签对应的属性中存储的数据进行提取（解析）阅读全文

posted @ 2020-05-22 12:54 南啾阅读(202) 评论(0) 推荐(0) 编辑

南啾

公告