摘要: ## 阅读全文
posted @ 2021-05-04 17:23 SRE运维充电站 阅读(267) 评论(0) 推荐(0) 编辑
摘要: 一、需求分析 需求 :解析出所有城市的名称 :https://www.aqistudy.cn/historydata/ 分析 : 1、查看热门城市列表 2、全部城市列表 二、解析所有城市名称编码 编码 import requests from lxml import etree if __name_ 阅读全文
posted @ 2021-05-04 16:49 SRE运维充电站 阅读(103) 评论(0) 推荐(0) 编辑
摘要: 一、需求分析 需求 :解析下载图片数据,https://pic.netbian.com/4kmeinv/ 分析 : 首先打开 4k 地址 ,定位到某一张图片的,可以查看到图片的src属性值,用作后续数据解析; 二、4k图片解析下载编码 编码 #!/usr/bin/python #需求:解析下载图片数 阅读全文
posted @ 2021-05-04 14:11 SRE运维充电站 阅读(198) 评论(0) 推荐(0) 编辑
摘要: 一、需求分析 需求 :使用xpath数据解析爬取58二手房房源信息; 分析 : 1、首先打开58二手房的详情页面,https://ts.58.com/ershoufang/ 2、打开开发者工具定位其中一个房源信息 二、58二手房编码 编码 # 1、导入模块 import requests from 阅读全文
posted @ 2021-05-04 14:00 SRE运维充电站 阅读(232) 评论(0) 推荐(0) 编辑
摘要: 一、Xpath 1.1、Xpath介绍 XPath是一门在 XML 文档中查找信息的语言。XPath 用于在 XML 文档中通过元素和属性进行导航。 XML是和HTML格式类似的标记语言。拥有标签,节点等元素。但是HTML会被浏览器识别,并根据标签的含义生成对应的样式。xml则不会被识别,且他的标签 阅读全文
posted @ 2021-05-04 11:20 SRE运维充电站 阅读(218) 评论(0) 推荐(0) 编辑
摘要: Ps :参考博文 https://blog.csdn.net/qq_38330148/article/details/114004478?spm=1001.2014.3001.5501 一、需求分析 需求: 使用bs4库进行实战,对诗词名句网的红楼梦小说文本内容进行爬取,包括每一章的标题和内容,并将 阅读全文
posted @ 2021-05-04 10:44 SRE运维充电站 阅读(670) 评论(0) 推荐(0) 编辑
摘要: 一、BeautifulSoup库 Beautiful Soup 提供一些简单的、python 式的函数用来处理导航、搜索、修改分析树等功能。它是一个工具箱,通过解析文档为用户提供需要抓取的数据,因为简单,所以不需要多少代码就可以写出一个完整的应用程序。 Beautiful Soup 自动将输入文档转 阅读全文
posted @ 2021-05-04 10:13 SRE运维充电站 阅读(125) 评论(0) 推荐(0) 编辑