摘要: 前情摘要 一、web请求全过程剖析 我们浏览器在输入完网址到我们看到网页的整体内容, 这个过程中究竟发生了些什么? BS --> browser/server 我们看一下一个浏览器请求的全过程 接下来就是一个比较重要的事情了. 所有的数据都在页面源代码里么? 非也~ 这里要介绍一个新的概念 那就是页 阅读全文
posted @ 2023-10-09 09:58 生而自由爱而无畏 阅读(14) 评论(0) 推荐(0) 编辑
摘要: urllib与requests 一、urllib的学习 学习目标 了解urllib的基本使用 1、urllib介绍 除了requests模块可以发送请求之外, urllib模块也可以实现请求的发送,只是操作方法略有不同! urllib在python中分为urllib和urllib2,在python3 阅读全文
posted @ 2023-10-09 09:49 生而自由爱而无畏 阅读(42) 评论(0) 推荐(0) 编辑
摘要: 数据解析之XPATH 1、xpath安装与使用 安装 安装lxml库 pip install lxml -i pip源 2、解析流程与使用 解析流程 实例化一个etree的对象,把即将被解析的页面源码加载到该对象 调用该对象的xpath方法结合着不同形式的xpath表达进行标签定位和数据提取 使用 阅读全文
posted @ 2023-10-09 09:30 生而自由爱而无畏 阅读(33) 评论(0) 推荐(0) 编辑
摘要: 一、BeautifulSoup的简单使用 简单来说,Beautiful Soup是python的一个库,最主要的功能是从网页抓取数据。官方解释如下: Beautiful Soup提供一些简单的、python式的函数用来处理导航、搜索、修改分析树等功能。 它是一个工具箱,通过解析文档为用户提供需要抓取 阅读全文
posted @ 2023-10-09 09:13 生而自由爱而无畏 阅读(68) 评论(0) 推荐(0) 编辑