摘要:
##1. selenium介绍 # 介绍: 1.selenium是一个web自动化测试用的框架. 程序员可以通过代码实现对浏览器的控制, 比如打开网页, 点 击网页中的元素, 实现鼠标滚动等操作. 2.它支持多款浏览器, 如谷歌浏览器, 火狐浏览器等等, 当然也支持无头浏览器. # 目的: 在爬取数 阅读全文
摘要:
目录 1. BeautifulSoup库介绍: 2. BeautifulSoup 使用步骤: 3. 选择器分类: 4. CSS选择器: 阅读全文
摘要:
##爬虫数据存入三大文件 import requests import json,csv from lxml import etree for i in range(1,10): if i == 1: url = 'http://www.lnzxzb.cn/gcjyxx/004001/subpage 阅读全文
摘要:
[TOC] 1. Xpath解析库介绍: 2. xpath语法 3. xpath代码演示 4. 豆瓣案例 阅读全文
摘要:
##1. 文件上传功能 #用的少 应用场景(可以当时上传文件) import requests # 定义上传文件数据, 键为file, 值为文件句柄 files = { 'file': open('favicon.ico', 'rb') } #指定网址,指定字段 r = requests.post( 阅读全文
摘要:
[TOC] 1. 第一次爬虫 2. 八大请求方式 3. 请求头简介 4. 反爬与反反爬 5. 常见的状态码 6. 响应头 7. 响应体 8. 网页基础 9. 爬虫工作流 10. 抓包技能操作认识 11. requests 模块请求 12. requests 模块基本使用 13. 代理 IP 阅读全文
摘要:
[TOC] 1. 安装虚拟环境 2. 爬虫概念 3. 爬虫分类 4. 协议模型 5. HTTP协议与HTTP S协议 6. TCP与UDP 协议 7. 服务器常见端口 8. 开发准备 阅读全文