摘要: 目录 第1天: 了解爬虫与HTML 第2天: HTML标签与正则表达式 第3天: re模块与requests模块 第4天: 破解反爬虫方法1 第5天: 数据加载方式与实例操作 第6天: 爬虫解析库之bs4模块 第7天: 数据爬取实例演练 第8天: openpyxl模块 第8天: 梨视频多页视频数据爬 阅读全文
posted @ 2021-10-07 21:33 wddwyw 阅读(136) 评论(0) 推荐(0) 编辑
摘要: 0927(周一)内容概要 解析库之Xpath解析器 实战案例之爬取猪八戒数据 0927内容详细 解析库之Xpath解析器 # 效率很高 使用广泛 """ 该选择器可以做到一句话完成多步操作 """ # 1.导入xpath所在模块 from lxml import etree # 2.将待匹配的文本传 阅读全文
posted @ 2021-10-07 21:29 wddwyw 阅读(29) 评论(0) 推荐(0) 编辑
摘要: 百度自动登录 找到登录按钮 from selenium import webdriver import time # 1.使用谷歌浏览器访问百度首页 bro = webdriver.Chrome() bro.get('https://www.baidu.com/') # 2.查找页面上的登录按钮 l 阅读全文
posted @ 2021-10-07 21:29 wddwyw 阅读(44) 评论(0) 推荐(0) 编辑