2021 年 10月 7 日随笔档案 - wddwyw

2021年10月7日

摘要：目录第1天：了解爬虫与HTML 第2天： HTML标签与正则表达式第3天： re模块与requests模块第4天：破解反爬虫方法1 第5天：数据加载方式与实例操作第6天：爬虫解析库之bs4模块第7天：数据爬取实例演练第8天： openpyxl模块第8天：梨视频多页视频数据爬阅读全文

posted @ 2021-10-07 21:33 wddwyw 阅读(136) 评论(0) 推荐(0) 编辑

网页爬取之百度、京东、知乎

摘要：百度自动登录找到登录按钮 from selenium import webdriver import time # 1.使用谷歌浏览器访问百度首页 bro = webdriver.Chrome() bro.get('https://www.baidu.com/') # 2.查找页面上的登录按钮 l 阅读全文

posted @ 2021-10-07 21:29 wddwyw 阅读(45) 评论(0) 推荐(0) 编辑

一周总结

摘要： 0927（周一）内容概要解析库之Xpath解析器实战案例之爬取猪八戒数据 0927内容详细解析库之Xpath解析器 # 效率很高使用广泛 """ 该选择器可以做到一句话完成多步操作 """ # 1.导入xpath所在模块 from lxml import etree # 2.将待匹配的文本传阅读全文

posted @ 2021-10-07 21:29 wddwyw 阅读(30) 评论(0) 推荐(0) 编辑

wddwyw

公告