随笔分类 -  爬虫

摘要:爬虫问题:requests的content和text 阅读全文
posted @ 2022-10-07 09:52 萌狼蓝天 阅读(242) 评论(0) 推荐(0) 编辑
摘要:使用XPath的爬虫小案例 阅读全文
posted @ 2022-10-06 17:59 萌狼蓝天 阅读(59) 评论(0) 推荐(0) 编辑
摘要:调试输出存在数据,print在控制台确丢失数据 阅读全文
posted @ 2022-09-28 22:03 萌狼蓝天 阅读(54) 评论(0) 推荐(0) 编辑
摘要:爬虫三种写法。涉及requests、urllib、bs4,re。 写法千千万,没事少抬杠。 阅读全文
posted @ 2022-09-21 19:50 萌狼蓝天 阅读(138) 评论(0) 推荐(0) 编辑
摘要:爬取数据处理-有的链接缺少了“http”的解决方案(not in) 阅读全文
posted @ 2021-12-15 20:36 萌狼蓝天 阅读(76) 评论(0) 推荐(0) 编辑
摘要:正则规则模板及其应用。通过使用正则表达式,取出我们想要的内容 阅读全文
posted @ 2021-12-15 19:54 萌狼蓝天 阅读(138) 评论(0) 推荐(0) 编辑
摘要:获取搜索结果的页数 阅读全文
posted @ 2021-12-15 18:13 萌狼蓝天 阅读(540) 评论(0) 推荐(0) 编辑
摘要:自定义获取网页源码的函数,基于上一篇爬狼系列笔记 阅读全文
posted @ 2021-12-15 17:33 萌狼蓝天 阅读(209) 评论(0) 推荐(0) 编辑
摘要:使用urllib,get请求,获取结果页面的代码 阅读全文
posted @ 2021-12-14 00:15 萌狼蓝天 阅读(1097) 评论(0) 推荐(0) 编辑