摘要: 一. 介绍# Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式.Beautiful Soup会帮你节省数小时甚至数天的工作时间.你可能在寻找 Beautiful Soup3 的文档,Beauti 阅读全文
posted @ 2020-08-14 20:18 清轩挽长风 阅读(344) 评论(0) 推荐(0) 编辑
摘要: 一. 介绍# Copy # 介绍:使用requests可以模拟浏览器的请求,比起之前用到的urllib,requests模块的api更加便捷(本质就是封装了urllib3) # 注意:requests库发送请求将网页内容下载下来以后,并不会执行js代码,这需要我们自己分析目标站点然后发起新的requ 阅读全文
posted @ 2020-08-14 19:31 清轩挽长风 阅读(321) 评论(0) 推荐(0) 编辑
摘要: 一. 爬虫是什么# ![](01 爬虫基本原理.assets/1036857-20171102182154154-1486674926.jpg) Copy # 1、什么是互联网? 互联网是由网络设备(网线,路由器,交换机,防火墙等等)和一台台计算机连接而成,像一张网一样。 # 2、互联网建立的目的? 阅读全文
posted @ 2020-08-14 13:01 清轩挽长风 阅读(154) 评论(0) 推荐(0) 编辑