会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
冰河入梦
博客园
首页
新随笔
联系
管理
2020年6月30日
python爬虫前(原理+抓包)
摘要: 基本原理 爬虫的本质是模拟浏览器打开网页,获取网页中我们想要的那部分数据。爬虫就是获取网页并提取和保存信息的自动化程序,其主要有如下三个步骤: 获取网页:爬虫首先要做的工作就是获取网页,这里就是获取网页的源代码。源代码里包含了网页的部分有用信息,所以只要把源代码获取下来,就可以从中提取想要的信息了。
阅读全文
posted @ 2020-06-30 00:39 冰河入梦~
阅读(922)
评论(0)
推荐(0)
编辑
公告