会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
zrsweheart
welcom to my blogs
博客园
首页
新随笔
联系
订阅
管理
2022年8月27日
python爬虫
摘要: 关于爬虫 几乎每一个网站都有一个名为 robots.txt 的文档,当然也有部分网站没有设定 robots.txt。对于没有设定 robots.txt 的网站可以通过网络爬虫获取没有口令加密的数据,也就是该网站所有页面数据都可以爬取。如果网站有 robots.txt 文档,就要判断是否有禁止访客获取
阅读全文
posted @ 2022-08-27 19:14 zrswheart
阅读(50)
评论(0)
推荐(0)
编辑
公告