01.认识爬虫
爬虫是什么?有人叫它网络蜘蛛 也有人叫它网络机器人...
现在许多人掉入到理解误区,认为爬虫就是黑客,是非法的一种技术手段,其实并不是,我想说的是:网络技术本来就是研究的一门学问。
爬虫也不是黑客,爬虫能干的事情人都可以干,我们可以理解爬虫就是'超级人'
爬虫可以达到人达不到的高度,大大提高工作,应用,浏览...等方面的效率
再官方一点就是自动化操作,能模拟人的操作去做各种事情
谈谈爬虫的功能:
爬虫用来做大数据采集:
在APP WEB端上将数据爬取下来,放在自己的电脑上。
爬虫还能做搜索引擎:
其实百度就是一个巨大的网络爬虫,你去搜索的关键词,这个强大的网络爬虫体系就会去各个地方采集信息,
然后按照一定的格式反馈给用户。
爬虫学习之路:
爬虫的知识点非常零散化,是一门需要一直研究的技术,原因在于有反爬虫工程师在与你一直对抗着。
反爬虫:你要爬取我的数据,我就设置一堆参数加密...之类的不让你爬
爬虫:想尽一切办法破开你设置的参数加密...拿到数据
爬虫需要掌握的技能:
较好的Python基础 + 前端的一定知识 + 数据敏感程度高 + 部分机器学习 + 抓包工具 + 'APP抓取' + '反爬对抗' + JS逆向(食物链顶端的存在)
最重要的都在反爬对抗与JS逆向
结束
分类:
Python爬虫入门到入狱
标签:
Python爬虫入门到入狱
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· 【自荐】一款简洁、开源的在线白板工具 Drawnix