如何获取web视频数据流的传输?小姐姐的视频都被我爬下来了,这谁顶得住
大家好,我是辣条。
效果展示
爬取目标
网站:六间房
工具使用
开发工具:pycharm 开发环境:python3.7, Windows10 使用工具包:requests,lxml
重点学习内容
-
动态数据抓取
-
requests使用
-
json数据获取
项目思路解析
第一步,明确自己需要获取的网页地址信息,要先清楚的自己的采集目标,今天采集的数据是六间房的小视频数据。
当前网页数据可以明显看出是动态数据,找到对应数据接口,获取到视频的播放地址,动态数据获取的话首先打开抓包工具 (爬虫必备技能就不做过多介绍) 刷新网页数据进行页面的数据加载,找到动态数据。
确定自己需要的数据,在headers里找到请求的url地址,对网址发送请求(尽量做爬虫的时候都带上请求头不要像我。。。 将数据转换成字典格式,取出字典里content里的list 循环取出列表每个视频数据,拿到数据里的视频播放地址和视频标题,保存对应视频数据。
简易源码分享
最后给大家分享腾讯,阿里,字节跳动,很有意思的一张对比图!
从BAT到BAT,只是从Baidu换成了ByteDance,曾经的BTA,是PC时代的霸主,如今的BAT,是移动互联网的霸主。
二十世纪的,第一个十年,是靠搜索的百度国内称王,第二个十年,是靠算法的字节走向世界。
第三个十年,会是谁独树一帜站上顶点,又会是谁让位谁上位?