1.11you-get 视频爬取
you-get
You-Get是一个小型的命令行实用程序,用于从Web下载媒体内容(视频,音频,图像),以防没有其他方便的方法
官网:
https://github.com/soimort/you-get/
以下依赖关系是必需的,必须单独安装,除非您在Windows上使用预构建的软件包或巧克力软件包:
Python 3
FFmpeg(强烈推荐)或Libav(可选)
RTMPDump
安装
选项1:通过pip安装官方发布的you-get是在PyPI上发布的,可以通过
pip包管理器从PyPI镜像轻松安装。
请注意,您必须使用Python 3版本pip:
pip3 install you-get
选项2:通过抗原安装将以下行添加到您的.zshrc:
antigen bundle soimort/you-get
选项3:使用预构建的软件包(仅限Windows)从以下位置下载exe(独立)或7z(包括所有依赖项):
[https](https://github.com/soimort/you-get/releases/latest):[//github.com/soimort/you-get/releases/latest](https://github.com/soimort/you-get/releases/latest)。
选项4:从GitHub下载您可以下载稳定版(与PyPI上的最新版本相同)或开发(更多修补程序,不稳定特性)分支you-get。
解压缩它,并将包含you-get脚本的目录放入PATH。或者,运行
python3 setup.py install
要么
python3 setup.py install --user
安装you-get到永久路径。
选项5:Git克隆这是所有开发人员的推荐方法,即使你不经常在Python中编码。
git clone git://github.com/soimort/you-get.git
然后把克隆的目录放到你的目录PATH,或者运行 ./setup.py install 安装you-get到一个永久的路径。
选项6:使用Chocolatey(仅限Windows)
> choco install you-get
选项7:Homebrew(仅限Mac)
您可以you-get通过以下方式轻松安装:
$ brew install you-get
壳完成Bash,Fish和Zsh的完成定义可以在contrib/completion。请参考您的shell手册,了解如何利用它们。
升级
根据您选择安装的选项you-get,您可以通过以下方式进行升级:
pip3 install --upgrade you-get
或通过以下方式下载最新版本:
you-get https://github.com/soimort/you-get/archive/master.zip
或使用巧克力包管理器:
> choco upgrade you-get
为了获得最新的develop分支而不乱扔PIP,你可以尝试:
pip3 install --upgrade git+https://github.com/soimort/you-get@develop
使用
查看品质格式,当您收到感兴趣的影片时,您可以使用--info/ -i选项查看所有可用的品质和格式:
比如下载高清的,高清是:-format=mp4sd
那么我们在 cmd 中输入:
you-get --format=mp4sd "https://www.bilibili.com/video/BV1ra4y1e7i7?spm_id_from=333.5.b_64616e63655f6f74616b75.4"
下载
D:\>you-get "https://www.bilibili.com/video/BV1ra4y1e7i7?spm_id_from=333.5.b_64616e63655f6f74616b75.4"
下载下来会有两个文件,一个视频文件,一个弹幕文件
设置下载文件的路径和名称
使用--output-dir/ -o选项设置路径,和--output-filename/ -O设置下载文件的名称
D:\>you-get -o D:\test -O biliVideo.mp4 "https://www.bilibili.com/video/BV1Xz4y1X7P1?spm_id_from=333.5.b_64616e63655f6f74616b75.7"
代理设置
您可以you-get通过--http-proxy/ -x选项指定要使用的HTTP代理:
$ you-get -x 127.0.0.1:8087 ``'https://www.youtube.com/watch?v=jNQXAC9IVRw'
但是,http_proxy默认情况下应用系统代理设置(即环境变量)。要禁用任何代理,请使用该--no-proxy选项。
提示:
如果你需要使用代理了很多(如果您的网络阻止某些网站),你可能希望使用you-get与proxychains并设置alias you-get="proxychains -q you-get"(Bash中)。
对于某些网站(例如优酷),如果您需要访问仅在中国大陆可用的一些视频,可以使用特定代理从网站提取视频信息:--extractor-proxy/ -y。
观看视频
使用--player/ -p选项将视频馈送到您选择的媒体播放器,例如mplayer或vlc,而不是下载:
$ you-get -p vlc ``'https://www.youtube.com/watch?v=jNQXAC9IVRw'
或者,如果您更喜欢在浏览器中观看视频,只需没有广告或评论部分:
$ you-get -p chromium ``'https://www.youtube.com/watch?v=jNQXAC9IVRw'
提示:
可以使用该-p选项来启动另一个下载管理器,例如you-get -p uget-gtk 'https://www.youtube.com/watch?v=jNQXAC9IVRw'
,尽管它们可能不能一起播放很好。
加载Cookie
并非所有视频都向任何人公开。如果您需要登录帐户以访问某些内容(例如,私人视频),则无法you-get通过--cookies/ -c选项向浏览器提供Cookie 。
注意:
到目前为止,我们支持两种格式的浏览器Cookie:Mozilla cookies.sqlite和Netscape cookies.txt。
重新使用提取的数据
使用--url/ -u获取从页面提取的可下载资源URL的列表。用于--json以JSON格式获取抽取数据的摘要