1.11you-get 视频爬取

you-get

You-Get是一个小型的命令行实用程序,用于从Web下载媒体内容(视频,音频,图像),以防没有其他方便的方法

官网:

https://github.com/soimort/you-get/

以下依赖关系是必需的,必须单独安装,除非您在Windows上使用预构建的软件包或巧克力软件包:

Python 3

FFmpeg(强烈推荐)或Libav(可选)

RTMPDump

安装

选项1:通过pip安装官方发布的you-get是在PyPI上发布的,可以通过

pip包管理器从PyPI镜像轻松安装。

请注意,您必须使用Python 3版本pip:

pip3 install you-get

选项2:通过抗原安装将以下行添加到您的.zshrc:

antigen bundle soimort/you-get

选项3:使用预构建的软件包(仅限Windows)从以下位置下载exe(独立)或7z(包括所有依赖项):

[https](https://github.com/soimort/you-get/releases/latest):[//github.com/soimort/you-get/releases/latest](https://github.com/soimort/you-get/releases/latest)。

选项4:从GitHub下载您可以下载稳定版(与PyPI上的最新版本相同)或开发(更多修补程序,不稳定特性)分支you-get。

解压缩它,并将包含you-get脚本的目录放入PATH。或者,运行

python3 setup.py install

要么

python3 setup.py install --user

安装you-get到永久路径。

选项5:Git克隆这是所有开发人员的推荐方法,即使你不经常在Python中编码。

git clone git://github.com/soimort/you-get.git

然后把克隆的目录放到你的目录PATH,或者运行 ./setup.py install 安装you-get到一个永久的路径。

选项6:使用Chocolatey(仅限Windows)

> choco install you-get

选项7:Homebrew(仅限Mac)
您可以you-get通过以下方式轻松安装:

$ brew install you-get

壳完成Bash,Fish和Zsh的完成定义可以在contrib/completion。请参考您的shell手册,了解如何利用它们。

升级
根据您选择安装的选项you-get,您可以通过以下方式进行升级:

pip3 install --upgrade you-get

或通过以下方式下载最新版本:

you-get https://github.com/soimort/you-get/archive/master.zip

或使用巧克力包管理器:

> choco upgrade you-get

为了获得最新的develop分支而不乱扔PIP,你可以尝试:

pip3 install --upgrade git+https://github.com/soimort/you-get@develop

使用

查看品质格式,当您收到感兴趣的影片时,您可以使用--info/ -i选项查看所有可用的品质和格式:

img

比如下载高清的,高清是:-format=mp4sd

那么我们在 cmd 中输入:

you-get --format=mp4sd "https://www.bilibili.com/video/BV1ra4y1e7i7?spm_id_from=333.5.b_64616e63655f6f74616b75.4"

下载

D:\>you-get "https://www.bilibili.com/video/BV1ra4y1e7i7?spm_id_from=333.5.b_64616e63655f6f74616b75.4"

img

下载下来会有两个文件,一个视频文件,一个弹幕文件

img

设置下载文件的路径和名称

使用--output-dir/ -o选项设置路径,和--output-filename/ -O设置下载文件的名称

D:\>you-get -o D:\test -O biliVideo.mp4 "https://www.bilibili.com/video/BV1Xz4y1X7P1?spm_id_from=333.5.b_64616e63655f6f74616b75.7"

代理设置

您可以you-get通过--http-proxy/ -x选项指定要使用的HTTP代理:

$ you-get -x 127.0.0.1:8087 ``'https://www.youtube.com/watch?v=jNQXAC9IVRw'

但是,http_proxy默认情况下应用系统代理设置(即环境变量)。要禁用任何代理,请使用该--no-proxy选项。

提示:
如果你需要使用代理了很多(如果您的网络阻止某些网站),你可能希望使用you-get与proxychains并设置alias you-get="proxychains -q you-get"(Bash中)。

对于某些网站(例如优酷),如果您需要访问仅在中国大陆可用的一些视频,可以使用特定代理从网站提取视频信息:--extractor-proxy/ -y。

观看视频

使用--player/ -p选项将视频馈送到您选择的媒体播放器,例如mplayer或vlc,而不是下载:

$ you-get -p vlc ``'https://www.youtube.com/watch?v=jNQXAC9IVRw'

或者,如果您更喜欢在浏览器中观看视频,只需没有广告或评论部分:

$ you-get -p chromium ``'https://www.youtube.com/watch?v=jNQXAC9IVRw'

提示:
可以使用该-p选项来启动另一个下载管理器,例如you-get -p uget-gtk 'https://www.youtube.com/watch?v=jNQXAC9IVRw'
,尽管它们可能不能一起播放很好。

加载Cookie

并非所有视频都向任何人公开。如果您需要登录帐户以访问某些内容(例如,私人视频),则无法you-get通过--cookies/ -c选项向浏览器提供Cookie 。

注意:
到目前为止,我们支持两种格式的浏览器Cookie:Mozilla cookies.sqlite和Netscape cookies.txt。

重新使用提取的数据
使用--url/ -u获取从页面提取的可下载资源URL的列表。用于--json以JSON格式获取抽取数据的摘要

最后顺带一波网址

img

posted @ 2020-10-06 22:37  短戈行  阅读(288)  评论(0编辑  收藏  举报