CogVideoX环境搭建&推理测试

引子

智谱AI版Sora开源，首个可商用，18G显存即可运行。前文写了Open-Sora1.2的博文，感兴趣的童鞋请移步（Open-Sora1.2环境搭建&推理测试_open sora 1.2-CSDN博客）。对于这种占用资源少，且效果不错的多模态模型那么肯定不容错过。OK，我们开始吧。

一、模型介绍

CogVideoX是清影同源的开源版本视频生成模型。

下表展示目前我们提供的视频生成模型列表，以及相关基础信息:

模型名	CogVideoX-2B
提示词语言	English
单GPU推理 (FP-16) 显存消耗	18GB using SAT 23.9GB using diffusers
多GPU推理 (FP-16) 显存消耗	20GB minimum per GPU using diffusers
微调显存消耗 (bs=1)	42GB
提示词长度上限	226 Tokens
视频长度	6 seconds
帧率（每秒）	8 frames
视频分辨率	720 * 480
量化推理	不支持
下载地址 (Diffusers 模型)	Huggingface ModelScope
下载地址 (SAT 模型)	SAT