Open-Sora1.2环境搭建&推理测试
前阵子写了一篇Open-Sora1.0环境搭建&推理测试(
一、升级介绍
在上一个版本基础上,引入了视频压缩网络(Video Compression Network)、更优的扩散模型算法、更多的可控性,并利用更多的数据训练出了 1.1B 的扩散生成模型。Stable Diffusion 3,最新的扩散模型,通过采用了 rectified flow 技术替代 DDPM,显著提升了图片和视频生成的质量。尽管 SD3 的 rectified flow 训练代码尚未公开,但潞晨 Open-Sora 团队已经基于 SD3 的研究成果,提供了一套完整的训练解决方案,包括:
(1)简单易用的整流(rectified flow)训练
(2)用于训练加速的 Logit-norm 时间步长采样
(3)基于分辨率和视频长度的时间步长采样
二、环境安装
(1)模型下载
(2)代码下载
git clone
三、推理测试
docker run -it --gpus=all --rm -v /datas/work/zzq/:/workspace open-sora:v1.0 bash
pip install -v .
git clone
cd PixArt-sigma
pip install -r requirements.txt
注:open-sora:v1.0为上一篇OpenSora博文安装的docker镜像名称
修改代码
修改代码 vi /opt/conda/lib/python3.10/site-packages/opensora/models/vae/vae.py
python scripts/inference.py configs/opensora-v1-2/inference/sample.py --num-frames 4s --resolution 720p --aspect-ratio 9:16 --num-sampling-steps 30 --flow 5 --aes 6.5 --prompt "a beautiful waterfall"
显存不够,改小分辨率
python scripts/inference.py configs/opensora-v1-2/inference/sample.py --num-frames 4s --resolution 144p --aspect-ratio 9:16 --num-sampling-steps 30 --flow 5 --aes 6.5 --prompt "a beautiful waterfall"