一键Run带你体验扩散模型的魅力

合集 - AI(100)

1.CutMix&Mixup详解与代码实战2023-04-27 2.绘画手残党的福音：涂鸦线稿秒变绝美图像2023-05-05 3.探讨AIGC的崛起历程，浅析其背后技术发展2023-05-10 4.创新 = 颠覆？AI创新如何做大蛋糕2023-07-19 5.实践分析丨AscendCL应用编译&运行案例2023-07-26 6.Inpaint Anything：一键进行多种图像修补2023-07-27 7.RT-DETR：可以满足实时性要求的DETR模型2023-07-31 8.华为云盘古大模型辅助药物设计，西交大的新型抗生素研发之路2023-08-01 9.解决大模型“开发难”，昇思MindSpore自动并行技术应用实践2023-08-03 10.一文详解TextBrewer2023-08-08 11.基于Pair-wise和CrossEncoder训练单塔模型2023-08-09 12.基于卷积神经网络的MAE自监督方法2023-08-11 13.晋级名单公布！“域见杯”复赛今日火热开启2023-08-16 14.CutLER：一种用于无监督目标检测和实例分割的方法2023-08-17 15.带你读论文丨S&P21 Survivalism: Living-Off-The-Land 经典离地攻击2023-08-18 16.使用 UCS(On-Premises) 管理您的GPU资源池，释放AI大模型算力潜能2023-08-21 17.带你读论文丨Fuzzing漏洞挖掘详细总结 GreyOne2023-08-22 18.用案例带你认识决策树，解锁洞察力2023-08-22 19.带你读论文丨S&P2019 HOLMES Real-time APT Detection2023-08-23 20.中国图数据库，领导者！2023-08-24 21. 【干货】华为云图数据库GES技术演进2023-08-24 22.带你上手基于Pytorch和Transformers的中文NLP训练框架2023-08-28 23.开放同飞，华为云发布盘古大模型全域协同生态2023-08-31 24.Ascend C保姆级教程：我的第一份Ascend C代码2023-08-31 25.纯干货！一文get昇腾Ascend C编程入门全部知识点2023-09-01 26.3天上手Ascend C编程丨带你认识Ascend C基本概念及常用接口2023-09-05 27.PanGu-Coder2：从排序中学习，激发大模型潜力2023-09-06 28.昇腾实践丨ATC模型转换动态shape问题案例2023-09-08 29.3天上手Ascend C编程丨通过Ascend C编程范式实现一个算子实例2023-09-11 30.华为云盘古大模型加码生物医药，为行业插上“数字翅膀”2023-09-14 31.如何用华为云ModelArts平台玩转Llama22023-09-15 32.教你用API插件开发一个AI快速处理图片小助手2023-09-19 33.大模型时代，如何快速开发AI应用2023-09-20 34.超详细API插件使用教程，教你开发AI垃圾分类机器人2023-09-20 35.三步实现BERT模型迁移部署到昇腾2023-09-21 36.手敲，Ascend算子开发入门笔记分享2023-10-09 37.全域Serverless+AI，华为云加速大模型应用开发2023-10-09 38.教你如何基于MindSpore进行ChatGLM微调2023-10-16 39.从基础到实践，回顾Elasticsearch 向量检索发展史2023-10-23 40.昇腾CANN 7.0 黑科技：大模型训练性能优化之道2023-10-23 41.知识图谱与大模型相结合的3种方法，1+1>22023-11-01 42.IoT与鸿蒙、低代码、生成式AI，引爆技术浪潮——华为云开发者日南京站成功举办2023-11-01 43.带你认识一下多模态对比语言图像预训练CLIP2023-11-02 44.昇腾迁移丨4个TensorFlow模型训练案例解读2023-11-06 45.MoE：LLM终身学习的可能性2023-11-07 46.理论+实践详解最热的LLM应用框架LangChain2023-11-07 47.昇腾CANN DVPP硬件加速训练数据预处理，友好解决Host CPU预处理瓶2023-11-09 48.昇腾CANN 7.0 黑科技：大模型推理部署技术解密2023-11-10 49.从HumanEval到CoderEval: 你的代码生成模型真的work吗？2023-11-13 50.告别繁琐，ModelArts一键解决车牌号识别难题2023-11-16 51.四载磨砺，一群青年“识瘤者”以AI助力医疗创新2023-11-17 52.一种全新的日志异常检测评估框架：LightAD2023-11-21 53.学生开发者勇担青年使命，用AI守护少数人的“视界”2023-11-21 54.教你如何使用PyTorch解决多分类问题2023-11-22 55.三大基础方案和AI出海计划重磅发布！加速盘古大模型生态发展2023-11-23 56.带你了解大语言模型的前世今生2023-11-27 57.基于AI的架构优化：创新数据集构造法提升Feature envy坏味道检测与重构准确率2023-12-01 58.一种全新的日志异常检测评估框架：LightAD2023-12-04 59.从HumanEval到CoderEval: 你的代码生成模型真的work吗？2023-12-04 60.揭秘华为研发代码大模型是如何实现的2023-12-05 61.大语言模型底层架构丨带你认识Transformer2023-12-06 62.深入解析LLaMA如何改进Transformer的底层结构2023-12-07 63.语言模型：GPT与HuggingFace的应用2023-12-08 64.一文掌握Ascend C孪生调试2023-12-12 65.大模型那么火，教你一键Modelarts玩转开源LlaMA(羊驼)大模型2023-12-15 66.大语言模型训练数据常见的4种处理方法2023-12-19 67.听6位专家畅谈AI大模型落地实践：场景和人才是关键2024-01-11 68.从工程化角度，详解鹏程·脑海大模型训练过程2024-01-12 69.如何使用MindStudio轻松搞定大模型全流程开发2024-01-19 70.带你熟悉NLP预训练模型：BERT2024-01-22 71.三个方面浅析数据对大语言模型的影响2024-01-25 72.4个大语言模型训练中的典型开源数据集2024-02-01 73.动手实践丨轻量级目标检测与分割算法开发和部署(RK3568)2024-02-26 74.手把手带你快速上手香橙派AIpro2024-03-01 75.想做大模型开发前，先来了解一下MoE2024-03-04

76.一键Run带你体验扩散模型的魅力2024-03-08

77.万字带你了解ChatGLM2024-03-13 78.Sora Opera：天图万境联合华为云共筑AI生成式视频音效新高度2024-03-15 79.鸿蒙x昇腾云：华为打造智能时代最佳AI基础设施2024-03-18 80.从模型到部署，教你如何用Python构建机器学习API服务2024-04-08 81.Ascend C 自定义PRelu算子2024-04-08 82.Ascend C 自定义算子 Kernel Launch调用入门2024-04-09 83.物联网中的预测分析：当IoTDA遇上ModelArts2024-04-09 84.基于香橙派AIpro将开源框架模型转换为昇腾模型2024-04-12 85.“大模型驱动的软件研发” 华为云助推企业研发智能化升级2024-04-12 86.如何基于香橙派AIpro对视频/图像数据进行预处理2024-04-19 87.MindSpore强化学习：使用PPO配合环境HalfCheetah-v2进行训练2024-04-29 88.带你开发一个视频动态手势识别模型2024-04-29 89.第六届·2024 MindSpore 量子计算黑客松热身赛赛题解读2024-05-11 90.华为云引领首个代码大模型国际标准立项2024-05-14 91.共创数字经济新生态，华为云生态领航者·AI先遣队圆满落幕2024-05-16 92.一文教你基于LangChain和ChatGLM3搭建本地知识库问答2024-05-23 93.华为云受邀出席AICon2024 分享AI Agent在企业生产中的技术实践2024-05-24 94.什么是Token？为什么大模型要计算Token数2024-05-27 95.解读注意力机制原理，教你使用Python实现深度学习模型2024-05-27 96.手把手教你基于华为云，实现MindSpore模型训练2024-05-28 97.一文教你如何调用Ascend C算子2024-05-29 98.华为云大咖说：开发者应用AI大模型的“道、法、术”2024-05-30 99.儿童节变身小小音乐家，用ModelArts制作一张AIGC音乐专辑2024-05-31 100.什么是LLM大模型训练，详解Transformer结构模型2024-06-04

本文分享自华为云社区《爆圈Sora横空出世，AGI通用人工智能时代真的要来了吗？一键Run带你体验扩散模型的魅力！》，作者：码上开花_Lancer。

Sora这几天的爆炸性新闻，让所有人工智能相关从业者及对应用感兴趣的人群都感到沸腾，震撼到央视也在进行相关的讨论，简直可以和2023年初ChatGPT讨论带来的热潮一般。所以它到底为什么这么火？

一、什么是SORA?

Sora 是OpenAI最新发布的文本生成视频模型，不仅可以生成长达一分钟的视频，且能完全遵照用户的 Prompt 并保持视觉质量。

OpenAI 这个公司的格局非常大，他想要做 World Simulators（世界模拟器），做通用AGI，而不仅仅是文字或者图像视频领域的内容，他希望的是帮助人们解决需要现实世界交互的问题。单从OpenAI 发布的sora模型的论文可以看出来：

图片中文翻译：

视频生成模型作为世界模拟器我们探讨了在视频数据上对生成模型进行大规模训练。具体来说，我们共同训练了文本条件扩散模型，这些模型能够处理不同时长、分辨率和宽高比的视频和图像。我们利用了一种变压器架构，该架构能够处理视频和图像潜在代码的空间时间块。我们最大的模型，Sora，能够生成一分钟的高保真视频。我们的结果表明，扩展视频生成模型是构建通用物理世界模拟器的有希望的道路。

在文生视频领域，Sora将带来短视频的智能化变革，打破当前内容平台等额原有数据壁垒，短视频创作的生态护城河，同时Sora融入短视频工作流，极大的增强用户的体验，降低创作难度和成本，极大拓展创作者的能力边界，激发短视频创作空间。

在视频创作领域，画面的稳定性至关重要。如果要呈现出优质的效果，创作者需要具备高超的视频剪辑技能和相关基础。然而，SORA这次的表现真是逆天！通过简单的文字描述，它能生成画面稳定、理解能力强的长视频。

SORA的技术思路与众不同，完全碾压了传统方法。它不再仅关注二维像素的变化，而是专注于语义理解的变化。从以往的视频画面生成，转变为故事逻辑的生成。这种创新思路让人瞠目结舌，展示了技术的无限可能性

二、SORA背后原理的推测

根据OpenAI最新发布的技术报告，Sora背后的“text-to-video”模型基于Diffusion Transformer Model。这种模型结合了Transformer架构和扩散模型，用于生成图像、视频和其他数据。

实际上，Sora是一个基于Transformer的扩散模型。这类模型不仅在理论上具有创新性，而且在实际应用中也显示出了强大的潜力。例如，DiT模型（Sora的基础）和GenTron模型在图像和视频生成等领域都已经取得了巨大的成功，这些创新性的模型为我们展示了技术的无限可能性。目前Sora技术没有公开，大家对它都有不同猜测。DIT提出人谢赛宁：

1）Sora应该是建立在DiT这个扩散Transformer之上的。

2）Sora可能有大约30亿个参数,(引用论文模型0.13B, 32X算力)。
3）训练数据是Sora 成功的最关键因素。
4）主要的挑战是如何解决错误累积问题并随着时间的推移保持质量/一致。

DiT模型：Meta提出的完全基于transformer架构的扩散模型，不仅将transformer成功应用在扩散模型，还探究了transformer架构在扩散模型上的scalability能力。

GenTron模型：一种基于Transformer的扩散模型，在针对SDXL的人类评估中，GenTron在视觉质量方面取得了51.1%的胜率（19.8%的平局率），在文本对齐方面取得了42.3%的胜率（42.9%的平局率）。

DiT模型
Scalable Diffusion Models with Transformers ---- 基于transformer的扩散模型，称为Diffusion Transformers（DiTs），Diffusion Transformer Model（DiT）的设计空间、扩展行为、网络复杂度和样本质量之间的关系。这些研究结果表明，通过简单地扩展DiT并使用高容量的骨干网络，可以在类条件256x256 ImageNet生成基准测试中实现最新的2.27 FID。与像素空间扩散模型相比，DiTs在使用的Gflops只是其一小部分，因此具有较高的计算效率。此外，DiTs还可以应用于像素空间，使得图像生成流程成为混合方法，使用现成的卷积VAEs和基于transformer的DDPMs。

扩散模型中引入了transformer类的标准设计，以取代传统的U-Net设计，从而提供了一种新的架构选择。

引入了潜在扩散模型（LDMs），通过将图像压缩为较小的空间表示，并在这些表示上训练扩散模型，从而解决了在高分辨率像素空间中直接训练扩散模型的计算问题。

那对于我们开发者用户想要强烈体验文生视频的乐趣，那里可以体验呢？今天给大家介绍下Stable Video Diffusion (SVD)，一起在华为云一键Run体验其中的乐趣：

三、Stable Video Diffusion (SVD) 扩散模型的图像生成视频的体验

1. 案例简介

Stable Video Diffusion (SVD) 是一种扩散模型，它将静止图像作为条件帧，并从中生成视频。

🔹 本案例需使用 Pytorch-1.8 GPU-V100 及以上规格运行

🔹 点击Run in ModelArts，将会进入到ModelArts CodeLab中，这时需要你登录华为云账号，如果没有账号，则需要注册一个，且要进行实名认证，参考《ModelArts准备工作_简易版》即可完成账号注册和实名认证。登录之后，等待片刻，即可进入到CodeLab的运行环境

🔹 出现 Out Of Memory ，请检查是否为您的参数配置过高导致，修改参数配置，重启kernel或更换更高规格资源进行规避❗❗❗

2. 下载代码和模型

!git clone https://github.com/Stability-AI/generative-models.git

Cloning into 'generative-models'...

remote: Enumerating objects: 860, done.•[K

remote: Counting objects: 100% (489/489), done.•[K

remote: Compressing objects: 100% (222/222), done.•[K

remote: Total 860 (delta 368), reused 267 (delta 267), pack-reused 371•[K

Receiving objects: 100% (860/860), 42.67 MiB | 462.00 KiB/s, done.

Resolving deltas: 100% (445/445), done.

import moxing as mox
mox.file.copy_parallel('obs://modelarts-labs-bj4-v2/case_zoo/Stable_Video_Diffusion/file/modify_file/generative-models/sgm/modules/encoders','generative-models/sgm/modules/encoders')
mox.file.copy_parallel('obs://modelarts-labs-bj4-v2/case_zoo/Stable_Video_Diffusion/file/models','generative-models/models')
mox.file.copy_parallel(,'obs://modelarts-labs-bj4-v2/case_zoo/Stable_Video_Diffusion/file/checkpoints','generative-models/checkpoints')

INFO:root:Using MoXing-v2.1.0.5d9c87c8-5d9c87c8

INFO:root:Using OBS-Python-SDK-3.20.9.1

3. 配置运行环境

本案例依赖Python3.10.10及以上环境，因此我们首先创建虚拟环境：

!/home/ma-user/anaconda3/bin/conda create -n python-3.10.10 python=3.10.10 -y --override-channels --channel https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main
!/home/ma-user/anaconda3/envs/python-3.10.10/bin/pip install ipykernel

/home/ma-user/anaconda3/lib/python3.7/site-packages/requests/__init__.py:91: RequestsDependencyWarning: urllib3 (1.26.12) or chardet (3.0.4) doesn't match a supported version!

  RequestsDependencyWarning)

Collecting package metadata (current_repodata.json): done

Solving environment: failed with repodata from current_repodata.json, will retry with next repodata source.

Collecting package metadata (repodata.json): done

Solving environment: done

import json
import os

data = {
   "display_name": "python-3.10.10",
   "env": {
      "PATH": "/home/ma-user/anaconda3/envs/python-3.10.10/bin:/home/ma-user/anaconda3/envs/python-3.7.10/bin:/modelarts/authoring/notebook-conda/bin:/opt/conda/bin:/usr/local/nvidia/bin:/usr/local/cuda/bin:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/home/ma-user/modelarts/ma-cli/bin:/home/ma-user/modelarts/ma-cli/bin:/home/ma-user/anaconda3/envs/PyTorch-1.8/bin"
   },
   "language": "python",
   "argv": [
      "/home/ma-user/anaconda3/envs/python-3.10.10/bin/python",
      "-m",
      "ipykernel",
      "-f",
      "{connection_file}"
   ]
}

if not os.path.exists("/home/ma-user/anaconda3/share/jupyter/kernels/python-3.10.10/"):
    os.mkdir("/home/ma-user/anaconda3/share/jupyter/kernels/python-3.10.10/")

with open('/home/ma-user/anaconda3/share/jupyter/kernels/python-3.10.10/kernel.json', 'w') as f:
    json.dump(data, f, indent=4)

创建完成后，稍等片刻，或刷新页面，点击右上角kernel选择python-3.10.10

!pip install torch==2.0.1 torchvision==0.15.2
!pip install MoviePy

Looking in indexes: http://repo.myhuaweicloud.com/repository/pypi/simple

Collecting torch==2.0.1

  Downloading http://repo.myhuaweicloud.com/repository/pypi/packages/8c/4d/17e07377c9c3d1a0c4eb3fde1c7c16b5a0ce6133ddbabc08ceef6b7f2645/torch-2.0.1-cp310-cp310-manylinux1_x86_64.whl (619.9 MB)

•[2K     •[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━•[0m •[32m619.9/619.9 MB•[0m •[31m5.6 MB/s•[0m eta •[36m0:00:00•[0m00:01•[0m00:01•[0m

......
    Uninstalling decorator-5.1.1:

      Successfully uninstalled decorator-5.1.1

Successfully installed MoviePy-1.0.3 decorator-4.4.2 imageio-2.34.0 imageio_ffmpeg-0.4.9 proglog-0.1.10 tqdm-4.66.2

%cd generative-models

/home/ma-user/work/stable-video-diffusion/generative-models

/home/ma-user/anaconda3/envs/python-3.10.10/lib/python3.10/site-packages/IPython/core/magics/osm.py:417: UserWarning: using dhist requires you to install the `pickleshare` library.

  self.shell.db['dhist'] = compress_dhist(dhist)[-100:]

!pip install -r requirements/pt2.txt

Looking in indexes: http://repo.myhuaweicloud.com/repository/pypi/simple

Collecting clip@ git+https://github.com/openai/CLIP.git (from -r requirements/pt2.txt (line 3))

  Cloning https://github.com/openai/CLIP.git to /tmp/pip-install-_vzv4vq_/clip_4273bc4d2cba4d6486a222a5093fbe4b

 conda3/envs/python-3.10.10/lib/python3.10/site-packages (from -r requirements/pt2.txt (line 32)) (4.66.2)

Collecting transformers==4.19.1 (from -r requirements/pt2.txt (line 33))

 
      Successfully uninstalled urllib3-2.2.1

Successfully installed PyWavelets-1.5.0 aiohttp-3.9.3 aiosignal-1.3.1 altair-5.2.0 antlr4-python3-runtime-4.9.3 appdirs-1.4.4 async-timeout-4.0.3 attrs-23.2.0 black-23.7.0 blinker-1.7.0 braceexpand-0.1.7 cachetools-5.3.2 chardet-5.1.0 click-8.1.7 clip-1.0 contourpy-1.2.0 cycler-0.12.1 docker-pycreds-0.4.0 einops-0.7.0 fairscale-0.4.13 fire-0.5.0 fonttools-4.49.0 frozenlist-1.4.1 fsspec-2024.2.0 ftfy-6.1.3 gitdb-4.0.11 gitpython-3.1.42 huggingface-hub-0.20.3 importlib-metadata-7.0.1 invisible-watermark-0.2.0 jsonschema-4.21.1 jsonschema-specifications-2023.12.1 kiwisolver-1.4.5 kornia-0.6.9 lightning-utilities-0.10.1 markdown-it-py-3.0.0 matplotlib-3.8.3 mdurl-0.1.2 multidict-6.0.5 mypy-extensions-1.0.0 natsort-8.4.0 ninja-1.11.1.1 omegaconf-2.3.0 open-clip-torch-2.24.0 opencv-python-4.6.0.66 pandas-2.2.0 pathspec-0.12.1 protobuf-3.20.3 pudb-2024.1 pyarrow-15.0.0 pydeck-0.8.1b0 pyparsing-3.1.1 pytorch-lightning-2.0.1 pytz-2024.1 pyyaml-6.0.1 referencing-0.33.0 regex-2023.12.25 rich-13.7.0 rpds-py-0.18.0 safetensors-0.4.2 scipy-1.12.0 sentencepiece-0.2.0 sentry-sdk-1.40.5 setproctitle-1.3.3 smmap-5.0.1 streamlit-1.31.1 streamlit-keyup-0.2.0 tenacity-8.2.3 tensorboardx-2.6 termcolor-2.4.0 timm-0.9.16 tokenizers-0.12.1 toml-0.10.2 tomli-2.0.1 toolz-0.12.1 torchaudio-2.0.2 torchdata-0.6.1 torchmetrics-1.3.1 transformers-4.19.1 tzdata-2024.1 tzlocal-5.2 urllib3-1.26.18 urwid-2.6.4 urwid-readline-0.13 validators-0.22.0 wandb-0.16.3 watchdog-4.0.0 webdataset-0.2.86 xformers-0.0.22 yarl-1.9.4 zipp-3.17.0

!pip install .

Looking in indexes: http://repo.myhuaweicloud.com/repository/pypi/simple

Processing /home/ma-user/work/stable-video-diffusion/generative-models

  Installing build dependencies ... •[?25ldone

•[?25h  Getting requirements to build wheel ... •[?25ldone

•[?25h  Preparing metadata (pyproject.toml) ... •[?25ldone

•[?25hBuilding wheels for collected packages: sgm

  Building wheel for sgm (pyproject.toml) ... •[?25ldone

•[?25h  Created wheel for sgm: filename=sgm-0.1.0-py3-none-any.whl size=127368 sha256=0f9ff6913b03b2e0354cd1962ecb2fc03df36dea90d14b27dc46620e6eafc9a0

  Stored in directory: /home/ma-user/.cache/pip/wheels/a9/b8/f4/e84140beaf1762b37f5268788964d58d91394ee17de04b3f9a

Successfully built sgm

Installing collected packages: sgm

Successfully installed sgm-0.1.0

4. 生成视频

视频默认生成到outputs文件夹内

!python scripts/sampling/simple_video_sample.py --decoding_t 1 --input_path 'assets/test_image.png'

/home/ma-user/work/stable-video-diffusion/generative-models

VideoTransformerBlock is using checkpointing

VideoTransformerBlock is using checkpointing

VideoTransformerBlock is using checkpointing

VideoTransformerBlock is using checkpointing

VideoTransformerBlock is using checkpointing

VideoTransformerBlock is using checkpointing

VideoTransformerBlock is using checkpointing

VideoTransformerBlock is using checkpointing

VideoTransformerBlock is using checkpointing

VideoTransformerBlock is using checkpointing

VideoTransformerBlock is using checkpointing

VideoTransformerBlock is using checkpointing

VideoTransformerBlock is using checkpointing

VideoTransformerBlock is using checkpointing

VideoTransformerBlock is using checkpointing

VideoTransformerBlock is using checkpointing

Initialized embedder #0: FrozenOpenCLIPImagePredictionEmbedder with 683800065 params. Trainable: False

Initialized embedder #1: ConcatTimestepEmbedderND with 0 params. Trainable: False

Initialized embedder #2: ConcatTimestepEmbedderND with 0 params. Trainable: False

Initialized embedder #3: VideoPredictionEmbedderWithEncoder with 83653863 params. Trainable: False

Initialized embedder #4: ConcatTimestepEmbedderND with 0 params. Trainable: False

Restored from checkpoints/svd.safetensors with 0 missing and 0 unexpected keys

100%|███████████████████████████████████████| 890M/890M [00:50<00:00, 18.5MiB/s]

/home/ma-user/anaconda3/envs/python-3.10.10/lib/python3.10/site-packages/torch/utils/checkpoint.py:31: UserWarning: None of the inputs have requires_grad=True. Gradients will be None

  warnings.warn("None of the inputs have requires_grad=True. Gradients will be None")

#将视频文件转成动图显示
from moviepy.editor import *
 
# 指定输入视频路径
video_path = "outputs/simple_video_sample/svd/000000.mp4"
 
# 加载视频
clip = VideoFileClip(video_path)
 
# 设置保存GIF的参数（如分辨率、持续时间等）
output_file = "output_animation.gif"
fps = 10 # GIF每秒显示的帧数
 
# 生成并保存GIF
clip.write_gif(output_file, fps=fps)

MoviePy - Building file output_animation.gif with imageio.

from IPython.display import Image
Image(open('output_animation.gif','rb').read())

大家赶紧来体验文生视频的乐趣吧！

点击关注，第一时间了解华为云新鲜技术~

posted @ 2024-03-08 10:41 华为云开发者联盟阅读(137) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· 无需搭建环境，零门槛带你体验Open-Sora文生视频应用

· 零代码教你安装部署Stable Diffusion 3，一键生成高质量图像

· 探索AI视频生成新纪元：文生视频Sora VS RunwayML、Pika及StableVideo——谁将引领未来

· 视频生成-OpenAI Sora

· Open-Sora环境搭建&推理测试

阅读排行：
· 【.NET】调用本地 Deepseek 模型
· CSnakes vs Python.NET：高效嵌入与灵活互通的跨语言方案对比
· DeepSeek “源神”启动！「GitHub 热点速览」
· Plotly.NET 一个为 .NET 打造的强大开源交互式图表库
· 我与微信审核的“相爱相杀”看个人小程序副业

历史上的今天：
2023-03-08 女神节特辑 | 5%的故事，看见女性开发者的力量
2023-03-08 bucket表：数仓存算分离中CU与DN解绑的关键
2023-03-08 解密数仓高可用failover流程
2023-03-08 云图说丨云数据库GaussDB(for MySQL)事务拆分大揭秘
2022-03-08 跨越DDD从理论到工程落地的鸿沟
2022-03-08 普通索引和唯一索引，难道还分不清
2022-03-08 假如让你来设计SSL/TLS协议，你要怎么设计呢？

公告

昵称：华为云开发者联盟
园龄： 4年9个月
粉丝： 855
关注： 1

+加关注

2025年2月

日

一

二

三

四

五

六

一键Run带你体验扩散模型的魅力

一、什么是SORA?

二、SORA背后原理的推测

三、Stable Video Diffusion (SVD) 扩散模型的图像生成视频的体验

1. 案例简介

2. 下载代码和模型

3. 配置运行环境

4. 生成视频

公告

搜索

常用链接

我的标签

积分与排名

合集 (21)

随笔分类 (4020)

随笔档案 (4101)

阅读排行榜

评论排行榜

推荐排行榜

最新评论