02 2024 档案

去魅Sora

摘要：其实现原理非常像之前学的图像压缩的兄弟——视频压缩： VAE Encoder（变分视频压缩，将其压缩到低维的隐空间中降低计算量）借用Google DeepMind的NaViT (2023.07) 支持了原始比例和分辨率，从而使其采样灵活并提高取景构图能力。 Transform Diffusion 阅读全文

posted @ 2024-02-28 16:12 浪矢-CL 阅读(23) 评论(0) 推荐(0) 编辑

Sora文本生成视频模型

摘要：目录简介训练过程将可视化数据转化为patch使用不同分辨率、持续时间及纵横比的视频数据的优势关键点参考openAi提供的技术文档：https://openai.com/research/video-generation-models-as-world-simulators 简介 Sora 是一种通阅读全文

posted @ 2024-02-22 17:16 浪矢-CL 阅读(88) 评论(0) 推荐(0) 编辑

公告

昵称：浪矢-CL
园龄： 8年1个月
粉丝： 9
关注： 12

+加关注

2025年3月

日

一

二

三

四

五

六

浪矢\n

02 2024 档案

公告

搜索

常用链接

我的标签

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论