文本转视频生成模型Sora浅析

北京时间2024年2月16日凌晨
OpenAI正式发布了文本生成视频模型Sora

原理浅析：
Sora是一种扩散模型。
使用Transformer架构。
将视频和图像数据表示为patch来训练模型。
Sora使用图片生成模型DALL-E3的重述提示词技术

目前存在的问题：
生成的部分视频对现实世界物理规律不能很好的表现出来

posted @ 2024-02-17 23:18 心使阅读(81) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· (林子雨教程)淘宝双十一数据分析可视化部分错误处归纳解决与可视化进一步完善

· 深度学习基础

· sora未来在哪里，是否改变世界？

· Sora文本生成视频模型

阅读排行：
· 震惊！C++程序真的从main开始吗？99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码？零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾（3.3-3.9）
· winform 绘制太阳，地球，月球运作规律

昵称：心使
园龄： 1年3个月
粉丝： 0
关注： 5

2025年3月

日

一

二

三

四

五

六

人工智能，数据挖掘，大数据，数学，其它问题记录