文本转视频生成模型Sora浅析

OpenAI官网Sora介绍:https://openai.com/sora
OpenAI官网Sora研究:https://openai.com/research/video-generation-models-as-world-simulators

北京时间2024年2月16日凌晨
OpenAI正式发布了文本生成视频模型Sora

原理浅析:
Sora是一种扩散模型。
使用Transformer架构。
将视频和图像数据表示为patch来训练模型。
Sora使用图片生成模型DALL-E3的重述提示词技术

目前存在的问题:
生成的部分视频对现实世界物理规律不能很好的表现出来

参考资料:
https://news.cnblogs.com/n/764709/
https://www.jiqizhixin.com/articles/2024-02-16-9

posted @   心使  阅读(81)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律
点击右上角即可分享
微信分享提示