2024年5月计算机视觉论文推荐:包括扩散模型、视觉语言模型、图像编辑和生成、视频处理和生成以及图像识别等各个主题

我们今天总结下2024年5月发表的最重要的论文,重点介绍了计算机视觉领域的最新研究和进展,包括扩散模型、视觉语言模型、图像编辑和生成、视频处理和生成以及图像识别等各个主题。

Diffusion Models

1、Dual3D: Efficient and Consistent Text-to-3D Generation with Dual-mode Multi-view Latent Diffusion

Dual3D是一个新的文本到3D生成框架,可以在1分钟内从文本生成高质量的3D图像。

 

https://avoid.overfit.cn/post/f3bbe390f1024ab68fa6f16e44d1305a

posted @ 2024-05-25 10:28  deephub  阅读(31)  评论(0编辑  收藏  举报