2024年3月的计算机视觉论文推荐

从去年开始,针对LLM的研究成为了大家关注的焦点。但是其实针对于计算机视觉的研究领域也在快速的发展。每周都有计算机视觉领域的创新研究,包括图像识别、视觉模型优化、生成对抗网络(gan)、图像分割、视频分析等。

我们今天来总结一下2024年3月上半月份发表的最重要的论文,无论您是研究人员、从业者还是爱好者,本文都将提供有关计算机视觉中最先进的技术和工具重要信息。

Diffusion Models

1. OOTDiffusion: Outfitting Fusion-based Latent Diffusion for Controllable Virtual Try-on

Outfitting over Try-on Diffusion (OOTDiffusion),利用预训练的潜在扩散模型的力量,设计了一种新颖的网络架构,可以现实和可控的虚拟试穿。论文提出了一个outfitting UNet来学习服装细节特征,并通过扩散模型去噪过程中的outfitting融合将其与目标人体融合。

在训练过程中引入了服装dropout,能够通过无分类器的指导来调整服装特征的强度。在VITON-HD和Dress Code数据集上的综合实验表明,OOTDiffusion可以有效地为任意人体和服装图像生成高质量的服装图像,

 

https://avoid.overfit.cn/post/3c01305dabf4473ca29bfea2e74f3473

posted @ 2024-03-18 18:19  deephub  阅读(59)  评论(0编辑  收藏  举报