摘要:
ControlNet: Adding Conditional Control to Text-to-Image Diffusion Models link 时间:23.11 机构:Standford TL;DR 提出ControlNet算法模型,用来给一个预训练好的text2image的diffus 阅读全文
摘要:
Transfusion: Predict the Next Token and Diffuse Images with One Multi-Modal Model link 时间:24.08 机构:Waymo & University of Southern California TL;DR 提出一 阅读全文
摘要:
One-Stage 3D Whole-Body Mesh Recovery with Component Aware Transformer link 时间:CVPR2023 机构:粤港澳大湾区数字经济研究院(IDEA) && 清华大学深圳国际研究生院 TL;DR 使用一个纯Transformer结 阅读全文
摘要:
展会见闻 从身体结构的维度 机械臂: 吸取小物体,放到另一个区域。机械弊对于这种任务在各种环境下都能精准完成,相对于人类有优势。 灵巧手: 看到各种自由度的手,手掌/手指正面覆盖了很多触觉传感器,有些甚至还布置了摄像头。 AGV: 仓库托运重物,物流机器人。 仿生机器人: 这类公司注重还原外形面部表 阅读全文
摘要:
时间线 以下是一些重要的里程碑,它们代表了基于Diffusion的图像生成方法的发展: 时间&机构 名称 简述 - VAE Variational AutoEncoder,变分自编码器用于图像生成 2020.12 VQ-VAE Vector Quantized-Variational AutoEnc 阅读全文
摘要:
Egocentric Whole-Body Motion Capture with FisheyeViT and Diffusion-Based Motion Refinement link 时间:CVPR2024 机构:马普所 & Saarland Informatics Campus & Goo 阅读全文
摘要:
HandDiff: 3D Hand Pose Estimation with Diffusion on Image-Point Cloud HandDiff: 3D Hand Pose Estimation with Diffusion on Image-Point Cloud 时间:CVPR202 阅读全文
摘要:
名称 Reconstructing Hands in 3D with Transformers 时间:CVPR2024 机构:UC Berkeley, University of Michigan, New York University TL;DR 本文提出一种使用Transformer来做Han 阅读全文
摘要:
名称 Single-to-Dual-View Adaptation for Egocentric 3D Hand Pose Estimation 时间:CVPR2024 机构:The University of Tokyo TL;DR 多目3D hand pose estimation数据比较难标注 阅读全文
摘要:
Multiple View Geometry Transformers for 3D Human Pose Estimation link 时间:CVPR2024 机构:University of Toronto && Southeast University && Microsoft Resear 阅读全文