08 2024 档案

摘要:ControlNet: Adding Conditional Control to Text-to-Image Diffusion Models link 时间:23.11 机构:Standford TL;DR 提出ControlNet算法模型,用来给一个预训练好的text2image的diffus 阅读全文
posted @ 2024-08-30 22:09 fariver 阅读(56) 评论(0) 推荐(0) 编辑
摘要:Transfusion: Predict the Next Token and Diffuse Images with One Multi-Modal Model link 时间:24.08 机构:Waymo & University of Southern California TL;DR 提出一 阅读全文
posted @ 2024-08-28 15:46 fariver 阅读(520) 评论(0) 推荐(0) 编辑
摘要:One-Stage 3D Whole-Body Mesh Recovery with Component Aware Transformer link 时间:CVPR2023 机构:粤港澳大湾区数字经济研究院(IDEA) && 清华大学深圳国际研究生院 TL;DR 使用一个纯Transformer结 阅读全文
posted @ 2024-08-28 14:25 fariver 阅读(39) 评论(0) 推荐(0) 编辑
摘要:展会见闻 从身体结构的维度 机械臂: 吸取小物体,放到另一个区域。机械弊对于这种任务在各种环境下都能精准完成,相对于人类有优势。 灵巧手: 看到各种自由度的手,手掌/手指正面覆盖了很多触觉传感器,有些甚至还布置了摄像头。 AGV: 仓库托运重物,物流机器人。 仿生机器人: 这类公司注重还原外形面部表 阅读全文
posted @ 2024-08-25 17:32 fariver 阅读(44) 评论(0) 推荐(0) 编辑
摘要:时间线 以下是一些重要的里程碑,它们代表了基于Diffusion的图像生成方法的发展: 时间&机构 名称 简述 - VAE Variational AutoEncoder,变分自编码器用于图像生成 2020.12 VQ-VAE Vector Quantized-Variational AutoEnc 阅读全文
posted @ 2024-08-23 20:24 fariver 阅读(50) 评论(0) 推荐(0) 编辑
摘要:Egocentric Whole-Body Motion Capture with FisheyeViT and Diffusion-Based Motion Refinement link 时间:CVPR2024 机构:马普所 & Saarland Informatics Campus & Goo 阅读全文
posted @ 2024-08-23 18:24 fariver 阅读(40) 评论(0) 推荐(0) 编辑
摘要:HandDiff: 3D Hand Pose Estimation with Diffusion on Image-Point Cloud HandDiff: 3D Hand Pose Estimation with Diffusion on Image-Point Cloud 时间:CVPR202 阅读全文
posted @ 2024-08-20 21:48 fariver 阅读(43) 评论(0) 推荐(0) 编辑
摘要:名称 Reconstructing Hands in 3D with Transformers 时间:CVPR2024 机构:UC Berkeley, University of Michigan, New York University TL;DR 本文提出一种使用Transformer来做Han 阅读全文
posted @ 2024-08-20 18:00 fariver 阅读(106) 评论(0) 推荐(0) 编辑
摘要:名称 Single-to-Dual-View Adaptation for Egocentric 3D Hand Pose Estimation 时间:CVPR2024 机构:The University of Tokyo TL;DR 多目3D hand pose estimation数据比较难标注 阅读全文
posted @ 2024-08-16 17:55 fariver 阅读(3) 评论(0) 推荐(0) 编辑
摘要:Multiple View Geometry Transformers for 3D Human Pose Estimation link 时间:CVPR2024 机构:University of Toronto && Southeast University && Microsoft Resear 阅读全文
posted @ 2024-08-13 21:35 fariver 阅读(51) 评论(0) 推荐(0) 编辑
摘要:DEFORMABLE DETR: DEFORMABLE TRANSFORMERS FOR END-TO-END OBJECT DETECTION link 时间:2021(ICLR) 机构:Sensetime & USTC & CUHK TL;DR 参考2D Deformable Conv,通过在R 阅读全文
posted @ 2024-08-07 17:31 fariver 阅读(36) 评论(0) 推荐(0) 编辑
摘要:DRIVEVLM: The Convergence of Autonomous Driving and Large Vision-Language Models DriveVLM 时间:24.02 机构:Tsinghua University && Li Auto TL;DR 当前自动驾驶落地的主要 阅读全文
posted @ 2024-08-07 16:45 fariver 阅读(182) 评论(0) 推荐(0) 编辑
摘要:背景 最近在准备了一次比较重要的汇报,发现写文档与准备汇报整个过程非常痛苦,进展也很缓慢,虽然最终也憋出了东西,但这种低效率让我感觉自己欠缺这方面的方法论。实际上类似的事情还比较常见,例如,向高层汇报、述职、商业BP、面试等场景都需要这种技能,于是决定花些时间总结一下这方面的经验。 材料准备 获取好 阅读全文
posted @ 2024-08-02 21:53 fariver 阅读(33) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示