2024 年 8月随笔档案 - fariver

[Paper Reading] ControlNet: Adding Conditional Control to Text-to-Image Diffusion Models

摘要：ControlNet: Adding Conditional Control to Text-to-Image Diffusion Models link 时间：23.11 机构：Standford TL;DR 提出ControlNet算法模型，用来给一个预训练好的text2image的diffus 阅读全文

posted @ 2024-08-30 22:09 fariver 阅读(56) 评论(0) 推荐(0) 编辑

[Paper Reading] Transfusion: Predict the Next Token and Diffuse Images with One Multi-Modal Model

摘要：Transfusion: Predict the Next Token and Diffuse Images with One Multi-Modal Model link 时间：24.08 机构：Waymo & University of Southern California TL;DR 提出一阅读全文

posted @ 2024-08-28 15:46 fariver 阅读(520) 评论(0) 推荐(0) 编辑

[Paper Reading] One-Stage 3D Whole-Body Mesh Recovery with Component Aware Transformer

摘要：One-Stage 3D Whole-Body Mesh Recovery with Component Aware Transformer link 时间：CVPR2023 机构：粤港澳大湾区数字经济研究院(IDEA) && 清华大学深圳国际研究生院 TL;DR 使用一个纯Transformer结阅读全文

posted @ 2024-08-28 14:25 fariver 阅读(39) 评论(0) 推荐(0) 编辑

[行业调研] 2024世界机器人大会

摘要：展会见闻从身体结构的维度机械臂: 吸取小物体，放到另一个区域。机械弊对于这种任务在各种环境下都能精准完成，相对于人类有优势。灵巧手: 看到各种自由度的手，手掌/手指正面覆盖了很多触觉传感器，有些甚至还布置了摄像头。 AGV: 仓库托运重物，物流机器人。仿生机器人: 这类公司注重还原外形面部表阅读全文

posted @ 2024-08-25 17:32 fariver 阅读(44) 评论(0) 推荐(0) 编辑

[思考] Diffusion Model

摘要：时间线以下是一些重要的里程碑，它们代表了基于Diffusion的图像生成方法的发展：时间&机构名称简述 - VAE Variational AutoEncoder，变分自编码器用于图像生成 2020.12 VQ-VAE Vector Quantized-Variational AutoEnc 阅读全文

posted @ 2024-08-23 20:24 fariver 阅读(50) 评论(0) 推荐(0) 编辑

[Paper Reading] Egocentric Whole-Body Motion Capture with FisheyeViT and Diffusion-Based Motion Refinement

摘要：Egocentric Whole-Body Motion Capture with FisheyeViT and Diffusion-Based Motion Refinement link 时间：CVPR2024 机构：马普所 & Saarland Informatics Campus & Goo 阅读全文

posted @ 2024-08-23 18:24 fariver 阅读(40) 评论(0) 推荐(0) 编辑

[Paper Reading] HandDiff: 3D Hand Pose Estimation with Diffusion on Image-Point Cloud

摘要：HandDiff: 3D Hand Pose Estimation with Diffusion on Image-Point Cloud HandDiff: 3D Hand Pose Estimation with Diffusion on Image-Point Cloud 时间：CVPR202 阅读全文

posted @ 2024-08-20 21:48 fariver 阅读(43) 评论(0) 推荐(0) 编辑

[Paper Reading] Reconstructing Hands in 3D with Transformers

摘要：名称 Reconstructing Hands in 3D with Transformers 时间：CVPR2024 机构：UC Berkeley, University of Michigan, New York University TL;DR 本文提出一种使用Transformer来做Han 阅读全文

posted @ 2024-08-20 18:00 fariver 阅读(106) 评论(0) 推荐(0) 编辑

[Paper Reading] Single-to-Dual-View Adaptation for Egocentric 3D Hand Pose Estimation

摘要：名称 Single-to-Dual-View Adaptation for Egocentric 3D Hand Pose Estimation 时间：CVPR2024 机构：The University of Tokyo TL;DR 多目3D hand pose estimation数据比较难标注阅读全文

posted @ 2024-08-16 17:55 fariver 阅读(3) 评论(0) 推荐(0) 编辑

[Paper Reading] Multiple View Geometry Transformers for 3D Human Pose Estimation

摘要：Multiple View Geometry Transformers for 3D Human Pose Estimation link 时间：CVPR2024 机构：University of Toronto && Southeast University && Microsoft Resear 阅读全文

posted @ 2024-08-13 21:35 fariver 阅读(51) 评论(0) 推荐(0) 编辑

[Paper Reading] DEFORMABLE DETR: DEFORMABLE TRANSFORMERS FOR END-TO-END OBJECT DETECTION

摘要：DEFORMABLE DETR: DEFORMABLE TRANSFORMERS FOR END-TO-END OBJECT DETECTION link 时间：2021(ICLR) 机构：Sensetime & USTC & CUHK TL;DR 参考2D Deformable Conv，通过在R 阅读全文

posted @ 2024-08-07 17:31 fariver 阅读(36) 评论(0) 推荐(0) 编辑

[Paper Reading] DRIVEVLM: The Convergence of Autonomous Driving and Large Vision-Language Models

摘要：DRIVEVLM: The Convergence of Autonomous Driving and Large Vision-Language Models DriveVLM 时间：24.02 机构：Tsinghua University && Li Auto TL;DR 当前自动驾驶落地的主要阅读全文

posted @ 2024-08-07 16:45 fariver 阅读(182) 评论(0) 推荐(0) 编辑

[思考] 做好一次重要的汇报

摘要：背景最近在准备了一次比较重要的汇报，发现写文档与准备汇报整个过程非常痛苦，进展也很缓慢，虽然最终也憋出了东西，但这种低效率让我感觉自己欠缺这方面的方法论。实际上类似的事情还比较常见，例如，向高层汇报、述职、商业BP、面试等场景都需要这种技能，于是决定花些时间总结一下这方面的经验。材料准备获取好阅读全文

posted @ 2024-08-02 21:53 fariver 阅读(33) 评论(0) 推荐(0) 编辑

fariver

08 2024 档案

公告

搜索

常用链接

我的标签

积分与排名

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论