3D视觉-NeRF、3dgs、SLAM、点云、CG和就业、科研经验

复旦机器人学院的实验室

Fudan Vision and Learning Laboratory

Yixin Cao https://taominer.github.io/
Jingjing Chen https://jingjing1.github.io/
Zhineng Chen https://zhinchenfd.github.io/
Yanwei Fu https://yanweifu.github.io/ 付老师还是太强了，在复旦能拿这么多引用
Xingjun Ma http://xingjunma.com/
Zuxuan Wu https://zxwu.azurewebsites.net/

FudanNLP
Xuanjing Huang https://xuanjing-huang.github.io/
Xipeng Qiu https://xpqiu.github.io/en.html
Xinchi Chen https://dalstonchen.github.io/
Qi Zhang http://qizhang.info/
Tao Gui https://guitaowufeng.github.io/

Jiayuan Fan https://fansarah.github.io/

Cao, Yixin https://taominer.github.io/
Research Institute of Intelligent Complex Systems
https://faculty.fudan.edu.cn/syleng/zh_CN/index.htm
感觉你旦机器人学院能看的老师也就这些了

无人系统实验室

HKUST Aerial Robotics Group
SmarT Autonomous Robotics Group
FAST Lab
Fudan Magic Lab
RAPID LABORATORY

SLAM

近三年SLAM相关论文集 paper list
浙大CAD Guofeng Zhang
邹丹平结构的slam
ORB-SLAM / ORB-SLAM2原理解读+代码解析（汇总了资料，方便大家学习）
ORB_SLAM
ORB-SLAM2：一种单目、立体和 RGB-D 相机的开源 SLAM 系统
我们提出了ORB-SLAM2一个完整的SLAM系统，用于单目、立体和 RGB-D 相机，包括地图重用、闭环和重新定位功能。该系统在各种环境中的标准CPU上实时工作，从小型手持室内序列到在工业环境中飞行的无人机和在城市周围行驶的汽车。我们的后端基于具有单目和立体观察的捆绑调整，允许使用公制尺度进行准确的轨迹估计。我们的系统包括一个轻量级的定位模式，该模式利用视觉里程计轨迹用于未建图的区域，并匹配允许零漂移定位的地图点。对29个流行的公共序列的评估表明，我们的方法达到了最先进的精度，在大多数情况下是最准确的SLAM解决方案。我们发布源代码，不仅是为了SLAM社区的利益，而且旨在为其他领域的研究人员提供开箱即用的SLAM解决方案。
Scene Representation Group

图形学介绍notes

什么是计算机图形学中科大刘
 中科大2024年计算机图形学
在计算机中表示图形、以及利用计算机进行图形的计算、处理和显示的相关原理与算法。广义上包括二维与三维。
计算机图形学：用计算机画图像。

计算机图形学课程

GAMES101
清华计算机图形学课程
 中国科学技术大学《计算机图形学》本科课程
 中国科学技术大学《计算机图形学》本科课程Computer Graphics (00106501)（2024年春夏学期）
现代OpenGL保姆级课程，从零开始打造3D游戏引擎
 计算机图形学全套算法讲解和C++编码实现（共23讲配套源码）

SIGGRAPH

渲染 (Rendering)：包括光线传输模拟 (light transport simulation)，实时渲染 (real-time rendering)，采样 (sampling)，反射率捕获 (reflectance capture)，相交的数据结构 (data-structures for intersections) 以及非真实感渲染 (non-photorealistic rendering)。
动画与模拟仿真 (Animation and simulation)：包括角色动画 (character animation)，运动捕捉和绑定/蒙皮 (motion capture and rigging/skinning)，电影摄影/相机路径规划 (cinematography/camera path planning)，可变形模型 (deformable models) 以及流体、衣服、头发或声音模拟 (fluid, cloth, hair or sound simulation)，包括与这些主题有关的几何或拓扑问题 (geometric or topology problems)。
几何 (Geometry)：包括基于点、体素、网格的几何处理和建模 (geometry processing and modeling)，以及拓扑 (topology)，映射 (mapping)，矢量场 (vector fields) 和形状收集分析 (shape collection analysis)，此外还包括基于图像的建模 (image-based modeling)。
图像 (Images)：包括图像和视频处理 (image and video processing)，纹理合成和编辑 (texture synthesis and editing)，图像分割 (image segmentation)，绘图 (drawing)，草图 (sketching) 和插图 (illustration)，图像本征分解 (intrinsic decomposition) 或计算摄影 (computational photography)，此外还包括更依赖图像技术的基于图像的渲染 (image-based rendering)。
虚拟现实 (Virtual Reality)：包括虚拟和增强现实 (virtual and augmented reality)，3D显示 (3d displays) 和交互 (interactions)。
制造 (Fabrication)：包括3D打印 (3d printing)，编织或焦散设计 (knitting or caustic design)。
一个图形学研究牲的论文投稿心得
 计算机图形学（渲染方向）学习全攻略——学术科研篇
 计算机图形学（几何与建模方向）学习全攻略——学术科研篇

Job description

图形图像算法实习生-剪映-上海
岗位职责
ByteIntern：面向2025届毕业生（2024年9月-2025年8月期间毕业），为符合岗位要求的同学提供转正机会。
团队介绍：字节跳动剪映研发团队，主要支持剪映、醒图、Faceu 等多款国内外产品的研发工作，业务覆盖多元化影像创作场景，截止2021年6月，相关产品多次登顶国内外App Store 免费应用榜第一，并继续保持高速增长。加入我们，一起打造全球最受用户欢迎的影像创作产品。
1、负责计算机图形学和计算机视觉等相关算法的研发和实现；
2、负责计算机图形学和计算机视觉相关技术的前沿研究，为产品应用提出人工智能解决方案和模型；
3、开发新技术的原型系统。
岗位要求
1、2025届本科及以上学历在读，在计算机图形学、计算机视觉、计算数学或计算机动画等一个或多个领域有较深入的研究，包括但不限于：数值计算、几何处理、物理仿真、角色动画、生成模型(GAN、VAE等)、手机端图像处理；
2、有科研经验、在NeurIPS、CVPR、ICCV、ECCV、ICLR、ICML、TPAMI、IJCV、SIGGRAPH、ToG、TVCG等国际顶刊、顶会上发表过论文者优先；
3、扎实的数学和算法基础：概率统计、数值优化算法，并对网格处理算法有深刻理解；
4、可以处理大规模数据，利用PyTorch、TensorFlow等框架搭建神经网络，并进行大规模训练；
5、熟悉Python和C++，熟悉基础数据结构和算法；
6、拥有快速学习新技术的能力，能够在较短时间内理解前沿论文，有独立思考的能力；
7、能与团队融洽合作相处，积极主动有热情；
8、每周出勤至少4天，可实习4个月以上。

3D视觉

CCCV2017讲习班笔记-基于图像的大规模场景三维重建（上）
CCCV2017讲习班笔记-基于图像的大规模场景三维重建（下）

一些课程收集

VALSE Webinar Slides
games104

16-825: Learning for 3D Vision Fall 2025 课程主页&课程表&ppt

https://learning3d.github.io/
https://learning3d.github.io/schedule.html

CMU robotics lab

https://www.ri.cmu.edu/research/labs-groups/

3DV 2026

https://3dvconf.github.io/2026/
International Conference on 3D Vision 2026
Paper Submission August 18, 2025
Suppl. Material August 21, 2025
Reviews due October 09, 2025
Paper Notification November 05, 2025
Dissertation Award Pre-nomination November 07, 2025
Dissertation Award Nomination December 01, 2025
Nectar Track Submissions February 15, 2026
Main conference March 20-23, 2026
Author registration deadline: January 20, 2026
Early registration deadline: March 1, 2026
The 13th International Conference on 3D Vision will be held in-person at the Vancouver Convention Centre in Vancouver, BC, Canada, from March 20 to 23, 2026.
a broad variety of topics in 3D computer vision and graphics, from novel optical sensors, signal processing, geometric modeling, representations, to reconstruction, visualization, analysis, rendering, interaction, and a variety of applications.

NeRF&重建&3dgs

原始论文
3D Gaussian Splatting: A beginner friendly introduction to 3D Gaussian Splats and tutorial on how to train them.
3D Gaussian Splatting for Real-Time Radiance Field Rendering
NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis
解读
据说是Nerf方向讲的最好的blog:NeRF: A Volume Rendering Perspective
神经辐射场（Nerf）论文讲解
 CVPR'23｜一张图重建3D人物新思路：完美复刻复杂动作和宽松衣物，遮挡也不在话下
 3D GAUSSIAN AS A NEW VISION ERA: A SURVEY
3D Gaussian Splatting for Real-Time Radiance Field Rendering SIGGRAPH 2023 (ACM Transactions on Graphics)
3d高斯笔记
 3D Gaussian Splatting for Real-Time Radiance Field Rendering
Instant Neural Graphics Primitives with a Multiresolution Hash Encoding 翻译
蔚蓝海岸大学（Université Côte d’Azur）是法国蔚蓝海岸地区新成立的高等教育大学机构集群，汇集了蔚蓝海岸地区主要的高等教育和研究机构。蔚蓝海岸大学旨在根据各学科间的新型互动，研究、教学与创新间的新型合作方式以及与企业和地方政府间的坚实合作关系，创办21世纪新型的法国大学模式
蔚蓝海岸（UCA）大学是一所研究密集型多学科大学，2016年获得了“卓越计划”的荣誉称号和资助。UCA在各成员的研究团队之间建立了协同效应，其研究团队涵盖的科学领域主要由4个组织负责：
法国国家科研中心（CNRS）—蔚蓝海岸区域
法国国家信息与自动化研究所（Inria）—地中海区域
蔚蓝海岸天文台（OCA）
尼斯-索菲亚·昂蒂波利斯大学（UNS）
CV&ML领域，Inria有两个很强的组， Willow 和 THOTH
Willow
THOTH
THOTH的Team Leader Cordelia Schmid
Cordelia Schmid的research.google
果然大佬的学生也是大佬
Product Quantization-Jegou Searching with Quantization

3dgs复现

一、3dgs的安装及环境配置
带图原版教程：https://blog.csdn.net/weixin_64588173/article/details/138140240
二、训练过程quick start
运行时保持是从gaussian-splatting目录下开始输入
1.视频截取帧
用自己手机拍摄的一段视频，一两分钟即可
（用自己的笔记本（4060 8G），大概训练了两个小时左右）
1.1 gaussian-splatting目录下新建一个data文件夹
1.2将你拍摄的视频移动到该data文件夹下
1.3将你的视频改名为input，后缀.mp4不用改
1.4在data文件夹里再建一个与视频同名的文件夹，名字也是input
1.5终端（win+R或搜索cmd）里从gaussian-splatting/data目录下开始输入命令
cd data
ffmpeg -i input.mp4 -vf "setpts=0.2*PTS" input\input_%04d.jpg #推荐运行这个指令
ffmpeg -i input.mp4 -vf "setpts=0.2*PTS,fps=1" input\input_%04d.jpg #如果需要调整抽帧频率可以参考这个指令,选择一个运行即可

setpts=0.2*PTS 将视频播放速度加快到原来的 5 倍。这意味着原视频的每秒帧数增加到 5 倍。

如果原始视频是 30 FPS，加速后的视频将以 150 FPS 播放。

尽管视频播放速度加快了，ffmpeg fps=1 会以每秒一帧的频率提取图片。

2.产生点云
终端gaussian-splatting目录下输入
python convert.py -s data
用安装的colmap产生点云，会花费一些时间

3.查看点云
colmap窗口出现后，选择file->import model
选择文件夹：gaussian-splatting/data/sparse/0，确定
遇到弹窗×掉
可以看到生成的点云，红色相机路径。

4.开始训练
anaconda prompt或anaconda prompt在进入3dgs的虚拟环境终端里
gaussian-splatting目录下输入
python train.py -s data -m data/output
训练时间要看电脑的配置
进入虚拟环境(conda activate 3dgs)非常重要，否则可能缺少pytorch

5.查看结果
终端里gaussian-splatting目录（把viewers文件夹移到gaussian-splatting里）下输入
.\viewers\bin\SIBR_gaussianViewer_app -m data/output

6.控制视角变换
w uio

asd jkl

（功能可以尝试体会）

点云

3D点云基础知识

diffusion notes

计算机视觉notebook包括stable diffusion

自动驾驶入门

985车辆工程想往无人驾驶，智能车，车联网方向发展，大学期间应该具体自学哪些课程and知识? - 叶小飞的回答 - 知乎
https://www.zhihu.com/question/365211638/answer/2022021463
叶小飞老师也是一位很励志的EE学子。

CG & digital media lab

上交数字媒体实验室
 陈宝权：IT筑梦，挑战无限可能
 图形计算与感知交互安徽省重点实验室
 图形学就业方向&&春招纪实
 清华胡事民
 浙大周昆
 浙大CAD实验室风评
 浙大计算机cadcg实验室周晓巍教授
 Kun Xu,Graphics and Geometric Computing Group,Tsinghua Univeristy
Lingqi Yan（闫令琪） Assistant Professor
Frédo Durand斯隆奖获得者，曾获SIGGRAPH 计算机图形学成就奖。「AI全球最具影响力学者榜单」上，他荣登计算机图形学领域Top 1。
nju meta
拥有清华、微软、北大三重title，计算机图形学领域新星王鹏帅：我喜欢持之以恒做高质量研究

lab & teacher
【英雄帖】西湖大学远兮实验室招生
 清华本博计算机系易冉上交计算机助理教授
 马利庄 cg&cv偏cv Digital Media and Computer Vision Laboratory
Xubo Yang 流体物理模拟上交软院教授数字媒体实验室dalab
肖双九
 中山大学成慧

计算摄影

计算摄影笔记
 计算摄影课程

计算机视觉导论图灵班笔记

计算机视觉导论

视觉lab

复旦大学视觉与学习实验室
 MIT EECS Rising star

科研方法论

科研基本素养pdf-彭思达

博士生应该具有的意识与能力、如何锻炼这些能力、如何做research project

learning_research_github_5.6k_stars

科学写作

《Writing Science: How to Write Papers That Get Cited and Proposals That Get Funded》

教材与在线课程：
《Computer Vision: Algorithms and Applications》– Richard Szeliski
《Deep Learning for Computer Vision》– Adrian Rosebrock
Coursera上的“Computer Vision Specialization”系列课程
Udacity的“Computer Vision Nanodegree”
编程与工具：
编程语言：Python（推荐使用Anaconda发行版）
深度学习框架：TensorFlow, PyTorch
图像处理库：OpenCV
开发环境：Jupyter Notebook, VS Code
论文数据库：
IEEE Xplore（ https://ieeexplore.ieee.org/ ）
ACM Digital Library（ https://dl.acm.org/ ）
arXiv（ https://arxiv.org/ ）
Google Scholar（ https://scholar.google.com/ ）

Zotero（https://www.zotero.org

官方网站 Zotero
简介
Zotero 是一个免费的开源文献管理工具，旨在帮助研究人员收集、组织、引用和分享研究资源。它由乔治·梅森大学（George Mason University）开发和维护。
主要功能
文献收集：通过浏览器插件（如 Zotero Connector），用户可以轻松地从网页、数据库和在线图书馆中捕捉文献的元数据（如标题、作者、出版信息等）。
组织管理：支持创建文件夹（“集合”）和标签，方便用户对文献进行分类和检索。
引用生成：集成多种引用样式（如 APA、MLA、Chicago），可以直接在文本编辑器中插入引用和生成参考文献列表。
同步与备份：支持云同步，用户可以在多台设备上访问和管理自己的文献库，同时提供备份功能以防数据丢失。
团队协作：允许用户创建和加入共享文献库，方便团队成员之间的资源共享和协作。
附加功能：支持注释、全文搜索、PDF高亮和笔记功能，增强文献管理和研究效率。
优点
开源与免费：Zotero 完全免费，且其开源性质允许用户根据需求进行自定义和扩展。
灵活性强：支持多种引用样式，并且可以自定义样式，适应不同学术领域的需求。
社区支持：拥有活跃的用户社区和丰富的插件，扩展功能多样。
易用性高：界面友好，操作简便，适合各类用户从初学者到高级研究人员。
缺点
存储限制：免费账户的云存储空间有限，虽然可以通过第三方存储服务（如 Dropbox）进行扩展，但需要一定的技术配置。
功能扩展依赖插件：某些高级功能需要依赖社区开发的插件，可能需要用户自行安装和配置。
使用方法
安装：
访问 Zotero 官网下载并安装 Zotero 桌面版。
安装浏览器插件（Zotero Connector）以便于从网页中捕捉文献信息。
添加文献：
使用浏览器插件在访问文献页面时点击插件图标，自动导入文献信息。
手动添加文献：在 Zotero 中点击“新建项目”按钮，手动输入文献信息。
组织文献：
创建“集合”文件夹，将相关文献拖拽到对应文件夹中。
添加标签和注释，便于后续检索和管理。
引用与写作：
在文本编辑器中安装相应的 Zotero 插件（如 Word 或 LibreOffice 插件）。
在写作过程中，点击插件按钮插入引用，并自动生成参考文献列表。
同步与备份：
创建 Zotero 账户，并在设置中启用同步功能，将文献库上传至云端。
定期备份本地数据库，确保数据安全。
Kaggle（ https://www.kaggle.com/ ）：参与数据竞赛，提升实战能力
GitHub（ https://github.com/ ）：查找开源项目，学习他人代码

posted @ 2024-04-28 19:58 asandstar 阅读(1361) 评论(0) 收藏举报

刷新页面返回顶部

asandstar