每张图像都是现实世界的反映,而现实世界都是三维的。为什么我们看到一张图片时会觉得有远近的概念?是由于我们有先验知识。我们知道物理世界是三维的,而我们看到的是二维的,在我们的脑海里会很自然地将物体的大小与距离远近进行联系在一起,从而在大脑里脑补它们在现实世界中的排列情况。虽然有些时候我们也会判断错误,因为有些图片单靠一张是容易出现错觉的。
比如下面一张图片:
我们人可以感知到,这是一条小径,小径周围是石头和假山,山上爬满爬山虎。而由一张图像如何恢复三维数据呢?在摄影中有一种概念叫景深,就算近处的物体比较清晰,远处的物体比较模糊。而且还有一个概念叫透视,在绘画领域人们都知道用透视法绘图。由这张实景拍摄的照片也可以看出,近处的路比较宽,远处的路比较窄。如何才能恢复这些不规则形状的石头呢?
单相片建模方法研究
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
· 没有源码,如何修改代码逻辑?
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· 上周热点回顾(2.24-3.2)
2018-01-23 Portal:Machine learning机器学习:门户
2017-01-23 高翔《视觉SLAM十四讲》从理论到实践