摘要:
简介论文排版要求. 阅读全文
posted @ 2025-05-29 08:48
qsBye
阅读(3576)
评论(0)
推荐(0)
基于视觉语言大模型(VLM)的无人机室内自主侦察仿真.实现无人机自主起飞, 避开障碍物以及穿过门洞进入第二个房间, 移动到字母`B`前面发射激光. 阅读全文
使用dokcer/podman本地部署基于深度学习的深度估计(depth estimate)模块, 从单目图像中获取深度信息, 使用gradio_client调用api获取深度信息. 阅读全文
使用ollama调用minicpm-v模型进行视觉场景认知, 然后将结果传递到deepseek进行移动决策和函数调用, 实现模拟控制机器人在场景中移动. 阅读全文