06 2024 档案

摘要:​引子 基于单目摄像头的深度估计,一直是CV领域的一个难点,之前也对此关注也不够多。偶然浏览技术博客,看到Depth Anything: Unleashing the Power of Large-Scale Unlabeled Data这个最新CVPR2024的工作。看到名字,大概也能猜出来这篇是 阅读全文
posted @ 2024-06-24 10:39 要养家的程序猿 阅读(325) 评论(0) 推荐(0) 编辑
摘要:引子 最近在关注多模态大模型,之前4月份的时候关注过CogVLM(https://blog.csdn.net/zzq1989_/article/details/138337071?spm=1001.2014.3001.5501)。模型整体表现还不错,不过不支持中文。智谱AI刚刚开源了GLM-4大模型 阅读全文
posted @ 2024-06-17 11:51 要养家的程序猿 阅读(119) 评论(0) 推荐(0) 编辑
摘要:​引子 最近看新闻博客说零一科技的Yi-VL-Plus视觉大模型效果很不错,那就想着尝尝鲜。这是第四篇关于视觉大模型的博客。之前有写过一篇零一科技的chat大模型零一科技Yi-34B Chat大模型环境搭建&推理_python部署大模型yi-34b-chat-CSDN博客,感兴趣的童鞋可以移步。我个 阅读全文
posted @ 2024-06-11 09:22 要养家的程序猿 阅读(103) 评论(0) 推荐(0) 编辑
摘要:​引子 两个多月前YOLOv9发布(感兴趣的童鞋可以移步YOLOv9环境搭建&推理测试_yolov9安装-CSDN博客),这才过去这么短的时间,YOLOv10就横空出世了。现在YOLO系列搞得就和追剧一样了。。。OK,那就让我们开始吧。 一、模型介绍 1、作者提出了一种新颖的一致性双重分配策略,用于 阅读全文
posted @ 2024-06-03 10:49 要养家的程序猿 阅读(905) 评论(0) 推荐(0) 编辑