11 2023 档案

摘要:前言 北京大学和其他机构的研究人员近期提出了一种名为Video-LLaVA的视觉语言大模型。该模型的创新之处在于能够同时处理图片和视频作为输入。在处理图片的任务中,该模型展现出了出色的性能,在多个评估榜单中名列前茅,尤其在视频方面取得了令人瞩目的成绩。这项研究的关键点在于关注如何将LLM的输入统一起 阅读全文
posted @ 2023-11-30 18:53 CV技术指南(公众号) 阅读(818) 评论(0) 推荐(0) 编辑
摘要:前言 作者表示,这种全新注意力机制(Sytem 2 Attention)或许你也需要呢。 本文转载自机器之心 仅用于学术分享,若侵权请联系删除 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 CV各大方向专栏与各个部署框架最全教程整理 【CV技术指 阅读全文
posted @ 2023-11-28 12:53 CV技术指南(公众号) 阅读(40) 评论(0) 推荐(0) 编辑
摘要:前言 在本文中,我们将探讨聚类算法的各种评估指标,何时使用它们,以及如何使用Scikit-Learn计算它们。 本文转载自Deephub Imba 作者:Roi Yehoshua 仅用于学术分享,若侵权请联系删除 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、C 阅读全文
posted @ 2023-11-27 13:50 CV技术指南(公众号) 阅读(2353) 评论(0) 推荐(0) 编辑
摘要:前言 我们该如何优化 Meta 的「分割一切」模型,PyTorch 团队撰写的这篇博客由浅入深的帮你解答。 本文转载自机器之心 仅用于学术分享,若侵权请联系删除 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 CV各大方向专栏与各个部署框架最全教程 阅读全文
posted @ 2023-11-25 13:01 CV技术指南(公众号) 阅读(146) 评论(0) 推荐(0) 编辑
摘要:前言 胰腺癌,素有“癌症之王”的称号,平均五年生存率不到10%,是中国乃至全球生存率最低的恶性肿瘤。80%的胰腺癌一旦发现就是晚期,发病凶猛,极难治愈;目前临床指南缺乏有效筛查手段,因为容易出现漏诊或误诊。体检及医院常用的平扫CT图像对比度低,很难识别早期胰腺病变。11月21日,国际顶级医学期刊《N 阅读全文
posted @ 2023-11-24 12:53 CV技术指南(公众号) 阅读(79) 评论(0) 推荐(0) 编辑
摘要:前言 如何刻画网络的优化性质呢?在优化相关的论文中,通常通过分析 Hessian 矩阵及其特征值,或者将损失函数进行一维或二维的可视化来分析网络的优化性质。我们希望这些指标能够帮助我们更好的理解网络损失的 landscape,优化器优化轨迹的性质等等。我们希望将这些指标刻画的性质与优化器的设计关联起 阅读全文
posted @ 2023-11-23 12:47 CV技术指南(公众号) 阅读(173) 评论(0) 推荐(0) 编辑
摘要:前言 近日,微软公司召开最新一场 Ignite 大会,CEO 萨提亚・纳德拉在大会上介绍了 100 多项产品和技术的发布与更新,涉及范围非常广泛,包括应用、生产力以及安全性等多个方面。 本文转载自机器之心 仅用于学术分享,若侵权请联系删除 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新 阅读全文
posted @ 2023-11-22 14:54 CV技术指南(公众号) 阅读(213) 评论(0) 推荐(0) 编辑
摘要:前言 大模型正变得越来越“像人”,但事实真是如此吗?现在,一篇发表Nature上的文章,直接否决了这个观点——所有大模型,都不过是在玩角色扮演而已! 本文转载自量子位 仅用于学术分享,若侵权请联系删除 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 阅读全文
posted @ 2023-11-20 12:45 CV技术指南(公众号) 阅读(50) 评论(0) 推荐(0) 编辑
摘要:前言 本文介绍了一项近似注意力机制新研究,耶鲁大学、谷歌研究院等机构提出了 HyperAttention,使 ChatGLM2 在 32k 上下文长度上的推理时间快了 50%。 本文转载自机器之心 仅用于学术分享,若侵权请联系删除 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪 阅读全文
posted @ 2023-11-19 14:03 CV技术指南(公众号) 阅读(91) 评论(0) 推荐(0) 编辑
摘要:前言 单精度矩阵乘法(SGEMM)几乎是每一位学习 CUDA 的同学绕不开的案例,这个经典的计算密集型案例可以很好地展示 GPU 编程中常用的优化技巧。本文将详细介绍 CUDA SGEMM 的优化手段,适合认真阅读过《CUDA C++Programming Guide》,具备一定 CUDA 编程基础 阅读全文
posted @ 2023-11-18 14:47 CV技术指南(公众号) 阅读(523) 评论(0) 推荐(0) 编辑
摘要:前言 本文介绍了深度学习中精简模型的技术:量化和蒸馏。 本文转载自DeepHub IMBA 作者:Aaditya ura 仅用于学术分享,若侵权请联系删除 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 CV各大方向专栏与各个部署框架最全教程整理 阅读全文
posted @ 2023-11-16 13:29 CV技术指南(公众号) 阅读(100) 评论(0) 推荐(0) 编辑
摘要:前言 近年来,Transformer 已经成为了 NLP 和 CV 等领域的主流模型,但庞大的模型参数限制了它的高效训练和推理。于是字节跳动在 2019 年 12 月和 2021 年 6 月分别推出了高效推理和训练引擎 LightSeq,大大加速了 Transformer 系列模型的训练和推理,也打 阅读全文
posted @ 2023-11-16 13:24 CV技术指南(公众号) 阅读(192) 评论(0) 推荐(0) 编辑
摘要:前言 GPT-4V 在工业图像异常检测、工业图像异常定位、点云异常检测、逻辑异常检测、医学图像异常检测、交通检测、行人检测和时序检测等领域都展示出了出色的潜力。 本文转载自机器之心 仅用于学术分享,若侵权请联系删除 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、 阅读全文
posted @ 2023-11-13 17:28 CV技术指南(公众号) 阅读(111) 评论(0) 推荐(0) 编辑
摘要:前言 自 LLM 诞生以来,我们见到了很多把 LLM 接到 Vision Backbone 后面的算法,那么有两个自然的问题:(1)LLM 的 Transformer 是否可以直接处理视觉 Token?(2)LLM 的 Transformer 是否可以提升处理视觉 Token 的 Performan 阅读全文
posted @ 2023-11-11 23:44 CV技术指南(公众号) 阅读(254) 评论(0) 推荐(0) 编辑
摘要:前言 难道 Transformer 注定无法解决「训练数据」之外的新问题? 本文转载自机器之心 仅用于学术分享,若侵权请联系删除 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 CV各大方向专栏与各个部署框架最全教程整理 【CV技术指南】CV全栈指 阅读全文
posted @ 2023-11-10 15:55 CV技术指南(公众号) 阅读(11) 评论(0) 推荐(0) 编辑
摘要:前言 本文从模型结构到训练策略,以及实验结果出发,详解了DeepMind之前提出的不需要归一化的深度学习模型NFNet。 本文转载自PaperWeekly 作者:游泽彬 单位:中国人民大学 仅用于学术分享,若侵权请联系删除 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论 阅读全文
posted @ 2023-11-10 15:49 CV技术指南(公众号) 阅读(387) 评论(0) 推荐(0) 编辑
摘要:前言 10月26日,中国互联网协会发布了《中国互联网企业综合实力指数(2023)》报告。腾讯、阿里等互联网巨头稳居前十名,腾讯蝉联榜首位。紧随其后的分别是阿里的蚂蚁科技和淘天集团。各企业陆续开奖,到了选择offer的时候啦!给各位提供一个参考。 本文转载自AI算法与图像处理 仅用于学术分享,若侵权请 阅读全文
posted @ 2023-11-08 23:43 CV技术指南(公众号) 阅读(171) 评论(0) 推荐(0) 编辑
摘要:前言 反转Transformer,变成iTransformer。 本文转载自机器之心 仅用于学术分享,若侵权请联系删除 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 CV各大方向专栏与各个部署框架最全教程整理 【CV技术指南】CV全栈指导班、基础 阅读全文
posted @ 2023-11-08 23:40 CV技术指南(公众号) 阅读(63) 评论(0) 推荐(0) 编辑
摘要:前言 YOLO是You Only Look Once(你只看一次)的缩写,它具有识别图像中的物体的非凡能力,在日常应用中会经常被使用。所以本文将介绍如何使用FastAPI的集成YOLOv5,这样我们可以将YOLOv5做为API对外提供服务。 本文转载自Deephub Imba 作者:auliyafi 阅读全文
posted @ 2023-11-05 13:21 CV技术指南(公众号) 阅读(467) 评论(0) 推荐(0) 编辑
摘要:前言 本文经过练习时长3年终于做出一个超好玩的真实世界Burst Super-Resolution数据集,数据集仍在持续采集,后续会坚持更新迭代。 本文转载自我爱计算机视觉 仅用于学术分享,若侵权请联系删除 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘 阅读全文
posted @ 2023-11-05 13:18 CV技术指南(公众号) 阅读(521) 评论(0) 推荐(0) 编辑
摘要:前言 北京理工大学发布双语轻量级语言模型,明德大模型—MindLLM。 本文转载自机器之心 仅用于学术分享,若侵权请联系删除 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 CV各大方向专栏与各个部署框架最全教程整理 【CV技术指南】CV全栈指导班 阅读全文
posted @ 2023-11-03 11:07 CV技术指南(公众号) 阅读(95) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示