2025 年 2月 21 日随笔档案 - CV技术指南（公众号）

2025年2月21日

比知识蒸馏好用，田渊栋等提出连续概念混合，再度革新Transformer预训练框架

摘要：前言本文，来自 Meta 等机构的研究者提出了一种新颖且高效的预训练框架：连续概念混合（Continuous Concept Mixing, CoCoMix），其将离散的下一个 token 预测与连续概念相结合。欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、阅读全文

posted @ 2025-02-21 11:18 CV技术指南（公众号）阅读(9) 评论(0) 推荐(0) 编辑

顶刊TPAMI 2025 | 北大、KAUST、字节联合提出“可逆扩散模型”赋能图像重建，代码已开源！

摘要：前言本篇分享 TPAMI 2025 论文Invertible Diffusion Models for Compressed Sensing，北大、KAUST、字节联合提出“可逆扩散模型”赋能图像重建，代码已开源！欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读阅读全文

posted @ 2025-02-21 11:15 CV技术指南（公众号）阅读(10) 评论(0) 推荐(0) 编辑

ICLR 2025 | 精度近乎无损！首个Mamba系列模型量化方案MambaQuant

摘要：前言本文提出了 MambaQuant，这是一种训练后量化（PTQ）框架，包含：1）基于 Karhunen-Loève 变换（KLT）的增强旋转，使旋转矩阵能适应不同的通道分布；2）平滑融合旋转，用于均衡通道方差，并可将额外参数合并到模型权重中。欢迎关注公众号CV技术指南，专注于计算机视觉的技术总阅读全文

posted @ 2025-02-21 11:11 CV技术指南（公众号）阅读(9) 评论(0) 推荐(0) 编辑

公告

昵称： CV技术指南（公众号）
园龄： 6年7个月
粉丝： 54
关注： 1

+加关注

2025年2月

日

一

二

三

四

五

六

公告

搜索

常用链接

我的标签

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论