摘要: 前言 本文,来自 Meta 等机构的研究者提出了一种新颖且高效的预训练框架:连续概念混合(Continuous Concept Mixing, CoCoMix),其将离散的下一个 token 预测与连续概念相结合。 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、 阅读全文
posted @ 2025-02-21 11:18 CV技术指南(公众号) 阅读(9) 评论(0) 推荐(0) 编辑
摘要: 前言 本篇分享 TPAMI 2025 论文Invertible Diffusion Models for Compressed Sensing,北大、KAUST、字节联合提出“可逆扩散模型”赋能图像重建,代码已开源! 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读 阅读全文
posted @ 2025-02-21 11:15 CV技术指南(公众号) 阅读(10) 评论(0) 推荐(0) 编辑
摘要: 前言 本文提出了 MambaQuant,这是一种训练后量化(PTQ)框架,包含:1)基于 Karhunen-Loève 变换(KLT)的增强旋转,使旋转矩阵能适应不同的通道分布;2)平滑融合旋转,用于均衡通道方差,并可将额外参数合并到模型权重中。 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总 阅读全文
posted @ 2025-02-21 11:11 CV技术指南(公众号) 阅读(9) 评论(0) 推荐(0) 编辑
点击右上角即可分享
微信分享提示