摘要:
前言 本文,来自 Meta 等机构的研究者提出了一种新颖且高效的预训练框架:连续概念混合(Continuous Concept Mixing, CoCoMix),其将离散的下一个 token 预测与连续概念相结合。 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、 阅读全文
摘要:
前言 本篇分享 TPAMI 2025 论文Invertible Diffusion Models for Compressed Sensing,北大、KAUST、字节联合提出“可逆扩散模型”赋能图像重建,代码已开源! 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读 阅读全文
摘要:
前言 本文提出了 MambaQuant,这是一种训练后量化(PTQ)框架,包含:1)基于 Karhunen-Loève 变换(KLT)的增强旋转,使旋转矩阵能适应不同的通道分布;2)平滑融合旋转,用于均衡通道方差,并可将额外参数合并到模型权重中。 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总 阅读全文