摘要: 动机与创新点 这篇论文的主要动机在于应对深度神经网络(DNN)训练过程中计算量过大的问题。DNN训练中包含大量的多维点积运算,尤其是当输入数据存在相似性时,这种计算可以优化。MERCURY提出了一种利用输入相似性的硬件加速方案,通过使用随机投影和量化(RPQ)生成输入向量的签名,存储在MCACHE中 阅读全文
posted @ 2024-11-03 14:47 信海 阅读(7) 评论(0) 推荐(0) 编辑