摘要:
本文主要介绍 CNN 模型复杂度的分析,通常来说模型复杂度一般我们关注:1)时间复杂度:模型训练和推理速度;2)占用 GPU 大小。 模型训练和推理速度 模型的训练和推理速度由“运算量”决定,即 FLOPs,“运算量”代表模型的时间复杂度。FLOPs 越大,模型训练和推理越慢,对于 CNN,每个卷积 阅读全文
摘要:
本文主要介绍一下时下很热门的 Attention 机制,从什么是 Attention 机制,到它是如何被运用到 NLP 领域,后来又应用到 CV 领域的。 什么是 Attention 机制? Attention 机制的思想其实是借鉴了生物在观察和学习行为中的过程,也就是我们人类通常在观察和学习的时候 阅读全文