Loading

摘要: ###思路 看了不少网上关于TPU的分析,大都是TPU如何简化计算矩阵乘法,即全连接矩阵的计算,weight和input矩阵只需按顺序读入一次,即可实现矩阵乘法的快速计算。 而CNN需要大量卷积计算,对于一个卷积核,例如3*3卷积核,该如何计算,一直没找到相关分析,或者是太过简略我也没看明白。 后来 阅读全文
posted @ 2021-02-05 16:07 kyshan 阅读(384) 评论(0) 推荐(0) 编辑