摘要: 前几天做half量化时发现cublas竟然没有提供half版本的矩阵 向量乘,也就是half版本的 。自己写一个又太麻烦,重点是精度和耗时不一定比cublas提供的要好,不过cublas提供了half版本的矩阵 矩阵乘函数 ,只要维度没啥问题,用 实现 ,既方便又好用。 废话不多说,直接上。 前置准 阅读全文
posted @ 2020-04-01 00:01 bookfree 阅读(1162) 评论(0) 推荐(0) 编辑