摘要: 测试目标:测试for循环展开优化的提升效率 #include <cstdio> #include <ctime> #include <cstdlib> /* 测试一维和二维循环展开效率区别 */ #include <cstdio> #include <ctime> #include <cstdlib 阅读全文
posted @ 2024-10-15 23:43 安洛8 阅读(33) 评论(0) 推荐(0) 编辑
摘要: 目标:Darknet 源码cpu矩阵乘法函数 gemm_nn 优化。参数说明:lda A的列数; ldb B的列数; ldc C的列数; M C的行数; K A的列数 测试方法:Darknet源码,makefile文件添加编译选项 -pg,编译后得到可执行程序 darknet,运行可执行程序: ./ 阅读全文
posted @ 2024-10-15 12:29 安洛8 阅读(33) 评论(0) 推荐(0) 编辑
点击右上角即可分享
微信分享提示