2024 年 4月 9 日随笔档案 - zombie_black

公告

2024年4月9日

2024.4.9 avx加速一维卷积操作(汇总)

摘要：第三次作业提交内容一：源代码在-O3编译优化下执行结果： AVX指令集优化： // conv_avx.cpp bool Convolve1D_Ks5_F64_AVX(double* __restrict__ y, const double* __restrict__ x, const doubl 阅读全文

posted @ 2024-04-09 16:53 zombie_black 阅读(94) 评论(0) 推荐(0) 编辑

2024.4.9 AVX加速卷积part2 // Pthreads库学习

摘要： AVX加速卷积part2 重新构筑下昨天的想法：问题：源程序在O2下的执行时间：经过AVX改进后的执行时间：下面尝试在AVX2基础上改进： AVX与AVX2的主要区别和改进：向量整数指令： AVX主要集中在浮点数运算上，提供了对256位宽SIMD（单指令多数据）向量的支持。 AVX2引入了阅读全文

posted @ 2024-04-09 11:13 zombie_black 阅读(13) 评论(0) 推荐(0) 编辑

jibinghu

公告