jibinghu

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2024年4月9日

摘要: 第三次作业 提交内容一: 源代码在-O3编译优化下执行结果: AVX指令集优化: // conv_avx.cpp bool Convolve1D_Ks5_F64_AVX(double* __restrict__ y, const double* __restrict__ x, const doubl 阅读全文
posted @ 2024-04-09 16:53 zombie_black 阅读(94) 评论(0) 推荐(0) 编辑

摘要: AVX加速卷积part2 重新构筑下昨天的想法: 问题: 源程序在O2下的执行时间: 经过AVX改进后的执行时间: 下面尝试在AVX2基础上改进: AVX与AVX2的主要区别和改进: 向量整数指令: AVX主要集中在浮点数运算上,提供了对256位宽SIMD(单指令多数据)向量的支持。 AVX2引入了 阅读全文
posted @ 2024-04-09 11:13 zombie_black 阅读(13) 评论(0) 推荐(0) 编辑