摘要: 这次的主题主要是利用线程级并行减少 CPU-bound,从多线程的角度出发 CPU-bound 与 memory-bound float 类型的计算类耗时: 1次float乘法 ≈ 1次float减法 ≈ 1次float加法≈ 4次float加法(SIMD优化成功)≈ 32次float加法(CPU有 阅读全文
posted @ 2022-06-01 13:04 KillerAery 阅读(4187) 评论(2) 推荐(5) 编辑