CPU指令集学习——gather
每次偏移 int索引*scale 个字节,每次取4字节。注意int索引是倒序的,如__m128i vindex有4个int索引,先取最后一个索引。
举例:
__m128i _mm_i32gather_epi32 (int const* base_addr, __m128i vindex, const int scale)
int int_array[8] = { 100,200,300,400,500,600,700,800 }; //4字节元素 __m128i vindex = _mm_set_epi32(0, 1, 2, 3); //4个int索引 __m128i result1 = _mm_i32gather_epi32(int_array, vindex, 4);//每次取4字节,第一个从偏移3*4字节处开始取,即400 int* int_res = (int*)&result1; for (int i = 0; i < 4; i++) { std::cout << int_res[i] << "\n"; //400,300,200,100 } //案例二 uint8_t uint8_array[8] = { 10,11,12,13,14,15,16,17 }; //1字节元素 __m128i result = _mm_i32gather_epi32((int*)uint8_array, vindex, 1);//每次取4字节,第一个从偏移3*1字节处开始取,即13 14 15 16 uint8_t* uint8_res = (uint8_t*)&result; for (int i = 0; i < 8; i++) { std::cout << (int)uint8_res[i] << "\n"; //13 14 15 16 12 13 14 15 }
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· DeepSeek 开源周回顾「GitHub 热点速览」
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
· AI与.NET技术实操系列(二):开始使用ML.NET
· 单线程的Redis速度为什么快?
2022-06-13 Qt的pro文件、VS的props文件中OpenCV配置
2022-06-13 labview初次安装,函数“视觉与运动”版块空白