[C#] 24位图像水平翻转的跨平台SIMD硬件加速向量算法的关键——YShuffleX3Kernel源码解读(如Avx2解决shuffle的跨lane问题、Avx512优化等)
zyl910 2024-12-11 22:37
阅读:75
评论:3
推荐:0
编辑
当前标签:SSE
[C#] 对32位图像进行水平翻转(FlipX)的跨平台SIMD硬件加速向量算法(使用VectorTraits的YShuffleKernel方法来解决Shuffle的缺点)
zyl910 2024-12-01 22:01
阅读:52
评论:0
推荐:0
编辑
[C#] Bgr24彩色位图转为灰度的Bgr24位图的跨平台SIMD硬件加速向量算法
zyl910 2024-11-21 00:37
阅读:49
评论:0
推荐:0
编辑
[C#] Bgr24彩色位图转为Gray8灰度位图的跨平台SIMD硬件加速向量算法(第2版: 增加512位向量算法、RGB2Y算法的测试对比)
zyl910 2024-11-19 23:05
阅读:95
评论:0
推荐:0
编辑
[C] 跨平台使用Intrinsic函数范例3——使用MMX、SSE2指令集 处理 32位整数数组求和
zyl910 2012-10-26 21:24
阅读:4186
评论:0
推荐:0
编辑
[C] 跨平台使用Intrinsic函数范例2——使用SSE2、AVX指令集 处理 双精度浮点数组求和
zyl910 2012-10-26 17:49
阅读:3906
评论:0
推荐:0
编辑
[C] 跨平台使用Intrinsic函数范例1——使用SSE、AVX指令集 处理 单精度浮点数组求和(支持vc、gcc,兼容Windows、Linux、Mac)
zyl910 2012-10-22 22:12
阅读:22278
评论:5
推荐:5
编辑
GCC中的Intrinsics头文件与SIMD指令集、宏、参数的对应表
zyl910 2012-08-27 22:45
阅读:11524
评论:1
推荐:1
编辑
Instructions函数对照表:02 xmmintrin.h与SSE指令集
zyl910 2012-07-31 18:32
阅读:8801
评论:1
推荐:1
编辑
[VC] CPUIDFIELD:CPUID字段的统一编号、读取方案。范例:检查SSE4A、AES、PCLMULQDQ指令
zyl910 2012-06-29 14:11
阅读:4078
评论:0
推荐:0
编辑
[VC兼容32位和64位] 检查MMX和SSE系列指令集的支持级别
zyl910 2012-05-25 22:22
阅读:4872
评论:0
推荐:1
编辑
SIMD函数整理:00 索引贴(2012-07-31更新)
zyl910 2012-04-26 21:53
阅读:6837
评论:0
推荐:2
编辑
SIMD(MMX/SSE/AVX)变量命名规范心得
zyl910 2012-04-23 17:49
阅读:9809
评论:1
推荐:1
编辑
AVX指令集中的32种浮点比较关系详解(NaN、无序、有序等)
zyl910 2012-04-19 15:50
阅读:5083
评论:0
推荐:0
编辑
深入探讨用位掩码代替分支(9):测试成绩总结
zyl910 2012-04-13 17:20
阅读:1814
评论:2
推荐:0
编辑
深入探讨用位掩码代替分支(8):SSE指令集速度测试
zyl910 2012-04-12 22:09
阅读:4449
评论:2
推荐:0
编辑
[VC6] 检查MMX和SSE系列指令集的支持级别(最高SSE4.2)
zyl910 2012-03-01 22:36
阅读:4352
评论:0
推荐:0
编辑
Intrinsics头文件与SIMD指令集、Visual Studio版本对应表
zyl910 2012-02-28 22:33
阅读:8756
评论:12
推荐:0
编辑
[x86]SIMD指令集发展历程表(MMX、SSE、AVX等)
zyl910 2012-02-26 19:36
阅读:9971
评论:0
推荐:2
编辑