[C#] 24位图像水平翻转的跨平台SIMD硬件加速向量算法的关键——YShuffleX3Kernel源码解读(如Avx2解决shuffle的跨lane问题、Avx512优化等)
zyl910 2024-12-11 22:37
阅读:56
评论:3
推荐:0
编辑
当前标签:SSE
[C#] 对32位图像进行水平翻转(FlipX)的跨平台SIMD硬件加速向量算法(使用VectorTraits的YShuffleKernel方法来解决Shuffle的缺点)
zyl910 2024-12-01 22:01
阅读:45
评论:0
推荐:0
编辑
[C#] Bgr24彩色位图转为灰度的Bgr24位图的跨平台SIMD硬件加速向量算法
zyl910 2024-11-21 00:37
阅读:40
评论:0
推荐:0
编辑
[C#] Bgr24彩色位图转为Gray8灰度位图的跨平台SIMD硬件加速向量算法(第2版: 增加512位向量算法、RGB2Y算法的测试对比)
zyl910 2024-11-19 23:05
阅读:80
评论:0
推荐:0
编辑
[C] 跨平台使用Intrinsic函数范例3——使用MMX、SSE2指令集 处理 32位整数数组求和
zyl910 2012-10-26 21:24
阅读:4180
评论:0
推荐:0
编辑
[C] 跨平台使用Intrinsic函数范例2——使用SSE2、AVX指令集 处理 双精度浮点数组求和
zyl910 2012-10-26 17:49
阅读:3898
评论:0
推荐:0
编辑
[C] 跨平台使用Intrinsic函数范例1——使用SSE、AVX指令集 处理 单精度浮点数组求和(支持vc、gcc,兼容Windows、Linux、Mac)
zyl910 2012-10-22 22:12
阅读:22258
评论:5
推荐:5
编辑
GCC中的Intrinsics头文件与SIMD指令集、宏、参数的对应表
zyl910 2012-08-27 22:45
阅读:11504
评论:1
推荐:1
编辑
Instructions函数对照表:02 xmmintrin.h与SSE指令集
zyl910 2012-07-31 18:32
阅读:8783
评论:1
推荐:1
编辑
[VC] CPUIDFIELD:CPUID字段的统一编号、读取方案。范例:检查SSE4A、AES、PCLMULQDQ指令
zyl910 2012-06-29 14:11
阅读:4075
评论:0
推荐:0
编辑
[VC兼容32位和64位] 检查MMX和SSE系列指令集的支持级别
zyl910 2012-05-25 22:22
阅读:4867
评论:0
推荐:1
编辑
SIMD函数整理:00 索引贴(2012-07-31更新)
zyl910 2012-04-26 21:53
阅读:6827
评论:0
推荐:2
编辑
SIMD(MMX/SSE/AVX)变量命名规范心得
zyl910 2012-04-23 17:49
阅读:9795
评论:1
推荐:1
编辑
AVX指令集中的32种浮点比较关系详解(NaN、无序、有序等)
zyl910 2012-04-19 15:50
阅读:5057
评论:0
推荐:0
编辑
深入探讨用位掩码代替分支(9):测试成绩总结
zyl910 2012-04-13 17:20
阅读:1813
评论:2
推荐:0
编辑
深入探讨用位掩码代替分支(8):SSE指令集速度测试
zyl910 2012-04-12 22:09
阅读:4442
评论:2
推荐:0
编辑
[VC6] 检查MMX和SSE系列指令集的支持级别(最高SSE4.2)
zyl910 2012-03-01 22:36
阅读:4349
评论:0
推荐:0
编辑
Intrinsics头文件与SIMD指令集、Visual Studio版本对应表
zyl910 2012-02-28 22:33
阅读:8744
评论:12
推荐:0
编辑
[x86]SIMD指令集发展历程表(MMX、SSE、AVX等)
zyl910 2012-02-26 19:36
阅读:9951
评论:0
推荐:2
编辑