SSE指令集系列之三----整数运算指令
6. SSE整数运算指令
pavgb MM,MM/m64
pavgb XMM,XMM/m128
把源存储器与目的寄存器按字节无符号整数相加,再除以2,结果四舍五入为整数放入目的寄存器。
源存储器为m128时,内存变量地址必须16字节对齐.
pavgw MM,MM/m64
pavgw XMM,XMM/m128
把源存储器与目的寄存器按字无符号整数相加,再除以2,结果四舍五入为整数放入目的寄存器,
源存储器为m128时,内存变量必须对齐内存16字节.
pextrw r32,MM,imm8
pextrw r32,XMM,imm8
从源寄存器中选第imm8(0~3 或 0~7)个字送入目的寄存器的低16位,高16位清零.
imm8范围为 0~255,当源寄存器为'MM'时,有效值= imm8 mod 4,当目的寄存器为'XMM'时,有效值= imm8 mod 8
目的寄存器是32位通用寄存器
pinsrw MM,r32/m32,imm8
pinsrw XMM,r32/m32,imm8
把源存储器的低16位内容送入目的寄存器第imm8(0~3 或 0~7)个字,其余字不变.
imm8范围为 0~255,当目的寄存器为'MM'时,有效值= imm8 mod 4,当目的寄存器为'XMM'时,有效值= imm8 mod 8
源寄存器是32位通用寄存器
例:
7 6 5 4 3 2 1 0
当 XMM0 = 0x ffff ffff ffff ffff ffff ffff ffff ffff
eax = 0x 1234 5678,
执行 pinsrw XMM0,eax,3
则 XMM0 = 0x ffff ffff ffff ffff 5678 ffff ffff ffff
执行pinsrw XMM0,eax,9
则XMM0 = 0x ffff ffff ffff ffff ffff ffff 5678 ffff
pmaxsw MM,MM/m64
pmaxsw XMM,XMM/m128
把源存储器与目的寄存器按字有符号整数比较,大数放入目的寄存器对应字
源存储器为m128时,内存变量地址必须16字节对齐.
pmaxub MM,MM/m64
pmaxub XMM,XMM/m128
把源存储器与目的寄存器按字节无符号整数比较,大数放入目的寄存器对应字节,
源存储器为m128时,内存变量地址必须16字节对齐
pminsw MM,MM/m64
pminsw XMM,XMM/m128
把源存储器与目的寄存器按字有符号整数比较,较小数放入目的寄存器对应字,
源存储器为m128时,内存变量地址必须16字节对齐
pminub MM,MM/m64
pminub XMM,XMM/m128
把源存储器与目的寄存器按字节无符号整数比较,较小数放入目的寄存器对应字节,
源存储器为m128时,内存变量地址必须16字节对齐
小结: SSE整数运算指令是对MMX指令集的扩充。