4.4
s* 17.5
--mul
r 13.1
e 18.62
x 4.4 //bmi2
s* 17.5
--div
r 379 //125
e 114 //94
ss 48.35
sd 57
--vpslld
4.4
.global _k
_k:
movl %edi, %eax
shll $32, %eax
mov %xmm0, %rax
addl %ecx, (%eax)
ret
.global _t
_t:
mov $2, %rdx
mov $0xf1234567, %rcx
aa:
mulx %rcx, %rdi, %rsi
loop aa
ret
.global _f0
_f0:
ret
#define A() addss %xmm0, %xmm0
//mulx %rcx, %rsi, %rdi
.global _kg
_kg:
mov $0xf1234567, %rcx
mov $0, %rdx
a0:
//vpaddd %ymm0, %ymm0, %ymm0
//vpslld $20, %xmm0, %xmm0
//div %rcx
//shr $1, %rax
//divsd %xmm0, %xmm0
//add %rax, %rax
//add %r8, %r8
//add %r9, %r9
//add %rsi, %rsi
//add %rdi, %rsi //4 loop is better
A()
A()
A()
A()
//A()
sub $1, %rcx
jnz a0 //loop too slow
ret
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· winform 绘制太阳,地球,月球 运作规律
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· AI与.NET技术实操系列(五):向量存储与相似性搜索在 .NET 中的实现
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
2021-06-07 so