随笔-处理器微架构-测量最大IPC(流水线宽度)
固定cpu频率
随笔-处理器微架构-固定cpu频率 - LiYanbin - 博客园
max_ipc_test.sh
#!/bin/bash
[[ -z "$1" || -z "$2" ]] && {
echo "usage: $0 [cpuid] [nop_count]"
exit
}
cpuid=$1
nop_count=$2
echo 'void main() { do {__asm__ (' > nop.c
for ((i = 1; i <= $nop_count; i++)); do
echo '"nop\n\t"' >> nop.c;
done
echo ');} while(1);}' >> nop.c
gcc -O0 nop.c -o nop
echo $?
[[ $? -ne 0 ]] && exit -1
set -x
[ -f ./nop ] && {
perf stat -C $cpuid --timeout 2000 taskset -c $cpuid ./nop
}
set +x
rm nop.c
rm nop
$ sudo bash max_ipc_test.sh 7 4
...
12,290,206,450 instructions # 3.97 insn per cycle
...
当nop_count较小,可能因为while(1)
分支指令达不到max ipc,可以增加nop_count来弱化while(1)
分支指令
本文来自博客园,作者:LiYanbin,转载请注明原文链接:https://www.cnblogs.com/stellar-liyanbin/p/18414475
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· 三行代码完成国际化适配,妙~啊~
· .NET Core 中如何实现缓存的预热?
· 如何调用 DeepSeek 的自然语言处理 API 接口并集成到在线客服系统