__builtin_expect -- 分支预测优化
1.引言
__builtin_expect说明
这个指令是gcc(version >= 2.96)引入的,作用是允许程序员将最有可能执行的分支告诉编译器,让编译器告诉CPU提前加载该分支下的指令。
写法为:__builtin_expect(EXP, N),表示的意思是:EXP == N的概率很大
一般的使用方法是将_builtin_expect指令封装为likely和unlikely宏。这两个宏的写法如下
#define likely(x) __builtin_expect(!!(x), 1) //x很可能为真 #define unlikely(x) __builtin_expect(!!(x), 0) //x很可能为假
首先我们要明确:
if (likely(x)) //等价于if(x) if (unlikely(x)) //等价于if(x)
__builtin_expect()
是 GCC (version >= 2.96)提供给程序员使用的,目的是将“分支转移”的信息提供给编译器,这样编译器可以对代码进行优化,以减少指令跳转带来的性能下降。__builtin_expect((x),1)
表示 x 的值为真的可能性更大;__builtin_expect((x),0)
表示 x 的值为假的可能性更大。也就是说,使用
likely()
,执行 if 后面的语句的机会更大,使用 unlikely()
,执行 else 后面的语句的机会更大。通过这种方式,编译器在编译过程中,会将可能性更大的代码紧跟着起面的代码,从而减少指令跳转带来的性能上的下降。int x, y; if(unlikely(x > 0)) y = 1; else y = -1;
上面的代码中 gcc 编译的指令会预先读取 y = -1 这条指令,这适合 x 的值大于 0 的概率比较小的情况。如果 x 的值在大部分情况下是大于 0 的,就应该用 likely(x > 0),这样编译出的指令是预先读取 y = 1 这条指令了。这样系统在运行时就会减少重新取指了。
我们可以直接给出测试程序
1 #include <stdio.h> 2 #define likely(x) __builtin_expect(!!(x), 1) 3 #define unlikely(x) __builtin_expect(!!(x), 0) 4 5 int main(void) { 6 int x = -1, y; 7 if (likely(x > 0)) { 8 y = 1; 9 printf("x > 0\n"); 10 } else { 11 y = -1; 12 printf("x <= 0\n"); 13 } 14 printf("y = %d\n", y); 15 return 0; 16 }
ydq@ubuntu:20201017$ vi 4.test.c
ydq@ubuntu:20201017$ g++ 4.test.c
ydq@ubuntu:20201017$ ./a.out
x <= 0
y = -1
到了这里,也许你会觉得有点奇怪,为啥我明明可以直接用法if(x > 0)去进行判断,为啥还要那么大花力气去定义likely用去调__builtin_expect函数呢?这里其实涉及到CPU和高速缓存如何去处理指令的知识了,这里我们简单介绍一下(其实具体我也不是很清楚,只能讲解一下我自己大概的理解~v~),对于我们编写的C语言程序,编译器需要把C程序转化为机器指令,这样才能够让CPU处理这些指令,并执行我们C程序最终的功能,这里多核CPU是有并行能力去处理这部分代码的,我们知道CPU的频率远高于高速缓存的频率,所以两者对指令的处理能力不不同步的,为了不让CPU停下来休息,我们要求高速缓存要提前加载机器指令,而分支语句会让CPU的并行处理能力大打折扣,因为高速缓存无法预测分支语句的条件,从而提前去加载具体条件下的分支语句指令,故编译器为我们实现__builtin_expect函数,让我们人为的提前高速编译器,那个分支条件为真,让高速缓存有能力“预测”自己要提前加载那个分支语句的指令,这样就可以充分利用CPU的并行能力了。下面我们给出我们实际的运用。
1 #include <stdio.h> 2 #include <stdbool.h> 3 4 int IsPalindrome(int x) { 5 if (__builtin_expect(!!(x < 0), 0)) { //这里用条件__builtin_expect(!!(x < 0)),去替代if (x < 0),让我们提前告诉CPU和缓存传入的x大概率不小于0,让缓存可以提前加载第9行的代码翻译过来的指令 6 return false; 7 } 8 9 int y = 0, z = x; 10 while (x) { 11 y = y * 10 + x % 10; 12 x /= 10; 13 } 14 return z == y; 15 } 16 17 int main(void) { 18 int n; 19 while (scanf("%d", &n) != EOF) { 20 if (IsPalindrome(n)) { 21 printf("%d is palindrome\n", n); 22 } else { 23 printf("%d is not palindrome\n", n); 24 } 25 } 26 return 0; 27 }
所以以上代码可以让我们上述判断回文整数的程序执行速度更快,效率更高。
部分内容的作者和出处来自如下:
作者:大明白
链接:https://www.jianshu.com/p/2684613a300f
来源:简书
作者:大明白
链接:https://www.jianshu.com/p/2684613a300f
来源:简书