__builtin_expect -- 分支预测优化

1.引言

__builtin_expect说明

这个指令是gcc(version >= 2.96)引入的,作用是允许程序员将最有可能执行的分支告诉编译器,让编译器告诉CPU提前加载该分支下的指令。

写法为:__builtin_expect(EXP, N),表示的意思是:EXP == N的概率很大

一般的使用方法是将_builtin_expect指令封装为likely和unlikely宏。这两个宏的写法如下

#define likely(x)       __builtin_expect(!!(x), 1) //x很可能为真
#define unlikely(x)   __builtin_expect(!!(x), 0) //x很可能为假

首先我们要明确:

if (likely(x))      //等价于if(x)
if (unlikely(x))  //等价于if(x)
__builtin_expect() 是 GCC (version >= 2.96)提供给程序员使用的,目的是将“分支转移”的信息提供给编译器,这样编译器可以对代码进行优化,以减少指令跳转带来的性能下降。
__builtin_expect((x),1)表示 x 的值为真的可能性更大;
__builtin_expect((x),0)表示 x 的值为假的可能性更大。
也就是说,使用likely(),执行 if 后面的语句的机会更大,使用 unlikely(),执行 else 后面的语句的机会更大。通过这种方式,编译器在编译过程中,会将可能性更大的代码紧跟着起面的代码,从而减少指令跳转带来的性能上的下降。

int x, y;
 if(unlikely(x > 0))
    y = 1; 
else 
    y = -1;
上面的代码中 gcc 编译的指令会预先读取 y = -1 这条指令,这适合 x 的值大于 0 的概率比较小的情况。如果 x 的值在大部分情况下是大于 0 的,就应该用 likely(x > 0),这样编译出的指令是预先读取 y = 1 这条指令了。这样系统在运行时就会减少重新取指了。
 我们可以直接给出测试程序
 1 #include <stdio.h>
 2 #define likely(x)    __builtin_expect(!!(x), 1)
 3 #define unlikely(x)  __builtin_expect(!!(x), 0)
 4 
 5 int main(void) {
 6     int x = -1, y;
 7     if (likely(x > 0)) {
 8         y = 1;
 9         printf("x > 0\n");
10     } else {
11         y = -1; 
12         printf("x <= 0\n");
13     }   
14     printf("y = %d\n", y); 
15     return 0;
16 }

ydq@ubuntu:20201017$ vi 4.test.c
ydq@ubuntu:20201017$ g++ 4.test.c
ydq@ubuntu:20201017$ ./a.out
x <= 0
y = -1

到了这里,也许你会觉得有点奇怪,为啥我明明可以直接用法if(x > 0)去进行判断,为啥还要那么大花力气去定义likely用去调__builtin_expect函数呢?这里其实涉及到CPU和高速缓存如何去处理指令的知识了,这里我们简单介绍一下(其实具体我也不是很清楚,只能讲解一下我自己大概的理解~v~),对于我们编写的C语言程序,编译器需要把C程序转化为机器指令,这样才能够让CPU处理这些指令,并执行我们C程序最终的功能,这里多核CPU是有并行能力去处理这部分代码的,我们知道CPU的频率远高于高速缓存的频率,所以两者对指令的处理能力不不同步的,为了不让CPU停下来休息,我们要求高速缓存要提前加载机器指令,而分支语句会让CPU的并行处理能力大打折扣,因为高速缓存无法预测分支语句的条件,从而提前去加载具体条件下的分支语句指令,故编译器为我们实现__builtin_expect函数,让我们人为的提前高速编译器,那个分支条件为真,让高速缓存有能力“预测”自己要提前加载那个分支语句的指令,这样就可以充分利用CPU的并行能力了。下面我们给出我们实际的运用。
 1 #include <stdio.h>
 2 #include <stdbool.h>
 3 
 4 int IsPalindrome(int x) {
 5     if (__builtin_expect(!!(x < 0), 0)) { //这里用条件__builtin_expect(!!(x < 0)),去替代if (x < 0),让我们提前告诉CPU和缓存传入的x大概率不小于0,让缓存可以提前加载第9行的代码翻译过来的指令
 6         return false;
 7     }   
 8 
 9     int y = 0, z = x;
10     while (x) {
11         y = y * 10 + x % 10; 
12         x /= 10; 
13     }   
14     return z == y;
15 }
16 
17 int main(void) {
18     int n;
19     while (scanf("%d", &n) != EOF) {
20         if (IsPalindrome(n)) {
21             printf("%d is palindrome\n", n); 
22         } else {
23             printf("%d is not palindrome\n", n); 
24         }
25     }   
26     return 0;
27 }

所以以上代码可以让我们上述判断回文整数的程序执行速度更快,效率更高。

部分内容的作者和出处来自如下:
作者:大明白
链接:https://www.jianshu.com/p/2684613a300f
来源:简书



 

posted @ 2020-10-17 17:57  ydqun  阅读(640)  评论(0编辑  收藏  举报