编译器判断优化(__builtin_expect)
最近在网上看到这个,稍微研究了下,发现特定情况下,能提高不少判断的效率。
1 #define likely(x) __builtin_expect(!!(x),1) 2 #define unlikely(x) __builtin_expect(!!(x),0)
这个技巧就是在循环判断时去期望是或否。这涉及到了编译器优化,以及很经典的火车选路。
在 GCC 手册中对 __builtin_expect() 的描述是这样的:
这个函数的语义是:你期望 exp 表达式的值等于常量 c ,从而 GCC 为你优化程序,将符合这个条件的分支放在合适的地方。
现在处理器都是流水线的,有些里面有多个逻辑运算单元,系统可以提前取多条指令进行并行处理,但遇到跳转时,则需要重新取指令,这相对于不用重新去指令就降低了速度。
所以就引入了 likely 和 unlikely ,目的是增加条件分支预测的准确性,cpu 会提前装载后面的指令,遇到条件转移指令时会提前预测并装载某个分 支的指令。unlikely 表示你可以确认该条件是极少发生的,相反 likely 表示该条件多数情况下会发生。编译器会产生相应的代码来优化 cpu 执行效率。
按照我的理解,简单来说,就是在if(likely(x))的情况下,会提前预读x为1分支下的一条指令,从而减少指令跳转带来的开销。
因为我们可以根据实际情况,比如,绝大部分情况下x为真时使用if(likely(x)),相反的情况使用if(unlikely(x))。
自己的测试程序如下:
1 #define likely(x) __builtin_expect(!!(x), 1) 2 #define unlikely(x) __builtin_expect(!!(x), 0) 3 4 5 #include <stdio.h> 6 #include <time.h> 7 #include <stdlib.h> 8 9 int main() 10 { 11 clock_t start, finish; 12 long i = 10000000L; 13 start = clock(); 14 int x = 1; 15 int y = 0; 16 while(--i) 17 { 18 if (likely(x)) 19 y = 0; 20 else 21 y = 1; 22 23 } 24 finish = clock(); 25 printf("%d\r\n",finish-start); 26 27 i = 10000000L; 28 while(--i) 29 { 30 if (x) 31 y = 0; 32 else 33 y = 1; 34 } 35 finish = clock(); 36 printf("%d\r\n",finish-start); 37 return 0; 38 }
运行结果:
[root@sssversion131 mytest]# ./test 40000 70000 [root@sssversion131 mytest]# ./test 40000 80000 [root@sssversion131 mytest]# ./test 40000 80000 [root@sssversion131 mytest]# ./test 40000 80000 [root@sssversion131 mytest]# ./test 50000 80000 [root@sssversion131 mytest]# ./test 40000 70000 [root@sssversion131 mytest]# ./test 40000 80000 [root@sssversion131 mytest]# ./test 50000 80000
可以看到,极端情况下可以提升30%到50%的效率。