i++循环与i–循环的执行效率

转载时请注明出处和作者联系方式
文章出处：http://www.limodev.cn/blog
作者联系方式：李先静 <xianjimli at hotmail dot com>

昨天同事问了我一个问题，有两个循环语句：

for(i = n; i > 0; i--)
{
…
}
 
for(i = 0; i < n; i++)
{
…
}

为什么前者比后者快?

我当时的解释是：

i- -操作本身会影响CPSR(当前程序状态寄存器)，CPSR常见的标志有N(结果为负), Z(结果为0)，C（有进位），O（有溢出）。i > 0，可以直接通过Z标志判断出来。

i++操作也会影响CPSR(当前程序状态寄存器)，但只影响O（有溢出）标志，这对于i < n的判断没有任何帮助。所以还需要一条额外的比较指令，也就是说每个循环要多执行一条指令。

(这是五年前tjww告诉我的，当时他在AVR上写一个LCD驱动程序，使用后者LCD会闪烁，使用前者则没有问题。)

为了确认我的理解是正确的，做了个实验：

int loop_dec(int n)
{
    int i = 0;
    int v = 0;
 
    for(i = n; i > 0; i--)
        v +=i;
 
    return v;
}
 
int loop_inc(int n)
{
    int i = 0;
    int v = 0;
 
    for(i = 0; i < n; i++)
        v +=i;
 
    return v;
}

用arm-linux-gcc编译，然后反汇编：

i--的循环条件：
  4c:   e51b3014        ldr     r3, [fp, #-20]
  50:   e3530000        cmp     r3, #0  ; 0x0
  54:   cafffff5        bgt     30 <loop_dec+0x30>
 
i++的循环条件：
  b8:   e51b3018        ldr     r3, [fp, #-24]
  bc:   e1520003        cmp     r2, r3
  c0:   bafffff4        blt     98 <loop_inc+0x30>

结果和我想象的并不一样，这是怎么回事呢？我想可能因为没有加优化选项，于是加上-O选项，结果变为：

i--的循环条件：
  14:   e2500001        subs    r0, r0, #1      ; 0x1
  18:   1afffffc        bne     10 <loop_dec+0x10>
 
i++的循环条件：
  3c:   e2833001        add     r3, r3, #1      ; 0x1
  40:   e1500003        cmp     r0, r3
  44:   1afffffb        bne     38 <loop_inc+0x14>

这下没错了，果然少一个cmp指令。

posted on 2009-08-24 21:11 张云临阅读(158) 评论(0) 编辑收藏举报

刷新页面返回顶部

张云临

i++循环与i–循环的执行效率

导航

公告