需要用到的通用寄存器:
FP 和 fp(帧指针,用来寻堆栈值);
如:str r0, [fp, #-16]
    ldr r0, [fp, #-16]
IP 和 ip(过程调用中间临时寄存器,同 R12);
SP 和 sp(堆栈指针,同 R13);
LR 和 lr(链接寄存器,同 R14);
PC 和 pc(程序计数器,同 R15).

出栈入栈过程:
    mov ip, sp  //中间临时寄存器ip,保存sp
    stmfd sp!, {fp, ip, lr, pc} //满堆栈递减,‘!’使sp = sp - 4*4
    sub fp, ip, #4   //帧指针位置
/*
    sub sp, #8          @开辟空间;  ...
    int a; fp - 16     fp - 4
    int b; fp - 20     fp - 8
*/
    sub sp, fp, #12  //寻找堆栈保存pc的位置
    ldmfd sp, {fp, sp, lr}  //恢复保存值,sp值通过ip值得到。
    bx  lr

sp存储示意图:

    递减SP
    -----
    |pc |
    -----
    |lr |
    -----
    |ip |
    -----
    |fp |
    -----