在上一次所记录的 Linux 编译过程中,已经提及了编译和连接所需的工具.
这里假设在学习 AT&T 汇编时,已对 Intel 格式的 8086/80386 汇编有了一个相当的了解.同时在学习 GCC inline assembler 时,也假设已经对 GCC 有相当的了解. (其实我 GCC 也没有好到哪里, Intel 汇编也只是随便学过几下 ^_^,所以说"假设")
AT&T 格式 | Intel 格式 |
pushl %eax | push eax |
AT&T 格式 | Intel 格式 |
pushl $1 | push 1 |
AT&T 格式 | Intel 格式 |
addl $1, %eax | add eax, 1 |
AT&T 格式 | Intel 格式 |
movb val, %al | mov al, byte ptr val |
AT&T 格式 | Intel 格式 |
ljump $section, $offset | jmp far section:offset |
lcall $section, $offset | call far section:offset |
AT&T 格式 | Intel 格式 |
lret $stack_adjust | ret far stack_adjust |
在 AT&T 汇编格式中,内存操作数的寻址方式是 section:disp(base, index, scale).而在 Intel 汇编格式中,内存操作数的寻址方式为 section:[base + index*scale + disp].
AT&T 格式 | Intel 格式 |
movl -4(%ebp), %eax | mov eax, [ebp - 4] |
movl array(, %eax, 4), %eax | mov eax, [eax*4 + array] |
movw array(%ebx, %eax, 4), %cx | mov cx, [ebx + 4*eax + array] |
movb $4, %fs:(%eax) | mov fs:eax, 4 |
GCC inline assembler:
1]基本格式和说明:
内联汇编格式 __asm__("asm statements" : outputs : inputs : registers-modified);
插入到 C 代码中的汇编语句是以 ":" 分隔的四个部分,其中第一部分就是汇编代码本身,通常称为指令部,其格式和在汇编语言中使用的格式基本相同.指令部分是必须的,而其它部分则可以根据实际情况而省略.
在将汇编语句嵌入到C代码中时,操作数如何与C代码中的变量相结合是个很大的问题.GCC采用如下方法来解决这个问题.程序员提供具体的指令,而对寄存器的使用则只需给出"样板"和约束条件就可以了,具体如何将寄存器与变量结合起来完全由GCC和GAS来负责.
在GCC内联汇编语句的指令部中,加上前缀'%'的数字 (如%0,%1) 表示的就是需要使用寄存器的"样板"操作数.指令部中使用了几个样板操作数,就表明有几个变量需要与寄存器相结合,这样GCC和GAS在编译和汇编时会根据后面给定的约束条件进行恰当的处理.由于样板操作数也使用'%'作为前缀,因此在涉及到具体的寄存器时,寄存器名前面应该加上两个'%',以免产生混淆.
紧跟在指令部后面的是输出部,是规定输出变量如何与样板操作数进行结合的条件,每个条件称为一个"约束",必要时可以包含多个约束,相互之间用逗号分隔开就可以了.每个输出约束都以'='号开始,然后紧跟一个对操作数类型进行说明的字后,最后是如何与变量相结合的约束.凡是与输出部中说明的操作数相结合的寄存器或操作数本身,在执行完嵌入的汇编代码后均不保留执行之前的内容,这是GCC在调度寄存器时所使用的依据.
输出部后面是输入部,输入约束的格式和输出约束相似,但不带'='号.如果一个输入约束要求使用寄存器,则GCC在预处理时就会为之分配一个寄存器,并插入必要的指令将操作数装入该寄存器.与输入部中说明的操作数结合的寄存器或操作数本身,在执行完嵌入的汇编代码后也不保留执行之前的内容.
有时在进行某些操作时,除了要用到进行数据输入和输出的寄存器外,还要使用多个寄存器来保存中间计算结果,这样就难免会破坏原有寄存器的内容.在GCC内联汇编格式中的最后一个部分中,可以对将产生副作用的寄存器进行说明,以便GCC能够采用相应的措施.
在内联汇编中用到的操作数从输出部的第一个约束开始编号,序号从0开始,每个约束记数一次,指令部要引用这些操作数时,只需在序号前加上'%'作为前缀就可以了.需要注意的是,内联汇编语句的指令部在引用一个操作数时总是将其作为32位的长字使用,但实际情况可能需要的是字或字节,因此应该在约束中指明正确的限定符.
限定符 | 意义 |
"m"、"v"、"o" | 内存单元 |
"r" | 任何寄存器 |
"q" | 寄存器eax、ebx、ecx、edx之一 |
"i"、"h" | 直接操作数 |
"E"和"F" | 浮点数 |
"g" | 任意 |
"a"、"b"、"c"、"d" | 分别表示寄存器eax、ebx、ecx和edx |
"S"和"D" | 寄存器esi、edi |
"I" | 常数(0至31) |