【汇编】汇编语言语法

GNU 汇编语法

在进行嵌入式 Linux 开发的时候是绝对要掌握基本的 ARM 汇编,因为 Cortex-A 芯片一上电 SP 指针还没初始化,C 环境还没准备好,所以肯定不能运行 C 代码,必须先用汇编语言设置好 C 环境,比如初始化 DDR、设置 SP指针等等,当汇编把 C 环境设置好了以后才可以运行 C 代码。所以 Cortex-A 一开始肯定是汇编代码,其实 STM32 也一样的,一开始也是汇编,比如MDK 和 IAR 下的启动文件 startup_stm32f10x_hd.s其中的汇编语法是有所不同的,将 MDK 下的汇编文件直接复制到 IAR 下去编译就会出错,因为 MDK 和 IAR 的编译器不同,因此对于汇编的语法就有一些小区别。我们要编写的是 ARM汇编,编译使用的 GCC 交叉编译器,所以我们的汇编代码要符合 GNU 语法。

GNU汇编语法适用于所有的架构,并不是ARM独享,GNU汇编由一系列的语句组成

注意!ARM中的指令、伪指令、伪操作、寄存器名等可以全部使用大写,也可以全部使用小写,但是不能大小写混用。

伪操作

伪操作 含义
.byte 定义单字节数据,比如.byte 0x12
.short 定义双字节数据,比如.short 0x1234
.long 定义一个4字节数据,比如.long 0x12345678
.equ 赋值语句,格式为:.equ 变量名,表达式,比如.equ num, 0x12,表示 num=0x12
.align 数据字节对齐,比如:.align 4 表示 4 字节对齐。
.end 表示源文件结束。
.global 定义一个全局符号,格式为:.global symbol,比如:.global _start。

比如:

.global _start

_start:
ldr r0,=0x12 @r0=0x12

.global是一个位操作,表示_start是一个全局标号,相当于C语言中的全局变量一样。

段名

汇编系统预定义了一些段名:

定义 段名
.text 表示代码段
.data 初始化数据段
.bss 未初始化的数据段
.rodata 只读数据段

比如:

函数

函数格式如下:

函数名:
    函数体
    返回语句

GNU汇编函数返回语句不是必须的,比如Cortex-A7中断服务函数:

/*未定义中断*/
Undefined_Handler:
	ldr r0,=Undefined_Handler
	bx r0

/*svc中断*/
SVC_Handler:
	ldr r0,=SVC_Handler
	bx r0

/*预取中止中断*/
PerfAbort_Handler:
	ldr r0,=PrefAbort_Handler
	bx r0

Cortex-A7常用汇编指令

需要系统性的学习Cortex-A7的所有汇编指令可以参考《ARM ArchitectureReference Manual ARMv7-A and ARMv7-R edition.pdf》的 A4章节。

数据传输指令

指令 目的寄存器 源寄存器 描述
MOV R0 R1 将R1中的数据复制到R0中
MRS R0 CPSR 将特殊寄存器CPSR里面额数据复制到R0中
MSR CPSR R1 将R1里面的数据复制到特殊寄存器CPSR中

1.MOV指令

MOV指令用于将数据从一个寄存器拷贝到另一个寄存器,或者将一个立即数传递到寄存器中。示例如下:

MOV R0,R1      @将寄存器中R1的数据传递给R0,即R0=R1
MOV R0,#0X12   @将立即数0x12传递给R0寄存器,即R0=0X12

2.MRS指令

MRS指令用于将特殊寄存器(如CPSR和SPSR)中的数据传递给通用寄存器,要读取特殊寄存器中的数据只能使用MRS指令。示例如下:

MRS R0,CPSR   @将特殊寄存CPSR里面的数据传递给R0,即R0=CPSR

3.MSR指令

MSR 指令和 MRS 刚好相反,MSR 指令用来将普通寄存器的数据传递给特殊寄存器,也就是写特殊寄存器,写特殊寄存器只能使用 MSR,示例如下:

MSR CPSR,R0   @将R0的数据复制到CPSR中,即CPSR=R0

存储器访问指令

ARM 不能直接访问存储器,比如 RAM 中的数据,I.MX6UL 中的寄存器就是 RAM 类型的,我们用汇编来配置 I.MX6UL 寄存器的时候需要借助存储器访问指令,一般先将要配置的值写入到 Rx(x=0~12)寄存器中,然后借助存储器访问指令将 Rx 中的数据写入到 I.MX6UL 寄存器中。读取 I.MX6UL 寄存器也是一样的,只是过程相反。常用的存储器访问指令有两种:LDR 和STR:

指令 描述
LDR Rd,[Rn,#offset] 从存储器Rn+offset的位置读取数据存放到Rd中
STR Rd,[Rn,#offset] 将Rd中的数据写入到存储器中的Rn+offset位置

1.LDR指令

LDR主要是从存储器中加载数据到寄存器Rx中,LDR也可以将一个立即数加载到寄存器Rx中,LDR加载立即数的时候要使用"=",而不是"#"。在嵌入式开发中,LDR最常用的就是读取 CPU 的寄存器值,比如 I.MX6UL 有个寄存器 GPIO1_GDIR,其地址为 0X0209C004,我们现在要读取这个寄存器中的数据,示例代码如下:

LDR R0,=0x0209C004    @ 将寄存器地址0x0209C004加载到R0寄存器中,即R0=0x0209C004
LDR R1,[R0]           @ 读取地址0x0209C004中的数据到R1寄存器中

上述代码就是读取寄存器 GPIO1_GDIR 中的值,读取到的寄存器值保存在 R1 寄存器中,上面代码中 offset 是 0,也就是没有用到 offset。

2.STR指令

LDR 是从存储器读取数据,STR 就是将数据写入到存储器中,同样以 I.MX6UL 寄存器GPIO1_GDIR 为例,现在我们要配置寄存器 GPIO1_GDIR 的值为 0X2000002,示例代码如下:

LDR R0, =0x0209C004   @将寄存器地址0x0209C004加载到R0中,即R0=0x0209C004
LDR R1, =0X20000002   @R1保存要写入到寄存器的值,即R1=0X20000002
STR R1,[R0]           @将R1的值写入到R0中所保存的地址中

LDR 和 STR 都是按照字进行读取和写入的,也就是操作的 32 位数据,如果要按照字节、半字进行操作的话可以在指令“LDR”后面加上 B 或 H,比如按字节操作的指令就是 LDRB 和STRB,按半字操作的指令就是 LDRH 和 STRH。

3.ADR指令

ADR是一条小范围地址读取伪指令,它将基于PC的相对偏移的地址值读到目标寄存器中

ADR R0,exper

编译源程序时,汇编器首先计算当前PC值(当前指令位置)到exper的距离,然后用一条ADD或SUB指令替换这条伪指令

比如:

add register,pc,#offset_to_exper    @标号exper与指令必须要在同一代码段
adr r0,_start                       @将指定地址赋值r0

r0的值为标号_start与此指令的距离差 + PC值。

堆栈操作指令

在日常代码逻辑中,函数的调用随处可见,通常会在 A 函数中调用 B 函数,当 B 函数执行完以后再回到 A 函数继续执行。要想在跳回 A 函数以后代码能够接着正常运行,那就必须在跳到 B 函数之前将当前处理器状态保存起来(就是保存 R0-R15 这些寄存器值),当 B 函数执行完成以后再用前面保存的寄存器值恢复R0-R15 即可。保存 R0-R15 寄存器的操作就叫做现场保护,恢复 R0R15 寄存器的操作就叫做恢复现场。在进行现场保护的时候需要进行压栈(入栈)操作,恢复现场就要进行出栈操作。压栈的指令为 PUSH,出栈的指令为 POP,PUSH 和 POP 是一种多存储和多加载指令,即可以一次操作多个寄存器数据,他们利用当前的栈指针 SP 来生成地址。

1.PUSH和POP

指令 描述
PUSH 将寄存器列表存入栈中
POP 从栈中恢复寄存器列表

示例代码:

PUSH {R0-R3,R12}    @将R0-R3和R12压入堆栈
PUSH {LR}            @将LR连接寄存器压入堆栈

压栈后堆栈示意图(0x80000000是栈底,每增加数据SP想低地址方向即栈顶方向移动):

image

出栈代码:

POP   {LR}          @先恢复 LR
POP   {R0~R3,R12}   @在恢复 R0~R3,R12

出栈的就是从栈顶,也就是 SP 当前执行的位置开始,地址依次减小来提取堆栈中的数据到要恢复的寄存器列表中。

2.STMFD和LDMFD

PUSH 和 POP 的另外一种写法是“STMFD SP!”和“LDMFD SP!”,上述代码可以改成:

 STMFD 	SP!,{R0~R3, R12} 	@R0~R3,R12 入栈
 STMFD 	SP!,{LR} 		@LR 入栈

 LDMFD 	SP!, {LR} 		@先恢复 LR
 LDMFD	 SP!, {R0~R3, R12}      @再恢复 R0~R3, R12

TMFD 可以分为两部分:STM 和 FD,同理,LDMFD 也可以分为 LDM 和 FD。

LDR和STR是数据加载和存储指令,但是每次只能读写存储器中的一个数据。STM 和 LDM 就是多存储和多加载,可以连续的读写存储器中的多个连续数据。FD 是 Full Descending 的缩写,即满递减的意思。根据 ATPCS 规则,ARM 使用的 FD 类型的堆栈,SP 指向最后一个入栈的数值,堆栈是由高地址向下增长的,也就是前面说的向下增长的堆栈,因此最常用的指令就是 STMFD 和 LDMFD。STM 和 LDM 的指令寄存器列表中编号小的对应低地址,编号高的对应高地址。

跳转指令

关于跳转可以有多种跳转方法,比如:

1.直接使用跳转指令B、BL、BX

2.直接向PC寄存器里面写入数据,借助PC指针直接跳转

通常我们还是使用跳转指令进行跳转:

指令 描述
B 跳转到label,如果跳转范围超过了+/-2KB,可以指定B.W使用32位版本的跳转指令,这样可以得到较大范围的跳转
BX 间接跳转,跳转到存放于Rm中的地址处,并切换指令集
BL 跳转到标号地址,并将返回地址保存在LR中
BLX 结合 BX 和 BL 的特点,跳转到 Rm 指定的地址,并将返回地址保存在 LR 中,切换指令集

在汇编中常用的是B和BL指令:

1.B指令

B 指令会将 PC 寄存器的值设置为跳转目标地址, 一旦执行 B 指令,ARM 处理器就会立即跳转到指定的目标地址。如果要调用的函数不会再返回到原来的执行处,那就可以用 B 指令。示例如下:

_start:
   
   ldr sp,=0X80200000    @设置栈指针
   b main                @跳转到main函数

这就是典型的在汇编中初始化 C运行环境,然后跳转到C文件的 main函数中运行,上述代码只是初始化了 SP 指针,有些处理器还需要做其他的初始化,比如初始化 DDR 等等。因为跳转到 C 文件以后再也不会回到汇编了,所以在第 4 行使用了 B 指令来完成跳转。

2.BL指令

BL 指令相比 B 指令,在跳转之前会在寄存器 LR(R14)中保存当前 PC 寄存器值,所以可以通过将 LR 寄存器中的值重新加载到 PC 中来继续从跳转之前的代码处运行,这是子程序调用一个基本但常用的手段。

比如 Cortex-A 处理器的 irq 中断服务函数都是汇编写的,主要用汇编来实现现场的保护和恢复、获取中断号等。但是具体的中断处理过程都是 C 函数,所以就会存在汇编中调用 C 函数的问题。

而且当 C 语言版本的中断处理函数执行完成以后是需要返回到irq 汇编中断服务函数,因为还要处理其他的工作,一般是恢复现场。这个时候就不能直接使用B 指令了,因为 B 指令一旦跳转就再也不会回来了,这个时候要使用 BL 指令。

push {r0,r1}       @ 保存r0,r1
cps #0x13          @ 进入SVC模式,允许其他中断再次进去

bl system_irqhandler   @ 加载C语言中断处理函数到r2寄存器中

cps #0x12          @ 进入IRQ模式
pop {r0,r1}  
str r0,[r1,#0x10]  @ 中断执行完成,写EOIR

第 5 行就是执行 C 语言版的中断处理函数,当处理完成以后是需要返回来继续执行下面的程序,所以使用了 BL 指令。

注:

cps是一条armv7的汇编命令,功能是在特权模式下,直接修改CPSR寄存器的M[4:0],让处理器进入不同的模式

CPSR 的寄存器结构模型:

image

其中M[4:0] 就是处理器的模式控制为,不同的编码对应着不同的处理器模式,如下图所示:

image

算数运算指令

汇编中可以继续算数运算,比如加减乘除,常用命令如下表(#immed为立即数):

指令 计算公式 备注
ADD Rd,Rn,Rm Rd = Rn + Rm 加法运算,指令为ADD
ADD Rd,Rn,#immed Rd = Rn + #immed 加法运算,指令为ADD
ADC Rd,Rn,Rm Rd = Rn + Rm + 进位 带进位的加法运算,指令为ADC
ADC Rd,Rn,#immed Rd = Rd + #immed +进位 带进位的加法运算,指令为 ADC
SUB Rd,Rn,Rm Rd = Rn – Rm 减法
SUB Rd,#immed Rd = Rd - #immed 减法
SUB Rd, Rn, #immed Rd = Rn - #immed 减法
SBC Rd, Rn, #immed Rd = Rn - #immed – 借位 带借位的减法
SBC Rd, Rn ,Rm Rd = Rn – Rm – 借位 带借位的减法
MUL Rd, Rn, Rm Rd = Rn * Rm 乘法(32 位)
UDIV Rd, Rn, Rm Rd = Rn / Rm 无符号除法
SDIV Rd, Rn, Rm Rd = Rn / Rm 有符号除法

在嵌入式开发中最常会用的就是加减指令,乘除基本用不到。

逻辑运算指令

在C语言中常常需要用到逻辑运算,比如"&"和"|"等逻辑运算符。使用汇编语言的时候也可以使用逻辑运算指令,如下表:

指令 计算公式 备注
AND Rd,Rn Rd  =Rd & Rn 按位与
AND Rd,Rn,#immed Rd = Rn & #immed 按位与
AND Rd,Rn,Rm Rd = Rn & Rm 按位与
ORR Rd,Rn Rd = Rd| Rn 按位或
ORR Rd,Rn,Rm Rd = Rn|Rm 按位或
ORR Rd,Rn,#immed Rd = Rn|#immed 按位或
BIC Rd,Rn Rd = Rd & (~Rn) 位清除
BIC Rd,Rn,Rm Rd = Rn &(~Rm) 位清除
BIC Rd,Rn,#immed Rd = Rn &(~#immed) 位清除
ORN Rd,Rn,#immed Rd = Rn|(#immed) 按位或非
ORN Rd,Rn,Rm Rd = Rn|(Rm) 按位或非
EOR Rd,Rn Rd = Rd ^ Rn 按位异或
EOR Rd,Rn,#immed Rd = Rd ^ #immed 按位异或
EOR Rd,Rn,Rm Rd = Rn ^ Rm 按位异或

参考文章:
https://blog.csdn.net/weixin_45309916/article/details/107837561

posted @ 2023-11-10 10:07  Emma1111  阅读(166)  评论(0编辑  收藏  举报