ARM汇编基础

1 GNU语法

1.1 GNU汇编

GNU 汇编语法适用于所有的架构，并不是 ARM 独享的，GNU 汇编由一系列的语句组成，每行一条语句，每条语句有三个可选部分，如下：

label: instruction @ comment

label： 即标号，表示地址位置，有些指令前面可能会有标号，这样就可以通过这个标号得到指令的地址，标号也可以用来表示数据地址。注意 label 后面的“:”，任何以“:”结尾的标识符都会被识别为一个标号。
instruction：即指令，也就是汇编指令或伪指令。
@符号：表示后面的是注释，就跟 C 语言里面的“/”和“/”一样，其实在 GNU 汇编文件中我们也可以使用“/”和“/”来注释。
comment：就是注释内容。

举例：

add:
	MOVS RO, #0X12 @设置R0=0X12

“add:”就是标号，“MOVS R0,#0X12”就是指令，最后的“@设置 R0=0X12”就是注释。

1.2 段

用户可以使用.section伪操作来定义一个段，汇编系统预定义了一些段名：

.text：代码段

.data：初始化的数据段

.bss：为初始化的数据段

.rodata：只读数据段

也可以自己使用.section来定义一个段，每个段以段名开始，以下一段名或文件结尾结束，比如：

.section .testsection @定义一个testsection段

汇编程序的默认入口标号为_start，也可以在链接脚本中使用ENTRY指明其它的入口点，下面的代码使用_start作为入口标号：

.global _start

_start:
	ldr r0, =0x12 @r0=0x12

.global 是伪操作，表示_start 是一个全局标号，类似 C 语言里面的全局变量一样，常见的伪操作有：

.byte：定义单字节数据，比如.byte 0x12。
.short：定义双字节数据，比如.short 0x1234。
.long：定义一个 4 字节数据，比如.long 0x12345678。
.equ：赋值语句，格式为：.equ 变量名，表达式，比如.equ num, 0x12，表示 num=0x12。
.align：数据字节对齐，比如：.align 4 表示 4 字节对齐。
.end：表示源文件结束。
.global：定义一个全局符号，格式为：.global symbol，比如：.global _start。

1.3 函数

GNU汇编支持函数，函数格式为：

函数名：
	函数体
	返回语句 @ 不是必须的

返回语句不是必须的。

2 Cortex-A7常用汇编指令

参考：《ARM ArchitectureReference Manual ARMv7-A and ARMv7-R edition.pdf》的A4章节

2.1 处理器内部数据传输指令

处理器内部传输数据，常见的操作有：

将数据从一个寄存器传递到另外一个寄存器。
将数据从一个寄存器传递到特殊寄存器，如CPSR和SPSR寄存器。
将立即数传递到寄存器。

数据传输常用的指令有3个：MOV、MRS、MSR，用法如下：

指令	目的	源	描述
MOV	R0	R1	将R1里面的数据复制到R0中
MRS	R0	CPSR	将特殊寄存器CPSR里面的数据复制到R0中
MSR	CPSR	R1	将R1里面的数据复制到特殊寄存器CPSR中

MOV 指令用于将数据从一个寄存器拷贝到另外一个寄存器，或者将一个立即数传递到寄存器里面，使用示例如下：

MOV RO, R1      @将寄存器R1中的数据传递给R0寄存器
MOV R0, #0X12   @将立即数0X12传递给R0寄存器

MRS 指令用于将特殊寄存器(如 CPSR 和 SPSR)中的数据传递给通用寄存器，要读取特殊寄存器的数据只.能使用 MRS 指令，使用示例如下：

MRS R0, CPSR  @将特殊寄存器 CPSR 里面的数据传递给 R0，即 R0=CPSR

MSR 指令和 MRS 刚好相反，MSR 指令用来将普通寄存器的数据传递给特殊寄存器，也就是写特殊寄存器，写特殊寄存器只能使用 MSR，使用示例如下：

MSR CPSR, R0   @将 R0 中的数据复制到 CPSR 中，即 CPSR=R0

2.2 存储器访问指令

ARM 不能直接访问存储器，比如 RAM 中的数据，用汇编操作RAM需要借助存储器访问指令，一般先将要配置的值写入到 Rx(x=0~12)寄存器中，然后借助存储器访问指令将 Rx 中的数据写入到RAM，读取过程相反。

常用的存储器访问指令有两种：LDR 和 STR：

指令	描述
LDR Rd, [Rn, #offset]	从存储器 Rn+offset 的位置读取数据存放到 Rd 中
STR Rd, [Rn, #offset]	将 Rd 中的数据写入到存储器中的 Rn+offset 位置

LDR 主要用于从存储加载数据到寄存器 Rx 中，LDR 也可以将一个立即数加载到寄存器 Rx中，LDR 加载立即数的时候要使用“=”，而不是“#”。在嵌入式开发中，LDR 最常用的就是读取 CPU 的寄存器值，比如 I.MX6UL 有个寄存器 GPIO1_GDIR，其地址为 0X0209C004，我们现在要读取这个寄存器中的数据，示例代码如下：

LDR R0, =0X0209C004  @将寄存器地址0X0209C004加载到R0中
LDR R1, [R0]		 @读取地址0X0209C004中的数据到R1寄存器中

读取寄存器 GPIO1_GDIR 中的值，读取到的寄存器值保存在 R1 寄存器中，上面代码中 offset 是 0，也就是没有用到 offset。

STR 就是将数据写入到存储器中，同样以 I.MX6UL 寄存器GPIO1_GDIR 为例，现在我们要配置寄存器 GPIO1_GDIR 的值为 0X20000002，示例代码如下：

LDR R0, =0X0209C004  @将寄存器地址0X0209C004加载到R0中
LDR R1, =0X20000002  @R1保存要写入到寄存器的值
STR R1, [R0]         @将R1中的值写入到R0中保存的地址中

LDR 和 STR 都是按照字进行读取和写入的，也就是操作的 32 位数据，如果要按照字节、半字进行操作的话可以在指令“LDR”后面加上 B 或 H，比如按字节操作的指令就是 LDRB 和 STRB，按半字操作的指令就是 LDRH 和 STRH。

2.3 压栈和出栈指令

函数调用时，在调用函数之前，需要将调用者的当前处理器信息保存起来（也就寄存器），当被调用函数执行完之后需要恢复现场。在进行现场保护的时候需要进行压栈(入栈)操作，恢复现场就要进行出栈操作。

压栈的指令为 PUSH，出栈的指令为 POP，PUSH 和 POP 是一种多存储和多加载指令，即可以一次操作多个寄存器数据，他们利用当前的栈指针 SP 来生成地址，PUSH 和 POP 的用法如下：

指令	描述
PUSH <reg_list>	将寄存器列表存入栈中
POP <reg_list>	从栈中恢复寄存器列表

假如我们现在要将 R0~R3 和 R12 这 5 个寄存器压栈，当前的 SP 指针指向 0X80000000，处理器的堆栈是向下增长的，使用的汇编代码如下：

PUSH {R0~R3, R12}  @将R0~R3和R12压栈

压栈完成后的堆栈如图：

出栈的就是从栈顶，也就是 SP 当前执行的位置开始，地址依次减小来提取堆栈中的数据到要恢复的寄存器列表中。比如：

POP {R0~R3, R12}  @恢复R0~R3，R12

PUSH 和 POP 的另外一种写法是“STMFD SP!”和“LDMFD SP!”，上面的代码可以改为：

STMFD SP!, {R0~R3, R12}  @将R0~R3和R12压栈
LDMFD SP!, {R0~R3, R12}  @出栈，恢复R0~R3和R12

STMFD 可以分为两部分：STM 和 FD，同理LDMFD 也可以分为 LDM 和 FD。STM 和 LDM 就是多存储和多
加载，可以连续的读写存储器中的多个连续数据（区别于STR和LDR）。

FD 是 Full Descending 的缩写，即满递减的意思。根据 ATPCS 规则，ARM 使用的 FD 类型的堆栈，SP 指向最后一个入栈的数值，堆栈是由高地址向下增长的，也就是前面说的向下增长的堆栈，因此最常用的指令就是 STMFD 和 LDMFD。STM 和 LDM 的指令寄存器列表中编号小的对应低地址，编号高的对应高地址。

2.4 跳转指令

有多种跳转操作，比如：

直接使用跳转指令 B、BL、BX 等。
直接向 PC 寄存器里面写入数据。

上述两种方法都可以完成跳转操作，但是一般常用的还是 B、BL 或 BX，用法如下：

指令	描述
B <label>	跳转到label，如果跳转范围超过了+/-2KB，可以指定B.W <label>使用32位的跳转指令
BX <Rm>	间接跳转，跳转到存放于Rm中的地址处，并且切换指令集
BL <label>	跳转到标号地址，并将返回地址保存到LR链接寄存器中
BLX <Rm>	跳转到Rm指定的地址，并将返回地址保存到LR中，切换指令集

使用较多的是B指令和BL指令。

B指令：B 指令会将 PC 寄存器的值设置为跳转目标地址，一旦执行 B 指令，ARM 处理器就会立即跳转到指定的目标地址。如果要调用的函数不会再返回到原来的执行处，那就可以用 B 指令，如下示例：

_start:
	ldr sp, =0x80200000  @设置栈指针
	b main   			 @跳转到main函数

上述代码就是典型的在汇编中初始化 C 运行环境，然后跳转到 C 文件的 main 函数中运行。

BL指令：在跳转之前会在寄存器 LR(R14)中保存当前 PC 寄存器值，所以可以通过将 LR 寄存器中的值重新加载到 PC 中来继续从跳转之前的代码处运行，这是子程序调用一个基本但常用的手段。比如 Cortex-A 处理器的 irq 中断服务函数都是汇编写的，主要用汇编来实现现场的保护和恢复、获取中断号等。但是具体的中断处理过程都是 C 函数，处理函数执行完毕后需要返回，恢复现场，比如：

push {r0, r1}  @ 保存r0, r1
cps #0x13      @ 进入SVC模式，允许其它中断再次进入

bl system_irqhandler  @加载C语言中断处理函数

cps #0x12             @ 进入IRQ模式
POP {r0, r1}          @ 出栈
str r0, [r1, #0x10]   @ 中断执行完成，写EOIR

2.5 算术运算指令

汇编进行算术运算，比如加减乘除，常用运算指令如下：

2.6 逻辑运算指令

汇编语言也可以使用逻辑运算指令，常用的运算指令用法：

posted @ 2023-03-12 17:07 Mrlayfolk 阅读(572) 评论(0) 收藏举报

刷新页面返回顶部

MrLayflolk

有志者，事竟成。