【arm】arm的汇编指令及特点

###Date: 2018-7-15

转载自:https://www.cnblogs.com/ziv3/p/6476114.html?utm_source=itdadao&utm_medium=referral

--------------------------------------------------------------------------------------------------------------------------------

指令和伪指令:前者编译后会生成一串1和0组成的机器码,后者帮助前者进行编译过程,不会生成机器码。

ARM汇编特点1:LDR/STR架构
ARM采用RISC架构,CPU本身不能直接读取内存,而需要先将内存中内容加载入CPU中通用寄存器中才能被CPU处理。
ldr(load register)指令将内存内容加载入通用寄存器。
str(store register)指令将寄存器内容存入内存空间中。
ldr/str组合用来实现 ARM CPU和内存数据交换  

(这两个指令只能在寄存器和内存之间进行)

 

ARM汇编特点2:8种寻址方式

寄存器寻址                mov r1, r2
立即寻址        mov r0, #0xFF00

寄存器移位寻址      mov r0, r1, lsl #3(r1先左移3位再赋给r0)
寄存器间接寻址      ldr r1, [r2]  (r2加一个[]后表示一个内存地址)
基址变址寻址         ldr r1, [r2, #4](r2加4的内存地址)
多寄存器寻址         ldmia r1!, {r2-r7, r12}(r1有初始值,将r2到r7,r12的值传入相应的地址,每次传输之后递增r1指向的存储地址,因为是32位,每次递增的地址应该是4bytes)
堆栈寻址               stmfd sp!, {r2-r7, lr}

相对寻址               beq flag
    flag:      (这是个标号)

ARM汇编特点3:指令后缀

同一指令经常附带不同后缀,变成不同的指令。经常使用的后缀有:
B(byte)功能不变,操作长度变为8位
H(half word)功能不变,长度变为16位
S(signed)功能不变,操作数变为有符号
如 ldr ldrb ldrh ldrsb ldrsh
S(S标志)功能不变,影响CPSR标志位
如 mov和movs movs r0, #0    (mov不会改变cpsr中的标志位,要让标志位变化需使用movs)

ARM汇编特点4:条件执行后缀

如果后缀条件满足才执行。
例如: 
mov r0, r1     //r0 = r1 
moveq r0,r1  // if(eq) r0 =r1(上一条指令如果使cpsr中的标志位置或则进行这条语句)
条件后缀执行注意:条件后缀是否成立,不是取决于本句代码,而是取决于这句代码之前的代码运行后的结果。

ARM汇编特点5:多级指令流水线

 

n级就会有PC-2^n

 

数据处理指令

数据传输指令

mov (move)

mov r1, r0     @两个寄存器之间数据传递 r1 = r0
mov r1, #0xFF   @将立即数赋值给寄存器 r1 = 0xFF
mvn 用法和mov一样,区别是mvn是按位取反后传递

例如:r1 = 0xF0,执行mov r0, r1 后 r0 = 0xF0
         执行mvn r0, r1 后 r0 = 0x0F
算术指令

add 加法指令add r2, r0, r1     @(r2 = r0+r1) 
sub 减法指令sub r2, r0, r1     @(r2 = r0 - r1) 
rsb 逆向减法指令 rsb r2,r0,r1     @(r1 = r1 - r0)
adc 带进位加法指令

sbc 带借位减法指令 
rsc 带借位的逆向减法指令

逻辑指令

and 逻辑与 
orr 逻辑或         ORR   R0,R0,#3             @r0先与3相或,在把值赋给r0
eor 逻辑异或 
bic 位清除指令 (bic r0, r1, #0x1F @将r1中的数的bit0到bit4清零后赋值给r0 )

比较指令

cmp   cmp r0, r1   @(r0 - r1 = 0?) 
cmn   cmn r0, r1   @(r0 + r1 = 0?) 
tst     tst r0, 0x0f   @测试r0的bit0-bit3是否全为0 
teq      teq r0,r1     @P = r0 EOR r1 
比较指令不用后加S 就能影响CPSR中的标志位。

乘法指令

mvl mla umull umlal smull smlal 都不常用,这里只作为知识点罗列。

前导零计数

clz 计算返回操作数二进制编码中第一个1前0的个数

CPSR访问指令(不可用mov访问)

mrs & msr

mrs 用来读psr (cpsr&spsr) 
msr 用来写psr

mrs r0, cpsr     将cpsr的值读入到r0中 
……………… 处理r0的值 
msr cpsr, r0     将r0的值写入到cpsr中

cpsr : 程序状态寄存器,CPU中只有一个,记录程序运行状态 
spsr:CPU中有五个,分别在五种异常模式下,作用是从普通模式进入异常模式时,用来保存之前普通模式下的cpsr的,在返回普通模式时恢复原来的cpsr。

跳转指令

b & bl &bx

b 直接跳转 
bl (branch and link) 跳转前把返回地址存在lr寄存器中,以便返回。 
bx 跳转同时切换到ARM模式,一般用于异常处理的跳转。

访存指令

ldr/srt & ldm/stm & swp

单个字/半字/字节访问 ldr/str 
多字批量访问 ldm/stm 
swp r1, r2, [r0] 内存和寄存器交换指令,将r0所指向内存中的数据写入r1,并将r2中的数据写入到r0所指向的内存。 
swp r1, r1, [r0] 互换(将r0所指向内存中的数据写入第一个r1,将第二个r1中的数据写入到r0所指向的内存。)

软中断指令

swi (software interrupt) 用来实现操作系统中的系统调用。

汇编中的立即数

ARM指令都是32位,除了指令标记和操作标记外,本身只能附带很少位数的立即数,因此立即数有合法和非法之分。

合法立即数:经过任意位数的移位后非零部分可以用8位标识的即为合法立即数(非零部分少于等于8位,0x000000ff 是合法立即数,0x00ff0000是合法立即数,0xf000000f循环移位之后仍然是合法立即数,0x000001ff是非法立即数)

协处理器以及协处理器指令

什么是协处理器

Soc内部另一处理核心,协助CPU实现某些功能,被主CPU调用执行一定的任务。CP15 (cooperation processor)
协处理器和MMU、cache、TLB等处理有关,功能上和操作系统的虚拟地址映射、cache等的管理有关。

协处理器访问指令

mcr & mrc

mrc 用于读取CP15中的寄存器 
mcr 用于写CP15中的寄存器

Rd:ARM的普通寄存器,不能是r15/pc 
Crn:cp15的寄存器,合法值为c0 - c15 
Crm:cp15的寄存器,一般均为c0

举例:

mrc p15, 0, r0, c1, c0, 0 
mcr p15, 0, r0, c1, c0, 0    (查阅cp15协处理器的作用位,存入PC中的都是指令,不可以是内容)

例2:

此例子用于打开mmu(on,所有地址为虚拟地址;off,所有地址为实地址)
mrc p15, 0, r0, c1, c0, 0
orr r0, r0, #1
mcr p15, 0, r0, c1, c0, 0

ldm/stm与栈的处理

ldr/str每周期只能访问4个字节内存,如果需要批量读取,写入内存时太慢,这个时候就要用ldm/stm (load register mutiplt / store register mutiplt)

多寄存器访问举例 
stmia sp, {r0-r12}

将r0存入sp指向的内存处,然后地址+4,将r1存入内存,然后地址再+4……直到将r12内容存入内存。
栈类型

空栈:栈指针指向空位,每次存入时可以直接存入然后栈指针移动一格;而取出时需要先移动一格才能取出(用完之后都得移动)
满栈:栈指针指向栈中最后一格数据,每次存入时需要先移动栈指针一格再存入;取出时可以直接取出,然后再移动栈指针(用完之后都得移动)
增栈:栈指针移动时向地址增加的方向移动的栈
减栈:栈指针移动时向地址减小的方向移动的栈

因此有四种栈类型:空增栈,空减栈,满增栈,满减栈。

八种后缀

后缀 意义
ia (increase after) 先传输,再地址+4
ib (increase before) 先地址+4,再传输
da (decrease after) 先传输,再地址-4
db (decreade before) 先地址-4,再传输
fd (full decrease) 满减栈
ed (empty decrease) 空减栈
fa 满增栈
ea 空增栈
操作栈的时候使用相同的后缀,就会避免出错。

!的作用

ldmia r0, {r2-r3} @把r0指向的内存中的数据读入到r2中,然后内存地址+4再将+4后地址中的数据读入到r3中。指令执行完毕后r0中的值不变。 
ldmia r0!, {r2-r3} @把r0指向的内存中的数据读入到r2中,然后内存地址+4再将+4后地址中的数据读入到r3中。指令执行完毕后r0中的值变化(为r3内容的地址)。

感叹号的作用就是r0的值在ldm过程中发生的增加或者减小最后写会到r0中。

^的作用

ldmfd sp!, {r0-r6, pc}  (操作了八个寄存器)
ldmfd sp!, {r0-r6, pc}^ (此项操作实际操作了9个寄存器,spsr->cpsr)
^:在目标寄存器中有pc时,会同时将spsr写入到cpsr,一般用在异常返回的时候。

 

GNU汇编伪指令

伪指令不是指令,伪指令和指令的根本区别是经过编译后会不会生成机器码。
伪指令的意义在于指导编译过程。
伪指令是和具体的编译器相关的,我们使用gnu工具链,因此学习gnu环境下的汇编伪指令。
GNU汇编中的一些符号

@ 行注释,可以在指令后边也可以在行首 
: 以冒号结束的是标号 
. 点号表示当前指令的地址 
立即数前面加#或者$,表示这是个立即数

常见的gnu汇编伪指令

伪指令 意义
.globl _start 给_start外部链接属性
.section .text 指定当前为代码段
.ascii .byte .short .long .word .quad .float .string 定义数据
.align 4 以16(2^4)字节内存地址对齐
.balignl 16,0xABCDEF 16字节对齐填充
.equ 类似于C中的宏定义
.end 汇编文件的结束,不加无所谓
.include 头文件包含
.arm或者.code32 声明以下的代码为arm指令不是thumb指令
.thumb或者.code16 声明以下的代码为thumb指令

eg.

.word 0xAABBFF 类似于C语言的 int AAAA = 0xAABBFF;

.align 4 @ 16字节对齐
.align 2 @ 4字节对齐

.balignl 16, 0xABCDEF 对齐+填充,b表示位填充,最后的l表示long,16表示16字节对齐,0xABCDEF表示填充的原料。 
0x00000008 : .balignl 16, 0xABCDEF,
0x0000000C: 0xABCDEF
0x00000010: 下一条指令

 

ldr 大范围的地址加载指令
adr 小范围的地址加载指令
adrl 中等范围的地址加载指令
nop 空操作

ARM中有一个ldr指令,还有一个ldr伪指令。两者的区别: 
ldr r0, #0xFF @ldr指令 
ldr r0, =0xFF @ldr伪指令 涉及到合法/非法立即数,还涉及到ARM文字池
adr 和 ldr的差别: 
- adr编译时会被1条sub或add指令替代,而ldr编译时会被一条mov指令替代或者文字池方式处理; 
- adr总是以PC为基准来表示地址,因此指令本身和运行地址有关,可以用来检测程序当前的运行地址在哪里 
-ldr加载的地址和链接时给定的地址有关,由链接脚本决定。

posted @ 2018-07-15 22:49  SoaringLee_fighting  阅读(1532)  评论(0编辑  收藏  举报