Mini2440内存管理单元MMU
一级页表:
TTB base代表一级页表的地址,将它写入协处理器CP15的寄存器C2(称为页表基址寄存器)即可,一级页表的地址是16K对齐,使用[31:14]存储页表基址,[13:0]为0。一级页表使用4096个描述符来表示4GB空间,每个描述符对应1MB的虚拟地址,要么存储它对应的1MB物理空间的起始地址,要么存储下一级页表的地址。使用MVA[31:20]来索引一级页表(2^12=4096个描述符),得到一个描述符,每个描述符占4个字节。
11:细页表(Fine page table)
[31:12]为细页表基址(Fine page table base address),此描述符的低12位填充0后,就是一个二级页表的物理地址。
此二级页表含1024个条目([11:2]),其中每个条目表示大小1kb的物理地址空间,一个细页表表示1MB物理地址空间。
二级页表:
以大页(64KB),小页(4KB)或极小页(1KB)进行地址映射时,需要用到二级页表,二级页表有粗页表、细页表两种,二级页表描述符格式如下:
由于本次程序只使用一级页表,以段的方式进行地址映射。所以二级页表的4种情况就不总结了,看书。
内存的访问权限检查:
它决定一块内存是否允许读、是否允许写。这由CP15寄存器C3(域访问控制)、描述符的域(Domain)、CP15寄存器C1的R/S/A位、描述符的AP位共同决定。
“域”决定是否对某块内存进行权限检查,“AP”决定如何对某块内容进行权限检查。
S3C2440有16个域,CP15寄存器C3中每两位对应一个域(一共32位)。
00:无访问权限(任何访问都将导致“Domain fault”异常)
01:客户模式(使用段描述符、页描述符进行权限检查)
10:保留(保留,目前相当于“无访问权限”)
11:管理模式(不进行权限检查,允许任何访问)
Domain占用4位,用来表示内存属于0-15,哪一个域,例如:
粗页表中的“Domain”为0b1010,表示1MB内存属于域10,如果域访问控制寄存器的[21:20]等于0b01,则使用描述符中的"AP"位进行权限检查,如果等于0b11,则不进行权限检查,允许任何访问。
AP、ap3、ap2、ap1、ap0结合CP15寄存器C1的R/S位,决定如何进行访问检查。
AP | S | R | 特权模式 | 用户模式 | 说明 |
00 | 0 | 0 | 无访问权限 | 无访问权限 | 任何访问将产生“Permission fault”异常 |
00 | 1 | 0 | 只读 | 无访问权限 | 在超级权限下可以进行读操作 |
00 | 0 | 1 | 只读 | 只读 | 任何写操作将产生”Permission fault“异常 |
00 | 1 | 1 | 保留 | - | - |
01 | x | x | 读/写 | 无访问权限 | 只允许在超级模式下访问 |
10 | x | x | 读/写 | 只读 | 在用户模式下进行写操作将产生"Permission fault"异常 |
11 | x | x | 读/写 | 读/写 | 在所有模式下允许任何访问 |
xx | 1 | 1 | 保留 | - | - |
转译查找缓存(Translation Lookaside Buffers, TLB)
Cache:
S2C2440内置了指令Cache(ICaches)、数据Cache(DCaches)、写缓存(Write buffer),需要用到描述符中的C位(Ctt)和B位(Btt)。
S3C2440 MMU、TLB、Cache的控制指令:
S3C2440除了ARM920T的CPU核心外,还有若干个协处理器,用来帮助主CPU完成一些特殊功能。对MMU、TLB、Cache等的操作涉及到协处理器。
<MCR|MRC> {cond} p#,<expression1>,Rd,cn,cm{,<expression2>}
MRC //从协处理器获得数据,传给ARM920T CPU核心寄存器
MCR //数据从ARM920T CPU核心寄存器传给协处理器
{cond} //执行条件,省略时表示无条件执行
p# //协处理器序号
<expression1> //一个常数
Rd //ARM920T CPU核心的寄存器
cn和cm //协处理器中的寄存器
<expression2> //一个常数
其中,<expression1>、cn、cm、<expression2>仅供协处理器使用,它们的作用如何取决于具体的协处理器。
@************************************************************************* @ 设置SDRAM,将第二部分代码复制到SDRAM,设置页表,启动MMU,然后跳到SDRAM继续执行 @ 2015.11.8 by Huangtao @************************************************************************* .text .global _start _start: ldr sp, =4096 @ 设置栈指针,以下都是C函数,调用前需要设好栈 bl disable_watch_dog @ 关闭WATCHDOG,否则CPU会不断重启 bl memsetup @ 设置存储控制器以使用SDRAM bl copy_2th_to_sdram @ 将第二部分代码复制到SDRAM bl create_page_table @ 设置页表 bl mmu_init @ 启动MMU ldr sp, =0xB4000000 @ 重设栈指针,指向SDRAM顶端(使用虚拟地址) ldr pc, =0xB0004000 @ 跳到SDRAM中继续执行第二部分代码LED halt_loop: b halt_loop
/******************************************************* 进行一些初始化,在Steppingstone中运行 init.c和head.S同属第一部分程序,此时MMU未开启,使用物理地址 2015.11.8 by Huangtao *///**************************************************** // WATCHDOG寄存器 #define WTCON (*(volatile unsigned long *)0x53000000) // 存储控制器的寄存器起始地址 #define MEM_CTL_BASE 0x48000000 // 关闭WATCHDOG,否则CPU会不断重启 void disable_watch_dog(void) { WTCON = 0; } // 设置存储控制器以使用SDRAM void memsetup(void) { // SDRAM 13个寄存器的值 unsigned long const mem_cfg_val[]={ 0x22011110, //BWSCON 0x00000700, //BANKCON0 0x00000700, //BANKCON1 0x00000700, //BANKCON2 0x00000700, //BANKCON3 0x00000700, //BANKCON4 0x00000700, //BANKCON5 0x00018005, //BANKCON6 0x00018005, //BANKCON7 0x008C07A3, //REFRESH 0x000000B1, //BANKSIZE 0x00000030, //MRSRB6 0x00000030, //MRSRB7 }; int i = 0; volatile unsigned long *p = (volatile unsigned long *)MEM_CTL_BASE; for(; i < 13; i++) p[i] = mem_cfg_val[i]; } // 将第二部分代码复制到SDRAM void copy_2th_to_sdram(void) { unsigned int *pdwSrc = (unsigned int *)2048; // SDRAM的开始16KB存放一级页表 unsigned int *pdwDest = (unsigned int *)0x30004000; // 2048~4096 2k while (pdwSrc < (unsigned int *)4096) { *pdwDest = *pdwSrc; pdwDest++; pdwSrc++; } } // 设置页表 void create_page_table(void) { // 用于段描述符的一些宏定义 #define MMU_FULL_ACCESS (3 << 10) // 访问权限,AP位设为11,读写都允许 #define MMU_DOMAIN (0 << 5) // 属于哪个域,设为0 #define MMU_SPECIAL (1 << 4) // 必须是1 #define MMU_CACHEABLE (1 << 3) // cacheable #define MMU_BUFFERABLE (1 << 2) // bufferable #define MMU_SECTION (2) // 表示这是段描述符 // C/B位没设置,不使用Cache和Write buffer #define MMU_SECDESC (MMU_FULL_ACCESS | MMU_DOMAIN | MMU_SPECIAL | \ MMU_SECTION) // 使用Cache和Write buffer // 在映射Steppingstone和SDRAM等内存时都使用该种 #define MMU_SECDESC_WB (MMU_FULL_ACCESS | MMU_DOMAIN | MMU_SPECIAL | \ MMU_CACHEABLE | MMU_BUFFERABLE | MMU_SECTION) // 一级页表段描述符大小1MB #define MMU_SECTION_SIZE 0x00100000 unsigned long virtuladdr, physicaladdr; unsigned long *mmu_tlb_base = (unsigned long *)0x30000000; // 将0~1M的虚拟地址映射到同样的物理地址 virtuladdr = 0; physicaladdr = 0; *(mmu_tlb_base + (virtuladdr >> 20)) = (physicaladdr & 0xFFF00000) | \ MMU_SECDESC_WB; // 0x56000000是GPIO寄存器的起始物理地址, // GPBCON和GPBDAT这两个寄存器的物理地址0x56000050、0x56000054, // 把从0xA0000000开始的1M虚拟地址空间映射到从0x56000000开始的1M物理地址空间 virtuladdr = 0xA0000000; physicaladdr = 0x56000000; *(mmu_tlb_base + (virtuladdr >> 20)) = (physicaladdr & 0xFFF00000) | \ MMU_SECDESC; // SDRAM的物理地址范围是0x30000000~0x33FFFFFF, // 将虚拟地址0xB0000000~0xB3FFFFFF映射到物理地址0x30000000~0x33FFFFFF上, // 总共64M,涉及64个段描述符 virtuladdr = 0xB0000000; physicaladdr = 0x30000000; while (virtuladdr < 0xB4000000) { *(mmu_tlb_base + (virtuladdr >> 20)) = (physicaladdr & 0xFFF00000) | \ MMU_SECDESC_WB; virtuladdr += 0x100000; physicaladdr += 0x100000; } } // 启动MMU void mmu_init(void) { unsigned long ttb = 0x30000000; // <MCR|MRC>{条件} 协处理器序号,常数1,CPU核寄存器,协处理器寄存器1,协处理器寄存器2,常数2 // MRC 从协处理器获得数据,传给ARM920T CPU核心寄存器 // MCR 数据从ARM920T CPU核心寄存器传给协处理器 __asm__( "mov r0, #0\n" "mcr p15, 0, r0, c7, c7, 0\n" /* 使无效ICaches和DCaches */ "mcr p15, 0, r0, c7, c10, 4\n" /* drain write buffer on v4 */ "mcr p15, 0, r0, c8, c7, 0\n" /* 使无效指令、数据TLB */ "mov r4, %0\n" /* r4 = 页表基址 */ "mcr p15, 0, r4, c2, c0, 0\n" /* 设置页表基址寄存器 */ "mvn r0, #0\n" "mcr p15, 0, r0, c3, c0, 0\n" /* 域访问控制寄存器设为0xFFFFFFFF, * 不进行权限检查 */ // 对于控制寄存器,先读出其值,在这基础上修改感兴趣的位,然后再写入 "mrc p15, 0, r0, c1, c0, 0\n" /* 读出控制寄存器的值 */ /* 控制寄存器的低16位含义为:.RVI ..RS B... .CAM * R : 表示换出Cache中的条目时使用的算法, * 0 = Random replacement;1 = Round robin replacement * V : 表示异常向量表所在的位置, * 0 = Low addresses = 0x00000000;1 = High addresses = 0xFFFF0000 * I : 0 = 关闭ICaches;1 = 开启ICaches * R、S : 用来与页表中的描述符一起确定内存的访问权限 * B : 0 = CPU为小字节序;1 = CPU为大字节序 * C : 0 = 关闭DCaches;1 = 开启DCaches * A : 0 = 数据访问时不进行地址对齐检查;1 = 数据访问时进行地址对齐检查 * M : 0 = 关闭MMU;1 = 开启MMU */ // 先清除不需要的位,往下若需要则重新设置它们 /* .RVI ..RS B... .CAM */ "bic r0, r0, #0x3000\n" /* ..11 .... .... .... 清除V、I位 */ "bic r0, r0, #0x0300\n" /* .... ..11 .... .... 清除R、S位 */ "bic r0, r0, #0x0087\n" /* .... .... 1... .111 清除B/C/A/M */ /* * 设置需要的位 */ "orr r0, r0, #0x0002\n" /* .... .... .... ..1. 开启对齐检查 */ "orr r0, r0, #0x0004\n" /* .... .... .... .1.. 开启DCaches */ "orr r0, r0, #0x1000\n" /* ...1 .... .... .... 开启ICaches */ "orr r0, r0, #0x0001\n" /* .... .... .... ...1 使能MMU */ "mcr p15, 0, r0, c1, c0, 0\n" /* 将修改的值写入控制寄存器 */ : /* 无输出 */ : "r" (ttb) ); }
/****************************************** Mini2440 LED_GPIO 属于第二部分程序,此时MMU已开启,使用虚拟地址 2015.11.8 by Huangtao *///****************************************** #define GPBCON (*(volatile unsigned long *)0xA0000010) //0x56000010 #define GPBDAT (*(volatile unsigned long *)0xA0000014) //0x56000014 #define GPB5_out (1<<(5*2)) #define GPB6_out (1<<(6*2)) #define GPB7_out (1<<(7*2)) #define GPB8_out (1<<(8*2)) /* static inline 这样可以使得编译leds.c时,wait嵌入main中,编译结果中只有main一个函数。 于是在连接时,main函数的地址就是由连接文件指定的运行时装载地址。 而连接文件mmu.lds中,指定了leds.o的运行时装载地址为0xB4004000, 这样,head.S中的“ldr pc, =0xB0004000”就是跳去执行main函数。 加volatile的原因是mini2440上带的arm-linux-gcc 4.4.3 会将其优化掉 Makefile编译选项中带有(-O0 -O1 -O2 -O3..) */ static inline void wait(volatile unsigned long dly) { for(; dly > 0; dly--); } int main(void) { unsigned long i = 0; GPBCON = GPB5_out|GPB6_out|GPB7_out|GPB8_out; // 将LED1-4对应的GPB5/6/7/8四个引脚设为输出 while(1) { wait(3000000); GPBDAT = (~(i<<5)); // 根据i的值,点亮LED1-4,实现流水 ++i; if(i == 16) i = 0; } return 0; }
SECTIONS { firtst 0x00000000 : { head.o init.o } second 0xB0004000 : AT(2048) { leds.o } } /* 第一个段,first内容是head.o和init.o,运行时应该位于0x00000000; 第二个段,second内容是leds.o,运行时应该位于0xB0004000; AT(2048)表示leds.o在链接成可执行文件时存放在什么位置,即载入地址; 0xB0004000 : AT(2048)这里指定了两个地址: 前者是虚拟地址0xB0004000,后者是载入地址AT(2048). first段没有AT(),则默认其载入地址等于虚拟地址0x00000000; */
objs := head.o init.o leds.o mmu.bin : $(objs) arm-linux-ld -Tmmu.lds -o mmu_elf $^ arm-linux-objcopy -O binary -S mmu_elf $@ arm-linux-objdump -D -m arm mmu_elf > mmu.dis %.o:%.c arm-linux-gcc -Wall -O2 -c -o $@ $< %.o:%.S arm-linux-gcc -Wall -O2 -c -o $@ $< clean: rm -f mmu.bin mmu_elf mmu.dis *.o
由于Makefile编译中带了优化-O2,导致LED全亮不闪烁,在wait延时中加入volatile可解决。