Mini2440内存管理单元MMU

一级页表:

TTB base代表一级页表的地址,将它写入协处理器CP15的寄存器C2(称为页表基址寄存器)即可,一级页表的地址是16K对齐,使用[31:14]存储页表基址,[13:0]为0。一级页表使用4096个描述符来表示4GB空间,每个描述符对应1MB的虚拟地址,要么存储它对应的1MB物理空间的起始地址,要么存储下一级页表的地址。使用MVA[31:20]来索引一级页表(2^12=4096个描述符),得到一个描述符,每个描述符占4个字节。

一级描述符低两位:
00:无效(Fault)
01:粗页表(Coarse page table)
  [31:10]为粗页表基址,此描述符低10位填充0后就是一个二级页表的物理地址,二级页表含256个条目([9:2]),
  每个条目表示4KB大小的物理地址,一个粗页表表示1MB物理地址。
10:段(Section)
  [31:20]为段基址,此描述符低20位填充0后就是一块1MB物理地址空间的起始地址。MVA[19:0]用来在这1MB空间中寻址。 
  以段的方式进行映射时,虚拟地址MVA到物理地址PA的转换过程如下:
  ①页表基址寄存器位[31:14]和MVA[31:20]组成一个低两位为0的32位地址,MMU利用这个地址找到段描述符
  ②取出段描述符的位[31:20](段基址),它和MVA[19:0]组成一个32位的物理地址(这就是MVA对应的PA)
 

 

11:细页表(Fine page table)

  [31:12]为细页表基址(Fine page table base address),此描述符的低12位填充0后,就是一个二级页表的物理地址。

  此二级页表含1024个条目([11:2]),其中每个条目表示大小1kb的物理地址空间,一个细页表表示1MB物理地址空间。

 

二级页表:

以大页(64KB),小页(4KB)或极小页(1KB)进行地址映射时,需要用到二级页表,二级页表有粗页表、细页表两种,二级页表描述符格式如下:

 

 

 

由于本次程序只使用一级页表,以段的方式进行地址映射。所以二级页表的4种情况就不总结了,看书。

 

内存的访问权限检查:

它决定一块内存是否允许读、是否允许写。这由CP15寄存器C3(域访问控制)、描述符的域(Domain)、CP15寄存器C1的R/S/A位、描述符的AP位共同决定。

“域”决定是否对某块内存进行权限检查,“AP”决定如何对某块内容进行权限检查。

S3C2440有16个域,CP15寄存器C3中每两位对应一个域(一共32位)。

00:无访问权限(任何访问都将导致“Domain fault”异常)

01:客户模式(使用段描述符、页描述符进行权限检查)

10:保留(保留,目前相当于“无访问权限”)

11:管理模式(不进行权限检查,允许任何访问)

Domain占用4位,用来表示内存属于0-15,哪一个域,例如:

粗页表中的“Domain”为0b1010,表示1MB内存属于域10,如果域访问控制寄存器的[21:20]等于0b01,则使用描述符中的"AP"位进行权限检查,如果等于0b11,则不进行权限检查,允许任何访问。

AP、ap3、ap2、ap1、ap0结合CP15寄存器C1的R/S位,决定如何进行访问检查。

下表为AP、S、R的对照表

 

AP S R 特权模式 用户模式 说明
00 0 0 无访问权限 无访问权限 任何访问将产生“Permission fault”异常
00 1 0 只读 无访问权限 在超级权限下可以进行读操作
00 0 1 只读 只读 任何写操作将产生”Permission fault“异常
00 1 1 保留 - -
01 x x 读/写 无访问权限 只允许在超级模式下访问
10 x x 读/写 只读 在用户模式下进行写操作将产生"Permission fault"异常
11 x x 读/写 读/写 在所有模式下允许任何访问
xx 1 1 保留 - -

 

转译查找缓存(Translation Lookaside Buffers, TLB)

Cache:

S2C2440内置了指令Cache(ICaches)、数据Cache(DCaches)、写缓存(Write buffer),需要用到描述符中的C位(Ctt)和B位(Btt)。

S3C2440 MMU、TLB、Cache的控制指令:

S3C2440除了ARM920T的CPU核心外,还有若干个协处理器,用来帮助主CPU完成一些特殊功能。对MMU、TLB、Cache等的操作涉及到协处理器。

<MCR|MRC> {cond} p#,<expression1>,Rd,cn,cm{,<expression2>}

MRC            //从协处理器获得数据,传给ARM920T CPU核心寄存器

MCR            //数据从ARM920T CPU核心寄存器传给协处理器

{cond}           //执行条件,省略时表示无条件执行

p#              //协处理器序号

<expression1>    //一个常数

Rd             //ARM920T CPU核心的寄存器

cn和cm               //协处理器中的寄存器

<expression2>   //一个常数

其中,<expression1>、cn、cm、<expression2>仅供协处理器使用,它们的作用如何取决于具体的协处理器。

 

@*************************************************************************
@ 设置SDRAM,将第二部分代码复制到SDRAM,设置页表,启动MMU,然后跳到SDRAM继续执行
@ 2015.11.8 by Huangtao
@*************************************************************************       

.text
.global _start
_start:
    ldr sp, =4096                       @ 设置栈指针,以下都是C函数,调用前需要设好栈
    bl  disable_watch_dog               @ 关闭WATCHDOG,否则CPU会不断重启
    bl  memsetup                        @ 设置存储控制器以使用SDRAM
    bl  copy_2th_to_sdram               @ 将第二部分代码复制到SDRAM
    bl  create_page_table               @ 设置页表
    bl  mmu_init                        @ 启动MMU
    ldr sp, =0xB4000000                 @ 重设栈指针,指向SDRAM顶端(使用虚拟地址)
    ldr pc, =0xB0004000                 @ 跳到SDRAM中继续执行第二部分代码LED
halt_loop:
    b   halt_loop
/*******************************************************
进行一些初始化,在Steppingstone中运行
init.c和head.S同属第一部分程序,此时MMU未开启,使用物理地址
2015.11.8 by Huangtao
*///****************************************************
 
// WATCHDOG寄存器
#define WTCON           (*(volatile unsigned long *)0x53000000)
// 存储控制器的寄存器起始地址
#define MEM_CTL_BASE    0x48000000

// 关闭WATCHDOG,否则CPU会不断重启
void disable_watch_dog(void)
{
    WTCON = 0;  
}

// 设置存储控制器以使用SDRAM
void memsetup(void)
{
    // SDRAM 13个寄存器的值
    unsigned long const mem_cfg_val[]={ 0x22011110,        //BWSCON
                                        0x00000700,     //BANKCON0
                                        0x00000700,     //BANKCON1
                                        0x00000700,     //BANKCON2
                                        0x00000700,     //BANKCON3  
                                        0x00000700,     //BANKCON4
                                        0x00000700,     //BANKCON5
                                        0x00018005,     //BANKCON6
                                        0x00018005,     //BANKCON7
                                        0x008C07A3,     //REFRESH
                                        0x000000B1,     //BANKSIZE
                                        0x00000030,     //MRSRB6
                                        0x00000030,     //MRSRB7
    };
    int i = 0;
    volatile unsigned long *p = (volatile unsigned long *)MEM_CTL_BASE;
    for(; i < 13; i++)
        p[i] = mem_cfg_val[i];
}

// 将第二部分代码复制到SDRAM
void copy_2th_to_sdram(void)
{
    unsigned int *pdwSrc  = (unsigned int *)2048;
    // SDRAM的开始16KB存放一级页表
    unsigned int *pdwDest = (unsigned int *)0x30004000;
    
    // 2048~4096 2k
    while (pdwSrc < (unsigned int *)4096)
    {
        *pdwDest = *pdwSrc;
        pdwDest++;
        pdwSrc++;
    }
}

// 设置页表
void create_page_table(void)
{
// 用于段描述符的一些宏定义
#define MMU_FULL_ACCESS     (3 << 10)   // 访问权限,AP位设为11,读写都允许 
#define MMU_DOMAIN          (0 << 5)    // 属于哪个域,设为0 
#define MMU_SPECIAL         (1 << 4)    // 必须是1
#define MMU_CACHEABLE       (1 << 3)    // cacheable
#define MMU_BUFFERABLE      (1 << 2)    // bufferable
#define MMU_SECTION         (2)         // 表示这是段描述符
// C/B位没设置,不使用Cache和Write buffer
#define MMU_SECDESC         (MMU_FULL_ACCESS | MMU_DOMAIN | MMU_SPECIAL | \
                             MMU_SECTION)
// 使用Cache和Write buffer
// 在映射Steppingstone和SDRAM等内存时都使用该种
#define MMU_SECDESC_WB      (MMU_FULL_ACCESS | MMU_DOMAIN | MMU_SPECIAL | \
                             MMU_CACHEABLE | MMU_BUFFERABLE | MMU_SECTION)
// 一级页表段描述符大小1MB
#define MMU_SECTION_SIZE    0x00100000

    unsigned long virtuladdr, physicaladdr;
    unsigned long *mmu_tlb_base = (unsigned long *)0x30000000;
    
    // 将0~1M的虚拟地址映射到同样的物理地址
    virtuladdr = 0;
    physicaladdr = 0;
    *(mmu_tlb_base + (virtuladdr >> 20)) = (physicaladdr & 0xFFF00000) | \
                                            MMU_SECDESC_WB;

    // 0x56000000是GPIO寄存器的起始物理地址,
    // GPBCON和GPBDAT这两个寄存器的物理地址0x56000050、0x56000054,
    // 把从0xA0000000开始的1M虚拟地址空间映射到从0x56000000开始的1M物理地址空间
    virtuladdr = 0xA0000000;
    physicaladdr = 0x56000000;
    *(mmu_tlb_base + (virtuladdr >> 20)) = (physicaladdr & 0xFFF00000) | \
                                            MMU_SECDESC;

    // SDRAM的物理地址范围是0x30000000~0x33FFFFFF,
    // 将虚拟地址0xB0000000~0xB3FFFFFF映射到物理地址0x30000000~0x33FFFFFF上,
    // 总共64M,涉及64个段描述符
    virtuladdr = 0xB0000000;
    physicaladdr = 0x30000000;
    while (virtuladdr < 0xB4000000)
    {
        *(mmu_tlb_base + (virtuladdr >> 20)) = (physicaladdr & 0xFFF00000) | \
                                                MMU_SECDESC_WB;
        virtuladdr += 0x100000;
        physicaladdr += 0x100000;
    }
}

// 启动MMU
void mmu_init(void)
{
    unsigned long ttb = 0x30000000;
// <MCR|MRC>{条件} 协处理器序号,常数1,CPU核寄存器,协处理器寄存器1,协处理器寄存器2,常数2
// MRC 从协处理器获得数据,传给ARM920T CPU核心寄存器
// MCR 数据从ARM920T CPU核心寄存器传给协处理器
__asm__(
    "mov    r0, #0\n"
    "mcr    p15, 0, r0, c7, c7, 0\n"    /* 使无效ICaches和DCaches */
    
    "mcr    p15, 0, r0, c7, c10, 4\n"   /* drain write buffer on v4 */
    "mcr    p15, 0, r0, c8, c7, 0\n"    /* 使无效指令、数据TLB */
    
    "mov    r4, %0\n"                   /* r4 = 页表基址 */
    "mcr    p15, 0, r4, c2, c0, 0\n"    /* 设置页表基址寄存器 */
    
    "mvn    r0, #0\n"                   
    "mcr    p15, 0, r0, c3, c0, 0\n"    /* 域访问控制寄存器设为0xFFFFFFFF,
                                         * 不进行权限检查 
                                         */    
    // 对于控制寄存器,先读出其值,在这基础上修改感兴趣的位,然后再写入
    "mrc    p15, 0, r0, c1, c0, 0\n"    /* 读出控制寄存器的值 */
    
    /* 控制寄存器的低16位含义为:.RVI ..RS B... .CAM
     * R : 表示换出Cache中的条目时使用的算法,
     *     0 = Random replacement;1 = Round robin replacement
     * V : 表示异常向量表所在的位置,
     *     0 = Low addresses = 0x00000000;1 = High addresses = 0xFFFF0000
     * I : 0 = 关闭ICaches;1 = 开启ICaches
     * R、S : 用来与页表中的描述符一起确定内存的访问权限
     * B : 0 = CPU为小字节序;1 = CPU为大字节序
     * C : 0 = 关闭DCaches;1 = 开启DCaches
     * A : 0 = 数据访问时不进行地址对齐检查;1 = 数据访问时进行地址对齐检查
     * M : 0 = 关闭MMU;1 = 开启MMU
     */
    
    // 先清除不需要的位,往下若需要则重新设置它们
                                        /* .RVI ..RS B... .CAM */ 
    "bic    r0, r0, #0x3000\n"          /* ..11 .... .... .... 清除V、I位 */
    "bic    r0, r0, #0x0300\n"          /* .... ..11 .... .... 清除R、S位 */
    "bic    r0, r0, #0x0087\n"          /* .... .... 1... .111 清除B/C/A/M */

    /*
     * 设置需要的位
     */
    "orr    r0, r0, #0x0002\n"          /* .... .... .... ..1. 开启对齐检查 */
    "orr    r0, r0, #0x0004\n"          /* .... .... .... .1.. 开启DCaches */
    "orr    r0, r0, #0x1000\n"          /* ...1 .... .... .... 开启ICaches */
    "orr    r0, r0, #0x0001\n"          /* .... .... .... ...1 使能MMU */
    
    "mcr    p15, 0, r0, c1, c0, 0\n"    /* 将修改的值写入控制寄存器 */
    : /* 无输出 */
    : "r" (ttb) );
}
/******************************************
Mini2440 LED_GPIO
属于第二部分程序,此时MMU已开启,使用虚拟地址
2015.11.8 by Huangtao
*///******************************************

#define GPBCON (*(volatile unsigned long *)0xA0000010) //0x56000010
#define GPBDAT (*(volatile unsigned long *)0xA0000014) //0x56000014

#define GPB5_out (1<<(5*2))
#define GPB6_out (1<<(6*2))
#define GPB7_out (1<<(7*2))
#define GPB8_out (1<<(8*2))

/*
 static inline
 这样可以使得编译leds.c时,wait嵌入main中,编译结果中只有main一个函数。
 于是在连接时,main函数的地址就是由连接文件指定的运行时装载地址。
 而连接文件mmu.lds中,指定了leds.o的运行时装载地址为0xB4004000,
 这样,head.S中的“ldr pc, =0xB0004000”就是跳去执行main函数。

 加volatile的原因是mini2440上带的arm-linux-gcc 4.4.3 会将其优化掉
 Makefile编译选项中带有(-O0 -O1 -O2 -O3..) 
 */
static inline void wait(volatile unsigned long dly)
{
    for(; dly > 0; dly--);
}

int main(void)
{
    unsigned long i = 0;
    GPBCON = GPB5_out|GPB6_out|GPB7_out|GPB8_out; // 将LED1-4对应的GPB5/6/7/8四个引脚设为输出
    
    while(1)
    {
        wait(3000000);
        GPBDAT = (~(i<<5)); // 根据i的值,点亮LED1-4,实现流水
        ++i;
        if(i == 16)
            i = 0;                                    
    }

    return 0;
}
SECTIONS { 
  firtst    0x00000000 : { head.o init.o }
  second    0xB0004000 : AT(2048) { leds.o }
} 
/*
第一个段,first内容是head.o和init.o,运行时应该位于0x00000000;
第二个段,second内容是leds.o,运行时应该位于0xB0004000;
AT(2048)表示leds.o在链接成可执行文件时存放在什么位置,即载入地址;
0xB0004000 : AT(2048)这里指定了两个地址:
前者是虚拟地址0xB0004000,后者是载入地址AT(2048).
first段没有AT(),则默认其载入地址等于虚拟地址0x00000000;
*/
objs := head.o init.o leds.o

mmu.bin : $(objs)
    arm-linux-ld -Tmmu.lds -o mmu_elf $^
    arm-linux-objcopy -O binary -S mmu_elf $@
    arm-linux-objdump -D -m arm mmu_elf > mmu.dis
    
%.o:%.c
    arm-linux-gcc -Wall -O2 -c -o $@ $< 

%.o:%.S
    arm-linux-gcc -Wall -O2 -c -o $@ $<

clean:
    rm -f mmu.bin mmu_elf mmu.dis *.o        
    

由于Makefile编译中带了优化-O2,导致LED全亮不闪烁,在wait延时中加入volatile可解决。

posted @ 2015-11-08 13:35  ht-beyond  阅读(1183)  评论(0编辑  收藏  举报