vboot完全解读
上半个月在学习bootloader,突然找到了一个非常好的vboot,vboot只有最基本的内核引导功能(基于s3c2440,从nand flash启动),对其深入研究后,发现对bootloader有了比较全面的理解,虽然没有像uboot那么多功能,但vboot已经实现了bootloader最核心的功能,其他像什么网络功能、烧写功能等等也只是一些裸机驱动而已。学习bootloader需要有汇编的基础,如果有单片机编程经验的话那更是“如鱼得水”了。
先看vboot的整体架构,下面是vboot包含的所有文件:
很简单是吧,其中核心的文件是head.S、main.c和nand.c,vboot.bin已经是编译出来的二进制文件,用于烧写在nand flash里。先看mem.lds文件,这是一个链接脚本,从那里可以找到程序的入口:
1 SECTIONS { 2 . = 000000; 3 .myhead ALIGN(0): {*(.text.FirstSector)} 4 .text ALIGN(512): { *(.text) } 5 .bss ALIGN(4) : { *(.bss*) *(COMMON) } 6 .data ALIGN(4) : { *(.data*) *(.rodata*) } 7 }
比较简单,程序入口位于text.FirstSector这个段里(因为程序是从nand flash的0地址开始执行的),它在head.S文件里定义:
1 .section .text.FirstSector 2 .globl first_sector 3 4 first_sector: 5 @ 0x00: Reset 6 b Reset 7 8 @ 0x04: Undefined instruction exception 9 UndefEntryPoint: 10 b UndefEntryPoint 11 12 @ 0x08: Software interrupt exception 13 SWIEntryPoint: 14 b SWIEntryPoint 15 16 @ 0x0c: Prefetch Abort (Instruction Fetch Memory Abort) 17 PrefetchAbortEnteryPoint: 18 b PrefetchAbortEnteryPoint 19 20 @ 0x10: Data Access Memory Abort 21 DataAbortEntryPoint: 22 b DataAbortEntryPoint 23 24 @ 0x14: Not used 25 NotUsedEntryPoint: 26 b NotUsedEntryPoint 27 28 @ 0x18: IRQ(Interrupt Request) exception 29 IRQEntryPoint: 30 b IRQHandle 31 32 @ 0x1c: FIQ(Fast Interrupt Request) exception 33 FIQEntryPoint: 34 b FIQEntryPoint 35 36 @0x20: Fixed address global value. will be replaced by downloader. 37 38 .long ZBOOT_MAGIC 39 .byte OS_TYPE, HAS_NAND_BIOS, (LOGO_POS & 0xFF), ((LOGO_POS >>8) &0xFF) 40 .long OS_START 41 .long OS_LENGTH 42 .long OS_RAM_START 43 .string LINUX_CMD_LINE
第5~34行的作用是安装异常向量表,在这里除了复位,其他异常都没有定义具体的执行代码。
1 .section .text 2 Reset: 3 @ 关闭看门狗 4 mov r1, #0x53000000 5 mov r2, #0x0 6 str r2, [r1] 7 8 @ 关闭中断 9 mov r1, #INT_CTL_BASE 10 mov r2, #0xffffffff 11 str r2, [r1, #oINTMSK] 12 ldr r2, =0x7ff 13 str r2, [r1, #oINTSUBMSK] 14 15 @ 初始化系统时钟 16 mov r1, #CLK_CTL_BASE 17 mvn r2, #0xff000000 18 str r2, [r1, #oLOCKTIME] @设置LOCKTIME寄存器 19 20 mov r1, #CLK_CTL_BASE 21 ldr r2, clkdivn_value 22 str r2, [r1, #oCLKDIVN] @设置分频寄存器 23 24 mrc p15, 0, r1, c1, c0, 0 @ read ctrl register 25 orr r1, r1, #0xc0000000 @ Asynchronous 异步总线模式 26 mcr p15, 0, r1, c1, c0, 0 @ write ctrl register 27 28 mov r1, #CLK_CTL_BASE 29 ldr r2, =S3C2440_UPLL_48MHZ_Fin12MHz 30 str r2, [r1, #oUPLLCON] 31 32 nop 33 nop 34 nop 35 nop 36 nop 37 nop 38 nop 39 nop 40 nop 41 42 ldr sp, DW_STACK_START @ setup stack pointer 43 44 ldr r2, mpll_value_USER @ clock user set 12MHz 45 str r2, [r1, #oMPLLCON] 46 bl memsetup 47 48 @ set GPIO for UART 49 mov r1, #GPIO_CTL_BASE 50 add r1, r1, #oGPIO_H 51 ldr r2, gpio_con_uart 52 str r2, [r1, #oGPIO_CON] 53 ldr r2, gpio_up_uart 54 str r2, [r1, #oGPIO_UP] 55 bl InitUART 56 57 58 @ get read to call C functions 59 mov fp, #0 @ no previous frame, so fp=0 60 mov a2, #0 @ set argv to NULL 61 62 bl Main 63 64 1: b 1b @
第4~6行,关闭看门狗,以免系统不断复位;第9~13行,关闭中断;第16~18行,设置系统时钟稳定(锁定)时间;第20~22行,设置时钟分频比为1:4:8(FCLK:HCLK:PCLK);第24~26行,设置为异步总线模式(因为FCLK已经不等于HCLK);第28~30,行,设置UPLL为48MHZ,用于USB通信;第42行,设置栈指针,为下面调用c程序做准备;第44~45行,设置FCLK为400MHZ,那么HCLK=100MHZ,PCLK=50MHZ;第46行,跳到内存初始化程序:
1 memsetup: 2 @ initialise the static memory 3 4 @ set memory control registers 5 mov r1, #MEM_CTL_BASE 6 adrl r2, mem_cfg_val 7 add r3, r1, #52 @13*4 8 1: ldr r4, [r2], #4 9 str r4, [r1], #4 10 cmp r1, r3 11 bne 1b 12 mov pc, lr
2440总共有13个设置内存的寄存器,因此第7行的立即数是52(13*4);第8~11行,通过循环设置13个寄存器的值。返回到memsetup下面的代码:
1 @ set GPIO for UART 2 mov r1, #GPIO_CTL_BASE 3 add r1, r1, #oGPIO_H 4 ldr r2, gpio_con_uart 5 str r2, [r1, #oGPIO_CON] 6 ldr r2, gpio_up_uart 7 str r2, [r1, #oGPIO_UP] 8 bl InitUART 9 10 11 @ get read to call C functions 12 mov fp, #0 @ no previous frame, so fp=0 13 mov a2, #0 @ set argv to NULL 14 15 bl Main 16 17 1: b 1b @
第2~8行,用于初始化串口(115200bps,8N1);第12~13行,设置两个arm寄存器;第15行,跳到Main函数执行。在main.c文件里:
1 void Main(void) 2 { 3 MMU_EnableICache(); 4 MMU_EnableDCache(); 5 6 Port_Init(); 7 NandInit(); 8 9 if (g_page_type == PAGE_UNKNOWN) { 10 Uart_SendString("\r\nunsupport NAND\r\n"); 11 for(;;); 12 } 13 14 GetParameters(); 15 16 Uart_SendString("loading Image of Linux from Nand Flash...\n\r"); 17 ReadImageFromNand(); 18 }
第3~4行,使能Dcache和Icache:
static inline void MMU_EnableICache(void) { asm ( "mrc p15,0,r0,c1,c0,0\n" "orr r0,r0,#(1<<12)\n" "mcr p15,0,r0,c1,c0,0\n" ); } static inline void MMU_EnableDCache(void) { asm ( "mrc p15,0,r0,c1,c0,0\n" "orr r0,r0,#(1<<2)\n" "mcr p15,0,r0,c1,c0,0\n" ); }
第6行,初始化一些IO口(没用到);第7行,初始化nand flash控制器,在nand.c文件里定义:
void NandInit(void) { NFCONF = (TACLS << 12) | (TWRPH0 << 8) | (TWRPH1 << 4) | (0 << 0); NFCONT = (0 << 13) | (0 << 12) | (0 << 10) | (0 << 9) | (0 << 8) | (0 << 6) | (0 << 5) | (1 << 4) | (1 << 1) | (1 << 0); NFSTAT = 0; NandReset(); NandCheckId(); }
设置具体nand flash芯片的时序参数、页的大小和位宽等,初始化之后,就可以读写nand flash了。回到Main函数的第14行调用的GetParameters()函数的定义:
static inline void GetParameters(void) { U32 Buf[2048]; g_os_type = OS_LINUX; //内核在flash中的起始地址 g_os_start = 0x50000; //内核映像的大小 g_os_length = 0x300000; //内核被拷贝到内存的起始地址 g_os_ram_start = 0x30008000; // vivi LINUX CMD LINE //从flash的参数分区中读命令行参数 NandReadOneSector((U8 *)Buf, 0x40000); if (Buf[0] == 0x49564956 && Buf[1] == 0x4C444D43) { memcpy(g_linux_cmd_line, (char *)&(Buf[2]), sizeof g_linux_cmd_line); } }
设置了内核映像在nand flash的起始地址和大小,还有设置内核映像被拷贝到ram的起始地址,命令行参数是通过BIOS(nor flash里的supervivi)写到nand flash的0x40000地址处,通过NandReadOneSector()把它读出来,其中Buf[0]、Buf[1]这两个值是“暗藏值”,是对应于具体的BIOS的,是由BIOS写进去的,位于命令行参数的第一和第二个字,因为BIOS的代码不不开源的,无法修改,所以移植vboot的时候只要是用这个BIOS来烧写vboot就不用修改两个值(不用太纠结,我曾纠结了很久)。从memcpy()函数也可以知道,Buf[0]和Buf[1]这两个值是用来识别具体的BIOS的,没用于命令行参数。现在看NandReadOneSector()函数:
1 int NandReadOneSector(U8 * buffer, U32 addr) 2 { 3 int ret; 4 5 switch(g_page_type) { 6 case PAGE512: 7 ret = NandReadOneSectorP512(buffer, addr); 8 break; 9 case PAGE2048: 10 ret = NandReadOneSectorP2048(buffer, addr); 11 break; 12 default: 13 for(;;); 14 } 15 return ret; 16 }
因为我板子(GT2440)上的nand flash是64M的,页的大小为512字节,所以看第7行的调用:
static inline int NandReadOneSectorP512(U8 * buffer, U32 addr) { U32 sector; sector = addr >> 9; NandReset(); #if 0 NF_RSTECC(); NF_MECC_UnLock(); #endif NF_nFCE_L(); NF_CLEAR_RB(); NF_CMD(0x00); NF_ADDR(0x00); NF_ADDR(sector & 0xff); NF_ADDR((sector >> 8) & 0xff); NF_ADDR((sector >> 16) & 0xff); delay(); NF_DETECT_RB(); ReadPage512(buffer, &NFDATA); #if 0 NF_MECC_Lock(); #endif NF_nFCE_H(); return 1; }
该函数里前面那些是设置读操作,设置读起始地址,核心是调用ReadPage512()函数,它由汇编实现,在head.S里:
1 .globl ReadPage512 2 3 ReadPage512: 4 stmfd sp!, {r2-r7} @ 将r2~r7寄存器的值压栈 5 mov r2, #0x200 @ 512个字节 6 7 1: 8 ldr r4, [r1] 9 ldr r5, [r1] 10 ldr r6, [r1] 11 ldr r7, [r1] 12 stmia r0!, {r4-r7} 13 ldr r4, [r1] 14 ldr r5, [r1] 15 ldr r6, [r1] 16 ldr r7, [r1] 17 stmia r0!, {r4-r7} 18 ldr r4, [r1] 19 ldr r5, [r1] 20 ldr r6, [r1] 21 ldr r7, [r1] 22 stmia r0!, {r4-r7} 23 ldr r4, [r1] 24 ldr r5, [r1] 25 ldr r6, [r1] 26 ldr r7, [r1] 27 stmia r0!, {r4-r7} 28 subs r2, r2, #64 @ 一次循环读64个字节 29 bne 1b; 30 ldmfd sp!, {r2-r7} @ 恢复r2~r7寄存器的值 31 mov pc,lr @ 返回
挺好懂的,不多解析。再回到Main()函数的17行(最后一个函数调用)调用ReadImageFromNand():
1 void ReadImageFromNand(void) 2 { 3 unsigned int Length; 4 U8 *RAM; 5 unsigned BlockNum; 6 unsigned pos; 7 8 Length = g_os_length; 9 //内核的大小(单位:块) 10 Length = (Length + BLOCK_SIZE - 1) >> (BYTE_SECTOR_SHIFT + SECTOR_BLOCK_SHIFT) << (BYTE_SECTOR_SHIFT + SECTOR_BLOCK_SHIFT); // align to Block Size 11 //内核在flash中的第几块 12 BlockNum = g_os_start >> (BYTE_SECTOR_SHIFT + SECTOR_BLOCK_SHIFT); 13 //要拷贝到的起始地址 14 RAM = (U8 *) g_os_ram_start; 15 for (pos = 0; pos < Length; pos += BLOCK_SIZE) { 16 unsigned int i; 17 // skip badblock 18 //坏块检测 19 for (;;) { 20 if (NandIsGoodBlock 21 (BlockNum << 22 (BYTE_SECTOR_SHIFT + SECTOR_BLOCK_SHIFT))) { 23 break; 24 } 25 BlockNum++; //try next 26 } 27 for (i = 0; i < BLOCK_SIZE; i += SECTOR_SIZE) { 28 int ret = 29 NandReadOneSector(RAM, 30 (BlockNum << 31 (BYTE_SECTOR_SHIFT + 32 SECTOR_BLOCK_SHIFT)) + i); 33 RAM += SECTOR_SIZE; 34 ret = 0; 35 36 } 37 38 BlockNum++; 39 } 40 41 CallLinux(); 42 }
主要是从nand flash里把内核映像一块一块地读到ram里,每读一块之前先进行坏块检测,如果是坏块就跳过,继续读下一块(这里的坏块检测是一个比较粗略的检测方法),直到把整个内核映像读到ram里面。这里内核映像的大小设置为3M(实际上不到3M),因此读也是读3M大小到ram里面。最后该函数的第41行调用CallLinux():
1 static void CallLinux(void) 2 { 3 struct param_struct { 4 union { 5 struct { 6 unsigned long page_size; /* 0 */ 7 unsigned long nr_pages; /* 4 */ 8 unsigned long ramdisk_size; /* 8 */ 9 unsigned long flags; /* 12 */ 10 unsigned long rootdev; /* 16 */ 11 unsigned long video_num_cols; /* 20 */ 12 unsigned long video_num_rows; /* 24 */ 13 unsigned long video_x; /* 28 */ 14 unsigned long video_y; /* 32 */ 15 unsigned long memc_control_reg; /* 36 */ 16 unsigned char sounddefault; /* 40 */ 17 unsigned char adfsdrives; /* 41 */ 18 unsigned char bytes_per_char_h; /* 42 */ 19 unsigned char bytes_per_char_v; /* 43 */ 20 unsigned long pages_in_bank[4]; /* 44 */ 21 unsigned long pages_in_vram; /* 60 */ 22 unsigned long initrd_start; /* 64 */ 23 unsigned long initrd_size; /* 68 */ 24 unsigned long rd_start; /* 72 */ 25 unsigned long system_rev; /* 76 */ 26 unsigned long system_serial_low; /* 80 */ 27 unsigned long system_serial_high; /* 84 */ 28 unsigned long mem_fclk_21285; /* 88 */ 29 } s; 30 char unused[256]; 31 } u1; 32 union { 33 char paths[8][128]; 34 struct { 35 unsigned long magic; 36 char n[1024 - sizeof(unsigned long)]; 37 } s; 38 } u2; 39 char commandline[1024]; 40 }; 41 //启动参数在内存的起始地址 42 struct param_struct *p = (struct param_struct *)0x30000100; 43 memset(p, 0, sizeof(*p)); 44 memcpy(p->commandline, g_linux_cmd_line, sizeof(g_linux_cmd_line)); 45 //内存页的大小4K 46 p->u1.s.page_size = 4 * 1024; 47 //内存总共有多少页 48 p->u1.s.nr_pages = 64 * 1024 * 1024 / (4 * 1024); 49 50 { 51 unsigned int *pp = (unsigned int *)(0x30008024); 52 if (pp[0] == 0x016f2818) { //zImage的魔数,在内核中定义 53 //Uart_SendString("\n\rOk\n\r"); 54 } else { 55 Uart_SendString("\n\rWrong Linux Kernel\n\r"); 56 for (;;) ; 57 } 58 59 } 60 asm ( 61 "mov r5, %2\n" 62 "mov r0, %0\n" 63 "mov r1, %1\n" 64 "mov ip, #0\n" 65 "mov pc, r5\n" 66 "nop\n" "nop\n": /* no outpus */ 67 :"r"(0), "r"(782), "r"(g_os_ram_start) 68 ); 69 }
首先定义了一个struct param_struct结构体变量,从这里就可以看出,vboot用的是旧的方式(新的是用tag方式),struct param_struct与内核里定义的一样。第41~59行,看注释可以明白,第60~67行,是内核的一些约定:
R0 = 0
R1 = 机器ID
.....
最后第65行,设置pc为内核映像在内存中的起始地址,直接跳到内核映像的入口,从而开始内核代码的执行......
总结:
vboot是一个十分精简的bootloader,从nand flash启动,目前只支持2440 Linux,只有引导内核的功能,它的编译后的二进制文件不会超过4K(这是由2440从nand flash启动所限制的),编译vboot只需要在代码目录下执行make,便可生成vboot.bin文件,通过BIOS将它烧写到nand flash里。强烈推荐想学习ARM bootloader的同学从vboot开始入手。