u-boot源码分析之C语言段
题外话:
最近一直在学习u-boot的源代码,从代码量到代码风格,都让我认识到什么才是真正的程序。以往我所学到的C语言知识和u-boot的源代码相比,实在不值一提。说到底,机器都是0和1控制的。感觉这很像我们中国《易经》里的一句话:“太极生两仪,两仪生四象。”两仪指的就是阴阳、天地,对立而又相互依存的一切,它们生成了天地万物。简单的0和1就构成了我们现在所用的操作系统,各种软件。硬件也是由高低电平控制,0和1就是万物。
刚刚在读一本科幻小说,里面提到一种叫做“脑域”的新兴技术,意思是类比于物联网,将人类的大脑互相联网形成脑联网,俗称“脑域”。研究脑域的专家们住在最好的实验室大楼里研究技术。实验室大楼十分豪华,一切设备都是最先进的,一切生活用品、娱乐用品一应俱全。这些专家们就在这最好的环境下研究脑域技术。但是一个研究水稻的人说:“你们自以为研究脑域是在帮助这个社会,实际上这种技术也不过昙花一现罢了。我知道你们每年的产值高达几十个亿,但这又有什么用呢?你们以为自己在为社会造福,把脖子伸出窗外看看吧,在你们豪华的大楼下就是普通的市井生活,他们的生活环境脏乱差,人们的生活水平没有得到提高。人们的素质水平也没有得到提高。你们的研究就像阳春白雪,似乎很有用,但不能拯救这个社会。真正能帮这个社会的,只有那些最基本的东西,看似最无用的东西。人人都能够得到,人人都能够受益,才会真正让人们进步。”
我思考了一下刚刚那句话,想我是不是正在研究的也是和人们生活完全不相关的东西。在宿舍里,在办公室里,研究着新兴技术,自以为是在造福社会,实际上做的事情却丝毫不会影响人们的生活?
我想为开源世界贡献自己的力量,开发嵌入式系统,更好的控制硬件,制造出人人都能买的起的可穿戴设备,而不是什么黑科技。所以我觉得是有意义的,从这门技术的发展方向来看。我大胆预测一下吧,未来的可穿戴设备可能会发展成类似于一枚戒指的东东,一定是便于携带的,便于使用的形式存在。在尊重版权的情况下开源代码减少软件开发成本,用材料和结构减少硬件成本。让人人都买的起可穿戴设备,就像每个人都买的起手表,这才是真正的让人们受益。让大家都感到方便,感受到新科技的美好。
科技在进步,这是必然趋势。不要害怕这种进步,而是要提高自身的道德素养。道德必须凌驾于科技之上。
1.从我们的start_armboot开始讲起
u-boot整体由汇编段和C语言段外加连接脚本组成。关于汇编段请看我之前的博客《u-boot源码汇编段简要分析》,好,让我们进入start_armboot函数。
这里首先涉及到的是一个叫做gd_t的结构体指针。给它分配了一块内存。位于CFG_GBL_DATA_SIZE。我们把它打开来看:
从作者的注释我们可以知道,这个结构体的作用是针对某些初始化较早的内存空间。在设置存储控制器之前,系统初始化的时候进行一些全局变量的定义。看里面的内容,涉及到了环境地址变量、环境检测变量、帧缓冲区的基地址、展示模式、CPU时钟、总线时钟、RAM大小、复位状态寄存器等等。回到start_armboot函数,我们接着往下看:
在这里涉及到了init_sequence结构体,打开来看:
这个结构体里面包含了cpu初始化、单板初始化、中断初始化、环境初始化、波特率初始化、串行通信、CPUINFO、BOARDINFO、RAM块等等一系列初始化函数。回到start_armboot函数接着往下看:
在这里红框圈起来的是对Flash的初始化,flash_init()是对Nor Flash初始化,nand_init()是对Nand Flash初始化。中间是对LCD或者VFD进行初始化,并分配内存。接下来是一个 env_relocate ()函数,这个函数是对环境变量进行初始化。所谓的环境变量就是我们在用u-boot的时候从哪里读出内核,从哪里启动内核等一系列信息,如下图:
其中bootcmd就表示你把内核读到哪里。这里明显是把内核读到0x30007FC0地址上,然后bootm 0x0007FC0,也就是启动该地址上的内核。这里还有波特率、IP地址、bootargs等u-boot环境变量。
最后我们进入了一个循环:main_loop();这是最重要的一个函数。
2.main_loop()函数
char *s; s = getenv ("bootcmd"); # ifndef CFG_HUSH_PARSER { printf("Booting Linux ...\n"); run_command (s, 0); } len = readline (CFG_PROMPT); rc = run_command (lastcommand, flag);
u-boot代码量很大,对于各种硬件初始化函数特别多,所以这里博主把最关键的语句摘出来。方便大家分析。这里的getenv是获取环境变量,u-boot在启动时会首先获取环境变量,所谓的环境变量我们上面通过u-boot打印出的信息就可以知道。这里的环境变量有两种,如果u-boot获取到了FLASH上的环境变量则应用此环境变量启动,否则使用默认的环境变量启动。如果在u-boot启动期间我们没有按下空格键,则在串口打印出“Booting Linux...”,并执行函数run_command启动内核。如果我们按下了空格键,则进入下面的分支语句,进入u-boot界面,readline函数获取我们输入的命令,run_command执行命令。所以run_command这个函数作用很大。
if ((argc = parse_line (finaltoken, argv)) == 0) { rc = -1; /* no command at all */ continue; } /* Look up command in command table */ if ((cmdtp = find_cmd(argv[0])) == NULL) { printf ("Unknown command '%s' - try 'help'\n", argv[0]); rc = -1; /* give up after bad command */ continue; } /* found - check max args */ if (argc > cmdtp->maxargs) { printf ("Usage:\n%s\n", cmdtp->usage); rc = -1; continue; }
在run_command函数中,我们能够看到,首先,parse_line函数是对我们输入的命令进行解析。一般我们在u-boot输入的命令大概是这样的:“命令,参数0,参数1,...”,所以由parse_line函数进行解析:argv[0]="命令字符串",argv[1]="参数1",argv[2]="参数2",...等等。而find_cmd则相当于一个switch,它把我们输入的命令与在u-boot中定义的各种命令相比对,若吻合则执行相应的函数操作。若遍历所有的命令名均没有我们输入的命令,则报错。在u-boot中,我们不是通过简单的switch进行命令的选择和函数的执行,而是将每个命令定义成结构体。我们进入find_cmd进行分析:
/* * Some commands allow length modifiers (like "cp.b"); * compare command name only until first dot. */ len = ((p = strchr(cmd, '.')) == NULL) ? strlen (cmd) : (p - cmd); for (cmdtp = &__u_boot_cmd_start; cmdtp != &__u_boot_cmd_end; cmdtp++) { if (strncmp (cmd, cmdtp->name, len) == 0) { if (len == strlen (cmdtp->name)) return cmdtp; /* full match */ cmdtp_temp = cmdtp; /* abbreviated command ? */ n_found++; } } if (n_found == 1) { /* exactly one match */ return cmdtp_temp; }
这是find_cmd函数的主要代码,这里根据作者的注释我们可以知道,和我们刚刚讲的一样,就是进行命令名的比对。strncmp大家都很熟悉这个字符串比较函数,若比对成功则返回这个命令的结构体指针,否则继续遍历,若最终没有找到则报错。这里的__u_boot_cmd_start和__u_boot_cmd_end是在u-boot.lds连接脚本里定义。
__u_boot_cmd_start = .;
.u_boot_cmd : { *(.u_boot_cmd) }
__u_boot_cmd_end = .;
对于这里的u_boot_cmd大家可能不知道它是干什么的,在哪里定义的。通过查找,我们可以发现在Command.h中有一段相关的定义,是一个结构体:
#define Struct_Section __attribute__ ((unused,section (".u_boot_cmd")))
现在我们还是不知道它是干嘛的,在此搜索bootm,在Cmd_bootm.c中,我们看到了这样的一个定义:
U_BOOT_CMD( bootm, CFG_MAXARGS, 1, do_bootm, "bootm - boot application image from memory\n", "[addr [arg ...]]\n - boot application image stored in memory\n" "\tpassing arguments 'arg ...'; when booting a Linux kernel,\n" "\t'arg' can be the address of an initrd image\n" #ifdef CONFIG_OF_FLAT_TREE "\tWhen booting a Linux kernel which requires a flat device-tree\n" "\ta third argument is required which is the address of the of the\n" "\tdevice-tree blob. To boot that kernel without an initrd image,\n" "\tuse a '-' for the second argument. If you do not pass a third\n" "\ta bd_info struct will be passed instead\n" #endif );
这里其实就定义了u_boot_cmd的这条指令的具体参数。不过此刻我们还是不明白这些参数的具体含义,再次查找u_boot_cmd,在Command.h中我们终于找到了对于bootm这条指令的宏定义:
#define U_BOOT_CMD(name,maxargs,rep,cmd,usage,help) \
cmd_tbl_t __u_boot_cmd_##name Struct_Section = {#name, maxargs, rep, cmd, usage, help}
现在开始,我们解析bootm这条命令:
name:命令名,这里将##name替换成bootm。
Struct_Section:结构体段,根据上面我们找到的宏定义,替换成__attribute__ ((unused,section (".u_boot_cmd")))。
#name:命令名,替换成"bootm"。
maxargs:最大参数,替换成CFG_MAXARGS。
rep:是否可重复,替换成1(可重复)。
cmd:命令,替换成do_bootm。
这里的usage表示短命令,help表长命令。对应U_BOOT_CMD中的字符串。经过一系列替换,这条语句最后变成了:
#define U_BOOT_CMD(name,maxargs,rep,cmd,usage,help) \
cmd_tbl_t __u_boot_cmd_bootm __attribute__ ((unused,section (".u_boot_cmd"))) = {"bootm", CFG_MAXARGS, 1, do_bootm, usage, help}
其实,经过刚才的分析,现在我们可以自己写u-boot命令了。这里是博主自己写的u-boot命令:
命令名是"CCJ",执行这条命令显示的信息为:"Hi! I am CrazyCatJack!"并对输入的命令及参数进行输出。还有长信息和短信息如图所示。
#include <common.h> #include <watchdog.h> #include <command.h> #include <image.h> #include <malloc.h> #include <zlib.h> #include <bzlib.h> #include <environment.h> #include <asm/byteorder.h> int do_CCJ (cmd_tbl_t *cmdtp, int flag, int argc, char *argv[]) { int i; printf (" Hi!I am CrazyCatJack! %d\n",argc); for(i=0;i<argc;i++) { printf("%s\n",argv[i]); } return 0; } U_BOOT_CMD( CCJ, CFG_MAXARGS, 1, do_CCJ, "CCJ -CCJ short information.\n", "CCJ,long information...........................................................\n" );
这里是博主写的源代码,大家感兴趣的可以自己分析,自己写一个u-boot命令试试。
3.读出内核启动内核
经过上述一系列准备,现在终于可以读出内核,并启动它了。真是相当的不容易。真的感觉佩服u-boot的作者。还记得我们读出内核和启动内核的命令吗?
bootcmd=nand read.jffs2 0x30007FC0 kernel; bootm 0x30007FC0
类比于PC上的硬盘,我们硬盘上都有各种各样的分区,而我们的FLASH则是将这种分区写到了代码里,换言之,FLASH里的分区是不能动态更改的。通过u-boot打印的信息,我们了解到kernel的分区,我的kernel位于0x00060000,而且有2M的大小。
#define MTDPARTS_DEFAULT "mtdparts=nandflash0:256k@0(bootloader)," \ "128k(params)," \ "2m(kernel)," \ "-(root)"
这是在具体我们板子型号的头文件中对FLASH的分区。256K装bootloader,128K装各种环境变量参数,2M的kernel,最后是root。在Cmd_nand.c中的do_nand函数将会对nand进行一系列细致的初始化。现在我们已经分析完第一条指令,读出内核,下一步是启动内核。我们的内核实际上是由一个头部+内核组成。这里的头部主要包含了内核的加载地址和入口地址:
typedef struct image_header { uint32_t ih_magic; /* Image Header Magic Number */ uint32_t ih_hcrc; /* Image Header CRC Checksum */ uint32_t ih_time; /* Image Creation Timestamp */ uint32_t ih_size; /* Image Data Size */ uint32_t ih_load; /* Data Load Address */ uint32_t ih_ep; /* Entry Point Address */ uint32_t ih_dcrc; /* Image Data CRC Checksum */ uint8_t ih_os; /* Operating System */ uint8_t ih_arch; /* CPU architecture */ uint8_t ih_type; /* Image Type */ uint8_t ih_comp; /* Compression Type */ uint8_t ih_name[IH_NMLEN]; /* Image Name */ } image_header_t;
这就是我们内核的头部,其中最重要的就是加载地址ih_load:Image文件存放地址。还有入口地址ih_ep:内核真正开始执行的地址。
在我们启动内核的时候,如果内核被放到了入口地址上,则无需移动内核文件,否则需执行搬运函数memmove (&header, (char *)addr, sizeof(image_header_t));将内核转移到入口地址上。
接下来是执行do_bootm_linux函数,它主要的作用就是初始化TAG并启动内核。所谓的TAG就是u-boot需要将一些参数传递给内核,但由于二者文件格式不同,所以不能够直接进行通信。最直接的方法就是创建一个二者都能够读取的文件格式,约定好读取规则。在TAG中u-boot向即将启动的内核传递了初始化相关的信息。
#if defined (CONFIG_SETUP_MEMORY_TAGS) || \ defined (CONFIG_CMDLINE_TAG) || \ defined (CONFIG_INITRD_TAG) || \ defined (CONFIG_SERIAL_TAG) || \ defined (CONFIG_REVISION_TAG) || \ defined (CONFIG_LCD) || \ defined (CONFIG_VFD) setup_start_tag (bd); #ifdef CONFIG_SERIAL_TAG setup_serial_tag (¶ms); #endif #ifdef CONFIG_REVISION_TAG setup_revision_tag (¶ms); #endif #ifdef CONFIG_SETUP_MEMORY_TAGS setup_memory_tags (bd); #endif #ifdef CONFIG_CMDLINE_TAG setup_commandline_tag (bd, commandline); #endif #ifdef CONFIG_INITRD_TAG if (initrd_start && initrd_end) setup_initrd_tag (bd, initrd_start, initrd_end); #endif #if defined (CONFIG_VFD) || defined (CONFIG_LCD) setup_videolfb_tag ((gd_t *) gd); #endif setup_end_tag (bd); #endif /* we assume that the kernel is in place */ printf ("\nStarting kernel ...\n\n"); #ifdef CONFIG_USB_DEVICE { extern void udc_disconnect (void); //udc_disconnect (); // cancled by www.100ask.net } #endif cleanup_before_linux (); theKernel (0, bd->bi_arch_number, bd->bi_boot_params);
其中的TAG就是u-boot传递的各项参数,最后执行theKernel (0, bd->bi_arch_number, bd->bi_boot_params);内核启动完成!u-boot到此结束!接下来就是内核相关的操作了。
u-boot源码分析到此结束。^_^
版权声明:本博客为CrazyCatJack原创,未经允许禁止转载。
博主尊重u-boot的作者DENX Software Engineering的版权,感谢他们制作出u-boot,并开源给全世界的人们学习、使用。
本博客旨在分享学习成果,帮助大家理解u-boot源代码,让u-boot被更多的人理解并使用。若能受到启发,创造出更好的事物博主就没白写了^_^
CCJ
2016-11-25 17:53:21