linux内核（一）基础知识

1，linux内核的基础知识

1.1 linux内核版本

从内核源码顶层目录Makefile中可以看到：

VERSION和PATCHLEVEL组成主版本号，比如2.4、2.5、2.6等，稳定版本的德主版本号用偶数表示(比如2.6的内核)，开发中的版本号用奇数表示(比如2.5)，它是下一个稳定版本内核的前身。
SUBLEVEL称为次版本号，它不分奇偶，顺序递增，每隔1~2个月发布一个稳定版本。
EXTRAVERSION称为扩展版本号，它不分奇偶，顺序递增，每周发布几次扩展本版号。

1.2 什么是标准内核

　　按照资料上的习惯说法，标准内核(或称基础内核)就是指主要在http://www.kernel.org/维护和获取的内核，实际上它也有平台属性的。这些linux内核并不总是适用于所有linux支持的体系结构。实际上，这些内核版本很多时候并不是为一些流行的嵌入式linux系统开发的，也很少运行于这些嵌入式linux系统上，这个站点上的内核首先确保的是在Intel X86体系结构上可以正常运行，它是基于X86处理器的内核，如对 linux-2.4.18.tar.bz2的配置make menuconfig时就可以看到，Processor type and features--->中只有386、486、586/K5/5x86/6x86/6x86MX、Pentium-Classic、Pentium-MMX、Pentium-Pro/Celeron/Pentium-II、Pentium-III/Celeron(Coppermine)、Pentium-4、K6/K6-II/K6-III 、Athlon/Duron/K7 、Elan 、Crusoe、Winchip-C6 、Winchip-2 、Winchip-2A/Winchip-3 、CyrixIII/C3 选项，而没有类似Samsun 2410等其他芯片的选择。如果需要用在其他特定的处理器平台上就需要对内核进行打补丁，形成不同的嵌入式内核。实际上，不同处理器系统的内核下载站点中提供的也往往是补丁patch而已，故原x86平台上的内核变成了基础内核，也被称为标准内核了。

ARM用的RISC精简指令集，每条指令长度固定32bit；常用的100条汇编指令
X86的CISC复杂指令集，每条指令长度不固定。指令比上面多太多，但是常用的也差不多。
比如要移动内存里的一个数据，CISC可以一条实现，但是，精简指令至少两条或更多。
因此x86的内核就要比ARM内核的结构复杂很多，因此贵很多。

1.3 Linux操作系统的分类

第一种分类：以主要功能差异和发行组织区分(即基础linux系统/内核是不同的)

标准linux
μClinux（无MMU支持的linux系统，运行在无MMU的CPU上）
Linux-RT（是最早在linux上实现硬实时支持的linux发行版本）
Embedix（由Lineo公司开发，基于PowerPC和x86平台开发的）
其他

第二种分类：以应用的不同嵌入式平台区分(嵌入式linux系统/内核，使上面第一类中的各种linux系统扩展为对特定目标硬件的支持，成为一种具体的嵌入式linux系统)

　　由于嵌入式系统的发展与linux内核的发展是不同步的，所以为了要找一个能够运行于目标系统上的内核，需要对内核进行选择、配置和定制。因为每一种系统都是国际上不同的内核开发小组维护的，因此选择linux内核源码的站点也不尽相同。

　　第二层分类中的linux系统/内核相对于第一层分类的标准内核来说，也可以称为嵌入式linxu系统/内核。如应用在ARM平台上的嵌入式Linux系统通常有arm-linux(常运行在arm9平台上)，μClinux(常用在arm7平台上)，在标准linux基础上扩展对其他的平台的支持往往通过安装patch实现，如armlinux就是对linux安装rmk补丁(如patch-2.4.18-rmk7.bz2)形成的，只有安装了这些补丁，内核才能顺利地移植到ARM Linux上。也有些是已经安装好补丁的内核源码包，如linux-2.4.18-rmk7.tar.bz2。

不同处理器系统的内核/内核补丁下载站点：

处理器系统        适合的内核站点        下载方式
x86           http://www.kernel.org/              ftp, http, rsync
ARM       http://www.arm.linux.org.uk/developer/    ftp, rsync
PowerPC   http://penguinppc.org/            ftp, http, rsync, BitKeeper
MIPS          http://www.linux-mips.org/           ftp, cvs
SuperH         http://linuxsh.sourceforge.net/         cvs, BitKeeper
M68K          http://linux-m68k.org/               ftp, http
non-MMU CPUs http://www.uclinux.org/             ftp, http

这些站点不仅仅是linux内核站点，它们可能直接提供了针对你的目标硬件系统的linux内核版本。

1.4 linux内核的选择

ARM Linux的移植，建议使用2.4.x或2.6.x版本。当然大部分你使用的硬件平台会提供linux内核的说明。

2，linux内核启动过程

　　一个嵌入式 Linux 系统从软件角度看可以分为四个部分：引导加载程序（Bootloader），Linux 内核，文件系统，应用程序。其中 Bootloader是系统启动或复位以后执行的第一段代码，它主要用来初始化处理器及外设，然后调用 Linux 内核。Linux 内核在完成系统的初始化之后需要挂载某个文件系统做为根文件系统（Root Filesystem）。根文件系统是 Linux 系统的核心组成部分，它可以做为Linux 系统中文件和数据的存储区域，通常它还包括系统配置文件和运行应用软件所需要的库。应用程序可以说是嵌入式系统的“灵魂”，它所实现的功能通常就是设计该嵌入式系统所要达到的目标。如果没有应用程序的支持，任何硬件上设计精良的嵌入式系统都没有实用意义。

2.1Bootloader启动过程

1）Bootloader概念和作用

Bootloader是嵌入式系统的引导加载程序，它是系统上电后运行的第一段程序，其作用类似于 PC 机上的 BIOS。

在完成对系统的初始化任务之后，它会将非易失性存储器（通常是Flash或DOC等）中的Linux 内核拷贝到 RAM 中去，然后跳转到内核的第一条指令处继续执行，从而启动 Linux 内核。

2）Bootloader的执行过程

　　不同的处理器上电或复位后执行的第一条指令地址并不相同，对于 ARM 处理器来说，该地址为 0x00000000。对于一般的嵌入式系统，通常把 Flash 等非易失性存储器映射到这个地址处，而 Bootloader就位于该存储器的最前端，所以系统上电或复位后执行的第一段程序便是Bootloader。而因为存储 Bootloader的存储器不同，Bootloader的执行过程也并不相同，下面将具体分析。

　　嵌入式系统中广泛采用的非易失性存储器通常是 Flash，而 Flash 又分为 Nor Flash 和Nand Flash 两种。它们之间的不同在于：Nor Flash 支持芯片内执行（XIP， eXecute In Place），这样代码可以在Flash上直接执行而不必拷贝到RAM中去执行。而Nand Flash并不支持XIP，所以要想执行 Nand Flash 上的代码，必须先将其拷贝到 RAM中去，然后跳到 RAM 中去执行。

3）Bootloader的功能

　　实际应用中的 Bootloader根据所需功能的不同可以设计得很复杂，除完成基本的初始化系统和调用 Linux 内核等基本任务外，还可以执行很多用户输入的命令，比如设置 Linux 启动参数，给 Flash 分区等；也可以设计得很简单，只完成最基本的功能。但为了能达到启动Linux 内核的目的，所有的 Bootloader都必须具备以下功能：

(1)、初始化 RAM

　　因为 Linux 内核一般都会在 RAM 中运行，所以在调用 Linux 内核之前 bootloader 必须设置和初始化 RAM，为调用 Linux内核做好准备。初始化 RAM 的任务包括设置CPU 的控制寄存器参数，以便能正常使用 RAM 以及检测RAM 大小等。

(2)、初始化串口

　　串口在 Linux 的启动过程中有着非常重要的作用，它是 Linux内核和用户交互的方式之一。Linux 在启动过程中可以将信息通过串口输出，这样便可清楚的了解 Linux 的启动过程。虽然它并不是 Bootloader 必须要完成的工作，但是通过串口输出信息是调试Bootloader 和Linux 内核的强有力的工具，所以一般的 Bootloader 都会在执行过程中初始化一个串口做为调试端口。

（串口：https://blog.csdn.net/a514371309/article/details/73481423）

(3)、检测处理器类型

　　Bootloader在调用 Linux内核前必须检测系统的处理器类型，并将其保存到某个常量中提供给 Linux 内核。Linux 内核在启动过程中会根据该处理器类型调用相应的初始化程序。

(4)、设置 Linux启动参数

　　Bootloader在执行过程中必须设置和初始化 Linux 的内核启动参数。目前传递启动参数主要采用两种方式：即通过 struct param_struct 和struct tag（标记列表，tagged list）两种结构传递。struct param_struct 是一种比较老的参数传递方式，在 2.4 版本以前的内核中使用较多。从 2.4 版本以后 Linux 内核基本上采用标记列表的方式。但为了保持和以前版本的兼容性，它仍支持 struct param_struct 参数传递方式，只不过在内核启动过程中它将被转换成标记列表方式。标记列表方式是种比较新的参数传递方式，它必须以 ATAG_CORE 开始，并以ATAG_NONE 结尾。中间可以根据需要加入其他列表。Linux内核在启动过程中会根据该启动参数进行相应的初始化工作。

(5)、调用 Linux内核映像

　　Bootloader完成的最后一项工作便是调用 Linux内核。如果 Linux 内核存放在 Flash 中，并且可直接在上面运行（这里的 Flash 指 Nor Flash），那么可直接跳转到内核中去执行。但由于在 Flash 中执行代码会有种种限制，而且速度也远不及 RAM 快，所以一般的嵌入式系统都是将 Linux内核拷贝到 RAM 中，然后跳转到 RAM 中去执行。

　　不论哪种情况，在跳到 Linux 内核执行之前 CPU的寄存器必须满足以下条件：r0＝0，r1＝处理器类型，r2＝标记列表在 RAM中的地址。

2.2linux启动过程

在Bootloader将 Linux 内核映像拷贝到 RAM 以后，可以通过下例代码启动 Linux 内核：

　　call_linux(0, machine_type, kernel_params_base)。

　　其中，machine_tpye 是Bootloader检测出来的处理器类型， kernel_params_base 是启动参数在 RAM 的地址。通过这种方式将 Linux 启动需要的参数从 bootloader传递到内核。

Linux 内核有两种映像：一种是非压缩内核，叫 Image，另一种是它的压缩版本，叫 zImage。根据内核映像的不同，Linux 内核的启动在开始阶段也有所不同。zImage 是 Image经过压缩形成的，所以它的大小比 Image 小。但为了能使用 zImage，必须在它的开头加上解压缩的代码，将 zImage 解压缩之后才能执行，因此它的执行速度比 Image 要慢。但考虑到嵌入式系统的存储空容量一般比较小，采用 zImage 可以占用较少的存储空间，因此牺牲一点性能上的代价也是值得的。所以一般的嵌入式系统均采用压缩内核的方式。

　　压缩版本内核的入口程序即为 arch/arm/boot/compressed/head.S。它依次完成以下工作：开启 MMU 和 Cache，调用 decompress_kernel()解压内核，最后通过调用 call_kernel() 进入非压缩内核 Image 的启动。下面将具体分析在此之后 Linux 内核的启动过程。

　　非压缩内核的入口位于文件/arch/arm/kernel/head-armv.S 中的stext 段。该段的基地址就是压缩内核解压后的跳转地址。如果系统中加载的内核是非压缩的 Image，那么bootloader将内核从 Flash中拷贝到 RAM 后将直接跳到该地址处，从而启动 Linux 内核。

　　不同体系结构的 Linux 系统的入口文件是不同的，而且因为该文件与具体体系结构有关，所以一般均用汇编语言编写。对基于 ARM 处理的 Linux 系统来说，该文件就是head-armv.S。该程序（1）通过查找处理器内核类型和处理器类型调用相应的初始化函数，（2）再建立页表，（3）最后跳转到 start_kernel()函数开始内核的初始化工作。

　　（1）检测处理器内核类型是在汇编子函数__lookup_processor_type中完成的。通过以下代码可实现对它的调用：bl __lookup_processor_type。
__lookup_processor_type调用结束返回原程序时，会将返回结果保存到寄存器中。其中r8 保存了页表的标志位，r9 保存了处理器的 ID 号，r10 保存了与处理器相关的 stru proc_info_list 结构地址。

　　检测处理器类型是在汇编子函数 __lookup_architecture_type 中完成的。与 __lookup_processor_type类似，它通过代码：“bl__lookup_processor_type”来实现对它的调用。该函数返回时，会将返回结构保存在 r5、r6 和 r7 三个寄存器中。其中 r5 保存了 RAM 的起始基地址，r6 保存了 I/O基地址，r7 保存了 I/O的页表偏移地址。

　　（2）当检测处理器内核和处理器类型结束后，将调用__create_page_tables 子函数来建立页表，它所要做的工作就是将 RAM 基地址开始的 4M 空间的物理地址映射到 0xC0000000 开始的虚拟地址处。

　　例：对笔者的 S3C2410 开发板而言，RAM 连接到物理地址 0x30000000 处，当调用 __create_page_tables 结束后 0x30000000 ～ 0x30400000 物理地址将映射到 0xC0000000～0xC0400000 虚拟地址处。

　　（3）当所有的初始化结束之后，使用如下代码来跳到 C 程序的入口函数 start_kernel()处，开始之后的内核初始化工作：b SYMBOL_NAME(start_kernel)

　　start_kernel函数

　　start_kernel是所有 Linux 平台进入系统内核初始化后的入口函数，它主要完成剩余的与硬件平台相关的初始化工作，在进行一系列与内核相关的初始化后，调用第一个用户进程－init 进程并等待用户进程的执行，这样整个 Linux 内核便启动完毕。

　　该函数所做的具体工作有：

调用 setup_arch()函数进行与体系结构相关的第一个初始化工作；对不同的体系结构来说该函数有不同的定义。对于 ARM 平台而言，该函数定义在arch /arm/ kernel/Setup.c。它首先通过检测出来的处理器类型进行处理器内核的初始化，然后通过 bootmem_init()函数根据系统定义的 meminfo 结构进行内存结构的初始化，最后调用paging_init()开启 MMU，创建内核页表，映射所有的物理内存和 IO空间。
创建异常向量表和初始化中断处理函数；
初始化系统核心进程调度器和时钟中断处理机制；
初始化串口控制台（serial-console）；ARM-Linux 在初始化过程中一般都会初始化一个串口做为内核的控制台，这样内核在启动过程中就可以通过串口输出信息以便开发者或用户了解系统的启动进程。
创建和初始化系统 cache，为各种内存调用机制提供缓存，包括;动态内存分配，虚拟文件系统（VirtualFile System）及页缓存。初始化内存管理，检测内存大小及被内核占用的内存情况；
初始化系统的进程间通信机制（IPC）；

　　当以上所有的初始化工作结束后，start_kernel()函数会调用 rest_init()函数来进行最后的初始化，包括创建系统的第一个进程－init 进程来结束内核的启动。init 进程首先进行一系列的硬件初始化，然后通过命令行传递过来的参数挂载根文件系统。最后 init 进程会执行用户传递过来的“init＝”启动参数执行用户指定的命令，或者执行以下几个进程之一：

execve("/sbin/init",argv_init,envp_init)
execve("/etc/init",argv_init,envp_init)
execve("/bin/init",argv_init,envp_init)
execve("/bin/sh",argv_init,envp_init)

　　当所有的初始化工作结束后，cpu_idle()函数会被调用来使系统处于闲置（idle）状态并等待用户程序的执行。至此，整个 Linux 内核启动完毕。

　　通过对Linux 的启动过程的分析，我们可以看出哪些是和硬件相关的，哪些是Linux 内核内部已实现的功能，这样在移植Linux 的过程中便有所针对。而Linux内核的分层设计将使Linux 的移植变得更加容易。

大部分转载自：https://blog.csdn.net/kelsey11/article/details/74075143

posted @ 2018-07-01 17:32 xdyixia 阅读(9699) 评论(0) 编辑收藏举报

刷新页面返回顶部