Linux-0.01 引导代码分析-head.s

head.s 通过编译链接的处理,同时被 boot.s 加载到保护模式零地址开始运行,在最后会调用 main 函数。

代码:

/*
 *  head.s contains the 32-bit startup code.
 *
 * NOTE!!! Startup happens at absolute address 0x00000000, which is also where
 * the page directory will exist. The startup code will be overwritten by
 * the page directory.
 * 注意:启动程序在 0x00000000,同时这个地址也是页表的地址,在这个启动完成后,这里的程序与数据会被页表覆盖。
 */
.code32 .text
.globl idt, gdt, pg_dir, startup_32

pg_dir:
startup_32:
	movl $0x10,%eax # 已经处于32 位保护模式,$0x10 是全局描述符表项的选择符
	mov %ax,%ds
	mov %ax,%es
	mov %ax,%fs
	mov %ax,%gs
	lss stack_start,%esp # 设置系统堆栈:ss,esp,stack_start 在 kernel/sched.c, 40 行
	
	call setup_idt # 设置中断描述符表
	call setup_gdt # 设置全局描述符表
	
	# 因为修改了gdt,所以需要重新装载所有的段寄存器
	movl $0x10,%eax	         # reload all the segment registers
	mov %ax,%ds		# after changing gdt. CS was already
	mov %ax,%es		# reloaded in 'setup_gdt'
	mov %ax,%fs
	mov %ax,%gs
	lss stack_start,%esp
	
	xorl %eax,%eax
	
	# 测试A20 地址线是否已经开启,如果没有开启,内核无法使用大于 1M 的内存
	# 采用的方法是向内存地址0x000000 处写入任意数值,
	# 检查 0x100000(1M) 处是否也是这个数值。
1:	incl %eax		# check that A20 really IS enabled
	movl %eax,0x000000
	cmpl %eax,0x100000
	je 1b # 向后寻找标号
	
	# CR0 : http://en.wikipedia.org/wiki/Control_register
	movl %cr0,%eax		# check math chip
	andl $0x80000011,%eax	# Save PG,ET,PE
	testl $0x10,%eax # test MP 位
	jne 1f			# ET is set - 387 is present
	orl $4,%eax		# else set emulate bit, EM 位
1:	movl %eax,%cr0
	jmp after_page_tables

/*********************************setup_idt*******************************/
/*
 *  setup_idt
 *
 *  sets up a idt with 256 entries pointing to
 *  ignore_int, interrupt gates. It then loads
 *  idt. Everything that wants to install itself
 *  in the idt-table may do so themselves. Interrupts
 *  are enabled elsewhere, when we can be relatively
 *  sure everything is ok. This routine will be over-
 *  written by the page tables.
 */

/*
 * 下面这段是设置中断描述符表子程序 setup_idt
 *
 * 将中断描述符表idt 设置成具有256 个项,并都指向ignore_int 中断门。然后加载中断
 * 描述符表寄存器(用lidt 指令)。真正实用的中断门以后再安装。当我们在其它地方认为一切
 * 都正常时再开启中断。该子程序将会被页表覆盖掉。
*/

setup_idt:
	lea ignore_int,%edx # 将 ignore_int 的有效地址(偏移值)存入到 edx 寄存器
	movl $0x00080000,%eax # 将选择符 0x0008 置入 eax 的高16 位中
	movw %dx,%ax	/* selector = 0x0008 = cs # 偏移值的低16 位置入eax 的低16 位中。此时eax 含有门描述符低4 字节的值*/
	movw $0x8E00,%dx	/* interrupt gate - dpl=0, present */

	lea idt,%edi # 将 idt 的有效地址存入 edi
	mov $256,%ecx # 循环计数 256,256 个表项
rp_sidt:
	movl %eax,(%edi) # 将 eax 的值存入 idt 的第一项的前32位
	movl %edx,4(%edi) # 将 edx 的值存入 idt 的第一项的第二个32位
	addl $8,%edi # 使 edi 指向 idt 的第二项
	dec %ecx
	jne rp_sidt # 重复执行
	lidt idt_descr # 设置中断描述符表
	ret

/*********************************setup_gdt*******************************/
/*
 *  setup_gdt
 *
 *  This routines sets up a new gdt and loads it.
 *  Only two entries are currently built, the same
 *  ones that were built in init.s. The routine
 *  is VERY complicated at two whole lines, so this
 *  rather long comment is certainly needed :-).
 *  This routine will beoverwritten by the page tables.
 */
setup_gdt:
	lgdt gdt_descr # 设置全局描述附表
	ret

/**********************************************************************/
/* Linus 将内核的内存页表直接放在页目录之后,使用了2 个表来寻址8 Mb 的物理内存。
 * 如果你有多于8 Mb 的内存,就需要在这里进行扩充修改。
*/
# 每个页表长为4 Kb 字节,而每个页表项需要4 个字节,因此一个页表共可以存放1000 个表项,
# 如果一个表项寻址4 Kb 的地址空间,则一个页表就可以寻址4 Mb 的物理内存。
# 页表项的格式为:项的前0-11 位存放一些标志,如是否在内存中(P 位0)、读写许可(R/W 位1)、
# 普通用户还是超级用户使用(U/S 位2)、是否修改过(是否脏了)(D 位6)等;表项的位12-31 是
# 页框地址,用于指出一页内存的物理起始地址。

# 从偏移0x1000 处开始是第1 个页表(偏移0 开始处将存放页表目录)。

/*********************************0x1000*******************************/
.org 0x1000 # 设置起始地址
pg0:

/*********************************0x2000*******************************/
.org 0x2000
pg1:

/*********************************0x3000*******************************/
.org 0x3000
pg2:		# This is not used yet, but if you
		# want to expand past 8 Mb, you'll have
		# to use it.

/*********************************0x4000*******************************/
.org 0x4000
after_page_tables:
	pushl $0		# These are the parameters to main :-)
	pushl $0
	pushl $0
	pushl $L6		# return address for main, if it decides to.
	pushl $main
	jmp setup_paging # 跳转到分页的设置代码
L6:
	jmp L6		# main should never return here, but
			# just in case, we know what happens.

/*********************************default interrupt "handler"*******************************/
/* This is the default interrupt "handler" :-) */
.align 2 # 2字节对齐
ignore_int:
	incb 0xb8000+160		# put something on the screen
	movb $2,0xb8000+161	# so that we know something
	iret			# happened

/*********************************Setup_paging*******************************/
/*
 * Setup_paging
 *
 * This routine sets up paging by setting the page bit
 * in cr0. The page tables are set up, identity-mapping
 * the first 8MB. The pager assumes that no illegal
 * addresses are produced (ie >4Mb on a 4Mb machine).
 *
 * NOTE! Although all physical memory should be identity
 * mapped by this routine, only the kernel page functions
 * use the >1Mb addresses directly. All "normal" functions
 * use just the lower 1Mb, or the local data space, which
 * will be mapped to some other place - mm keeps track of
 * that.
 *
 * For those with more memory than 8 Mb - tough luck. I've
 * not got it, why should you :-) The source is here. Change
 * it. (Seriously - it shouldn't be too difficult. Mostly
 * change some constants etc. I left it at 8Mb, as my machine
 * even cannot be extended past that (ok, but it was cheap :-)
 * I've tried to show which constants to change by having
 * some kind of marker at them (search for "8Mb"), but I
 * won't guarantee that's all :-( )
 */
 
/*
 * 这个子程序通过设置控制寄存器cr0 的标志(PG 位31)来启动对内存的分页处理功能,
 * 并设置各个页表项的内容,以恒等映射前8 MB 的物理内存。分页器假定不会产生非法的
 * 地址映射(也即在只有4Mb 的机器上设置出大于4Mb 的内存地址)。
 * 注意!尽管所有的物理地址都应该由这个子程序进行恒等映射,但只有内核页面管理函数能
 * 直接使用>1Mb 的地址。所有"一般"函数仅使用低于1Mb 的地址空间,或者是使用局部数据
 * 空间,地址空间将被映射到其它一些地方去 -- mm(内存管理程序)会管理这些事的。
 * 对于那些有多于8Mb 内存的家伙 - 太幸运了,我还没有,为什么你会有?代码就在这里,
 * 对它进行修改吧。(实际上,这并不太困难的。通常只需修改一些常数等。我把它设置为
 * 8Mb,因为我的机器再怎么扩充甚至不能超过这个界限(当然,我的机器很便宜的)。
 * 我已经通过设置某类标志来给出需要改动的地方(搜索"8Mb"),但我不能保证作这些
 * 改动就行了)。
 */

# paging : http://en.wikipedia.org/wiki/Paging

.align 2
setup_paging:
	movl $1024*3,%ecx # 0x1000=4096 byte=1024*32位, pg2 并没有使用,也没有在这里初始化。
	xorl %eax,%eax # eax 清零
	xorl %edi,%edi # edi 清零/* pg_dir is at 0x000 */
	cld;rep;stosl # cld 设置传送方向,rep 重复 ecx 次,stos 将 eax 的值传送到 edi 所指向的内存
	
	# 下面2 句设置页目录中的项,我们共有2 个页表所以只需设置2 项。
	# 页目录项的结构与页表中项的结构一样,4 个字节为1 项。
	# "$pg0+7"表示:0x00001007,是页目录表中的第1 项。
	# 则第1 个页表所在的地址 = 0x00001007 & 0xfffff000 = 0x1000;
	# 第1 个页表的属性标志 = 0x00001007 & 0x00000fff = 0x07,表示该页存在、用户可读写。
	movl $pg0+7,pg_dir		/* set present bit/user r/w */
	movl $pg1+7,pg_dir+4	/*  --------- " " --------- */
	
	# 下面6 行填写2 个页表中所有项的内容,共有:2(页表)*1024(项/页表)=2048 项(0 - 0xfff),
	# 也即能映射物理内存 2048*4Kb = 8Mb。
	# 每项的内容是:当前项所映射的物理内存地址 + 该页的标志(这里均为7)。
	# 使用的方法是从最后一个页表的最后一项开始按倒退顺序填写。一个页表的最后一项在页表中的
	# 位置是1023*4 = 4092。因此最后一页的最后一项的位置就是$pg3+4092。
	movl $pg1+4092,%edi
	# 最后1 项对应物理内存页面的地址是0x7ff000,
	# 加上属性标志7,即为0xfff007.
	movl $0x7ff007,%eax		/*  8Mb - 4096 + 7 (r/w user,p) */
	std # 方向位置位,edi 值递减(4 字节)。
1:	stosl			/* fill pages backwards - more efficient :-) */
	subl $0x1000,%eax # 每填写好一项,物理地址值减0x1000。
	jge 1b # 如果大于等于零,向后跳转到 1 继续执行。
	xorl %eax,%eax		/* pg_dir is at 0x0000 */  # 页目录表在0x0000 处
	movl %eax,%cr3		/* cr3 - page directory start */
	# 设置启动使用分页处理(cr0 的PG 标志,位31)
	movl %cr0,%eax
	orl $0x80000000,%eax 
	movl %eax,%cr0		/* set paging (PG) bit */ # 添上PG 标志
	
	# 在改变分页处理标志后要求使用转移指令刷新预取指令队列,这里用的是返回指令ret。
	# 该返回指令的另一个作用是将堆栈中的main 程序的地址弹出,并开始运行/init/main.c 程序。
	# 本程序到此真正结束了。终于结束了该死的汇编代码!
	ret			/* this also flushes prefetch-queue */

/*********************************idt_descr*******************************/
.align 2
.word 0
idt_descr:
	.word 256*8-1		# idt contains 256 entries
	.long idt

/*********************************gdt_descr*******************************/
.align 2
.word 0
gdt_descr:
	.word 256*8-1		# so does gdt (not that that's any
	.long gdt			# magic number, but it works for me :^)

/*********************************idt*******************************/
.align 8
idt:	.fill 256,8,0	# idt is uninitialized # 256 项,每项8 字节,填0。

/*********************************gdt*******************************/
gdt:
	.quad 0x0000000000000000	/* NULL descriptor */
	.quad 0x00c09a00000007ff	/* 8Mb , 代码段*/
	.quad 0x00c09200000007ff	/* 8Mb , 数据段*/
	.quad 0x0000000000000000	/* TEMPORARY - don't use */
	.fill 252,8,0		/* space for LDT's and TSS's etc */

需要进一步完善。

posted @ 2011-01-10 23:18  Proteas  阅读(1086)  评论(0编辑  收藏  举报