20135316王剑桥Linux内核学习笔记

王剑桥Linux内核学习笔记
《Linux内核分析》MOOC课程http://mooc.study.163.com/course/USTC-1000029000
计算机是如何工作的
个人理解：计算机就是通过和用户进行交互，执行用户的指令，这些指令存放在内存中，通过寄存器存储，堆栈变化，来一步步顺序执行。
一、存储程序计算机工作模型
1.冯诺依曼体系结构—存储程序计算机
硬件角度（主板）：通过cpu中IP寄存器指向一个代码段运行某些指令；
寄存区，指向内存的某一块区域（代码段）
IP：16位cpu上
EIP：32位cpu上
RIP：64位cpu上
程序员角度：将cpu抽象为一个for循环，只是执行下一条指令，从内存中取到下一条指令的内容
内存保存指令和数据，cpu负责解释和执行。通过总线连接
API：程序员于计算机的接口界面
ABI：程序于cpu的接口界面，二进制。
EIP：自加1，自动加到下一条指令（一条指令）；可以本被CALL、RET、JMP、条件JMP指令修改。
二、X86汇编基础
1.X86cpu寄存器
32位：(低16位作为16位寄存器AX,BX,CX,DX,BP,SI,DI,SP)。
通用寄存器：EAX（累加器）,EBX（基地址寄存器）,ECX（计数寄存器）,EDX（数据寄存器）,EBP（堆栈基指针）,ESI（变址寄存器）,EDI（变址寄存器）,ESP（堆栈顶指针）。
段寄存器：CS（代码段寄存器）,DS（数据段寄存器）,ES（附加段寄存器）,SS（堆栈段寄存器）,FS（附加段寄存器）,GS（附加段寄存器）。
CPU在实际取指令的时候根据CS:EIP来准确定位一个指令。
标志寄存区，标识当前的一些状态。
64位寄存器：开头带有R的寄存器
2.汇编指令 b，w，l，q分别代表8位，16位，32位，64位
寄存器模式，以%开头的寄存器标识符。
立即数是以$开头的数字
直接寻址是直接访问一个指定的内存地址的数据
间接寻址是将寄存器的值作为一个内存地址来访问内存
变址寻址是在间接寻址之时改变寄存器的数值
Mov指令：寄存器寻址movl %eax, %edx：把eax寄存器的内容放到edx寄存器中
立即寻址movl $0x123,%edx：把0x123直接放到edx寄存器中
直接寻址movl 0x123，%edx：把内存地址0x123所指向的数据放到edx寄存器中
间接寻址movl （%ebx），%edx：把ebx寄存器存储的值作为内存地址，取出数据放到edx寄存器中
变址寻址movl 4（%ebx），%edx：把ebx寄存器存储的值加4作为内存地址，取出数据放到edx寄存器中
Linux内核使用的是AT&T汇编格式
Push指令：压栈pushl %eax
将栈顶指针减4，然后将eax寄存器中的值放在esp所指向的内存中。
Pop指令：出栈popl %eax
将栈顶指针所指向的内存中存放的数据放在eax寄存器中，然后将栈顶指针加4。
Call指令：call 0x12345
把当前的eip压栈，然后把0x12345这个立即数放到eip寄存器中
Ret指令：ret
将call指令中保存的eip值还原给eip，ret之后执行call之前的eip，即call之前的下一条指令
*号表示伪指令，不能被程序员直接使用，eip寄存器不能被直接修改，只能通过特殊指令间接修改。
参考资料：
//在64位环境下编译成32位的汇编
gcc -S -o ccode32.s ccode.c -m32
//链接时会缺少构建32 位可执行程序缺少的包，使用以下指令安装：
sudo apt-get install libc6-dev-i386
//编译链接成32位的可执行文件
gcc -o ccode32 ccode.c -m32
三、会变一个简单的C程序分析其汇编指令执行过程