计算机体系结构几个常用的知识点记录
首先要知道
1 字节是计算机的基本存储单元。
2 C中的数据类型都是从内存的低地址向高地址扩展,取址运算"&"都是取低地址.
then begin
(一)小端模式(X86):
例如 short = 0x1122;
地址 二进制值 16进制
0x1000 00100010 22
0x1001 00010001 11
可以看出,short占2个字节,22占地址的低字节,11占地址的高字节。 这就是小端模式! 一个数字的低位在地址的低位。。。
区分大端与小端有什么用呢? 如果两个不同Endian的机器进行通信时, 就有必要区分了.同时还需要注意2个极其的字节对齐规则是否一样(见第二条)。
(二)Byte Alignment
需要字节对齐的本质在于对于32位系统,地址总线寻址之使用A[2]~A[31],0和1用于逻辑控制。那么地址就只能以4字节为跨越来寻址。OK,具体例子就不举了,一般的规则是
- 单个字节(char)能对齐到任意地址
- 2字节(short)以2字节边界对齐
- 4字节(int, long)以4字节边界对齐
理解调用栈最重要的两点是:栈的结构,EBP寄存器的作用。
首先要认识到这样两个事实:
1、一个函数调用动作可分解为:零到多个PUSH指令(用于参数入栈),一个CALL指令。CALL指令内部其实还暗含了一个将返回地址(即CALL指令下一条指令的地址)压栈的动作。
2、几乎所有本地编译器都会在每个函数体之前插入类似如下指令:PUSH EBP; MOV EBP ESP;
即,在程序执行到一个函数的真正函数体时,已经有以下数据顺序入栈:参数,返回地址,EBP。
由此得到类似如下的栈结构(参数入栈顺序跟调用方式有关,这里以C语言默认的CDECL为例):
+| (栈底方向,高位地址) |
| .................... |
| .................... |
| 参数3 |
| 参数2 |
| 参数1 |
| 返回地址 |
-| 上一层[EBP] | <-------- [EBP]
“PUSH EBP”“MOV EBP ESP”这两条指令实在大有深意:首先将EBP入栈,然后将栈顶指针ESP赋值给EBP。“MOV EBP ESP”这条指令表面上看是用ESP把EBP原来的值覆盖了,其实不然——因为给EBP赋值之前,原EBP值已经被压栈(位于栈顶),而新的EBP又恰恰指向栈顶。
此时EBP寄存器就已经处于一个非常重要的地位,该寄存器中存储着栈中的一个地址(原EBP入栈后的栈顶),从该地址为基准,向上(栈底方向)能获取返回地址、参数值,向下(栈顶方向)能获取函数局部变量值,而该地址处又存储着上一层函数调用时的EBP值!
一般而言,ss:[ebp+4]处为返回地址,ss:[ebp+8]处为第一个参数值(最后一个入栈的参数值,此处假设其占用4字节内存),ss:[ebp-4]处为第一个局部变量,ss:[ebp]处为上一层EBP值。
由于EBP中的地址处总是“上一层函数调用时的EBP值”,而在每一层函数调用中,都能通过当时的EBP值“向上(栈底方向)能获取返回地址、参数值,向下(栈顶方向)能获取函数局部变量值”。
如此形成递归,直至到达栈底。这就是函数调用栈。
编译器对EBP的使用实在太精妙了。
从当前EBP出发,逐层向上找到所有的EBP是非常容易的:
unsigned int _ebp;
__asm _ebp, ebp;
while (not stack bottom)
{
//...
_ebp = *(unsigned int*)_ebp;
}
如果要写一个简单的调试器的话,注意需在被调试进程(而非当前进程——调试器进程)中读取内存数据
总结一下:调用函数的一般步骤就是,参数入栈,返回地址入栈,跳到函数首地址开始运行,函数运行中需要参数时从栈中取出参数(利用ebp,不能用pop),运行完毕之后清空这个函数使用的栈,跳转到返回地址继续运行。。。。。。。done
sylar
2010-09-25 NSN HZ