深入理解计算机系统(第1章 计算机系统漫游)
本章通过C语言编写的
#include <stdio.h>
int main()
{
printf( "hello, world\n" );
return 0;
}
1.1 信息就是位+上下文
源程序实际上就是一个由值0和1组成的位(又称为比特)序列,8个位被组织成一组,称为字节。每个字节表示程序中的某些文本字符。
根据ASCII标准,每个字节都对应一个整数值。(只由ASCII字符构成的文件称为文本文件,所有其他文件都称为二进制文件。)
系统中的所有信息都是由一串比特表示的,区分不同数据对象的唯一方法是我们读到这些数据对象时的上下文。
1.2 程序被其他程序翻译成不同的格式
GCC编译器驱动程序读取源程序文件
- 预处理阶段。预处理器(cpp)根据以字符#开头的命令,修改原始的C程序,得到
。 - 编译阶段。编译器(ccl)将文本文件
翻译成文本文件 ,它包含一个汇编语言程序(汇编语言为不同高级语言的不同编译器提供了通用的输出语言)。 - 汇编阶段。汇编器(as)将
翻译成机器语言指令,把这些指令打包成可重定位目标程序(relocatable object program)的格式,保存在目标文件 中。 - 链接阶段。链接器(ld)将被调用
函数所在的 合并到 中,得到 文件,它是一个可执行目标文件(简称为可执行文件),可以被加载到内存中,由系统执行。
1.3 了解编译系统如何工作是大有益处的
- 优化程序性能
- 理解链接时出现的错误
- 避免安全漏洞(eg:缓冲区溢出)
学习安全编程的第一步就是理解数据和控制信息存储在程序栈上的方式会引起的后果。
1.4 处理器读并解释储存在内存中的指令
shell(命令行解释器)
1.4.1 系统的硬件组成
该结构称为冯诺依曼结构(Von Neumann architecture)/普林斯顿结构(Princeton architecture)
- 计算机硬件由运算器(ALU)、控制器(Controller)、存储设备(Memory)、输入设备(Input Devices)、输出设备(Output Devices)五大部分组成。
- 采用二进制形式表示数据和指令顺序执行程序
- 指令的执行通常是顺序的
- 总线:贯穿整个系统的是一组电子管道,称为总线,它携带信息字节并负责在各个部件间传递。通常总线被设计成传送定长的字节块,也就是字(word)。字长:32位机器为4个字节,64位机器为8个字节。
- I/O设备:I/O(输入/输出)设备是系统与外界的联系通道(图中包括鼠标、键盘、显示器、磁盘)。每个I/O设备都通过一个控制器或适配器(区别在于封装方式)与I/O总线相连。
- 主存:主存是一个临时存储设备,用来存放程序和程序处理的数据。物理上:主存是由一组动态随机存取存储器(DRAM)芯片组成的。逻辑上:存储器是一个线性的字节数组。
- 处理器:中央处理单元(CPU),简称处理器,是解释(或执行)存储在主存中指令的引擎。处理器的核心是一个大小为一个字的存储设备(或寄存器),称为程序计数器(PC)。在任何时刻,PC都指向主存中的某条机器语言指令。
围绕着主存、寄存器文件和算数/逻辑单元进行的简单操作:
- 加载
- 存储
- 操作
- 跳转
其它概念:
- 中央处理器(Central Processing Unit)
- 运算器和控制器
- 总线(Bus)
- 传送信息的公共通道
- 系统总线包括:地址总线、数据总线和控制总线
- 字长(Word Size)
- 计算机系统的基本参数,典型值为:4个字节(32位)或8个字节(64位)
- 寄存器(Register)
- 一种存储设备
- 寄存器文件(Register Files)
- CPU内部存储数据的一组字长大小的寄存器集合,每个寄存器都有一个唯一的标识名称
- 指令(Instruction)
- 给机器下达的完成一项基本操作的指令
- 程序(Program)
- 完成一项任务所需的并按照一定顺序排列起来的一系列指令
1.4.2 运行hello程序
上图中是利用了直接存储器存取(DMA)技术,使得数据可以不通过处理器而直接从磁盘到达主存。
1.5 高速缓存至关重要
主存的工作速率远低于CPU的工作速率,并且这种处理器与主存之间的差距还在持续增大这会导致性能瓶颈。需要采用更小更快的存储设备,称为高速缓存存储器(cache memory, 简称为cache或高速缓存),用于缓冲主存中被频繁访问的区域。这样可以显著提升系统的性能,解决数据传输中的性能瓶颈。
缓存机制是一种重要的系统设计思想(计算机存储系统是基于缓存机制所构成的一系列存储器的集合)。
1.6 存储设备形成层次结构
存储器层次结构的主要思想:上一层的存储器作为低一层存储器的高速缓存。
1.7 操作系统管理硬件
操作系统为应用程序提供接口来调用硬件。
操作系统基本功能:管理硬件资源/为应用程序提供统一的访问接口。
1.7.1 进程
进程是操作系统对一个正在运行的程序的一种抽象。
在单核处理器中,这种进程并发运行的情况实则是通过处理器在进程间切换来实现的,是一种宏观上的并行,是一种伪并行,称为多道程序设计(Multiprogramming)。(我们在学习现代操作系统一书中将具体提到)
1.7.2 线程
一个进程实际上可以由多个称为线程的执行单元组成。
多线程之间比多进程之间更容易共享数据,线程一般来说比进程更高效。
1.7.3 虚拟内存
虚拟内存是一个抽象概念,它为每个进程提供了一个假象,即每个进程都在独占地使用主存。
每个进程看到的内存都是一致的,称为虚拟地址空间。
1.7.4 文件
文件就是字节序列。
1.8 系统之间利用网络通信
网络也是一种I/O设备。
1.9 重要主题
1.9.1 Amdahl定律
当我们对系统的某个部分加速时,其对系统整体性能的影响取决于该部分的重要性和加速程度。
式中
想要显著加速整个系统,必须提升全系统中相当大的部分的速度。
1.9.2 并发和并行
并发(concurrency):同时具有多个活动的系统。
并行(parallelism):用并发来使一个系统运行得更快。
- 线程级并发
- 指令级并行
- 单指令、多数据并行
1.9.3 计算机系统中抽象的重要性
使用抽象的一些例子:
- API
- 学习操作系统时的三个抽象:文件是对I/O设备的抽象,虚拟内存是对程序存储器的抽象、进程是对一个正在运行的程序的抽象。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步