八股文
八股文
OS
-
冯诺依曼架构的组成 ?
- 运算器、存储器、控制器、输入、输出设备
-
内存存储数据基本单位是字节,1 字节(8bit),每一个字节对应一个内存地址
-
CPU32 位和 64 位的差别 ?
- 32 位 CPU 一次可以计算 4 个字节,寻址空间为2^
- 64 位 CPU 一个可以计算 8 个字节,寻址空间为2^
- 64 位 CPU 可以计算超过 32 位的数字
- 32 位指令在 64 位上执行可以兼容,反观,64 位在 32 位上执行寄存器装不下
-
CPU 组件 ?
- 寄存器、控制单元、逻辑运算单元
- 寄存器:存储数据
- 通用寄存器,存放需要进行运算的数据
- 程序计数器,用来存储 cpu 执行下一条指令(所在的内存地址)
- 指令寄存器,用来存放程序计数器的指令
-
总线 ?
- 地址总线:用于指定 CPUI 将要操作的内存地址
- 数据总线:用于读写内存的数据
- 控制总线 L 用于发送和接收信号
- 首先通过地址总线来指定内存地址,然后通过控制总线控制是读或写的命令,最后通过数据总线来传输数据
-
程序执行基本过程
- 第一步,CPU 读取「程序计数器」的值,这个值是指令的内存地址,然后 CPU 的「控制单元」操作「地址总线」指定需要访问的内存地址,接着通知内存设备准备数据,数据准备好后通过「数据总线」将指令数据传给 CPU,CPU 收到内存传来的数据后,将这个指令数据存入到「指令寄存器」。
- 第二步,CPU 分析「指令寄存器」中的指令,确定指令的类型和参数,如果是计算类型的指令,就把指令交给「逻辑运算单元」运算;如果是存储类型的指令,则交由「控制单元」执行;
- 第三步,CPU 执行完指令后,「程序计数器」的值自增,表示指向下一条指令。这个自增的大小,由 CPU 的位宽决定,比如 32 位的 CPU,指令是 4 个字节,需要 4 个内存地址存放,因此「程序计数器」的值会自增 4;
- CPU通过程序计数器读取对应内存地址的指令
- CPU 对指令 decode
- CPU 执行指令
- CPU 将计算结果存回寄存器,再将寄存器的值存入内存
-
存储器的层次结构 ?
- 寄存器:处理速度最快,但是存储数据容量最小
- CPU cache
- L1 cache:数据缓存和指令缓存
- L2 cache:
- L3 cache
- 内存(DRAM),DRAM 存储一个 bit 数据,只需要一个晶体管和一个电容就能存储,但是因为数据会被存储在电容里,电容会不断漏电,所以需要「定时刷新」电容,才能保证数据不会被丢失,这就是 DRAM 之所以被称为「动态」存储器的原因,只有不断刷新,数据才能被存储起来。
- SSD/HDD硬盘, 固态硬盘 & 机械硬盘
- 上述存储器设备从上到下速度递减,内存价格从下至上递减
- CPU 访问内存数据的顺序:寄存器->L1 cache-> L2 cache->L3 cache-> 内存
-
CPU Cache 的数据写入
- CPU Cache 离CPU 核心越接近,访问速度越快,充当 CPU 和内存之间的缓存角色
- CPU Cache 结构
- CPU Line
- 希望读取数据时,尽可能从 cpu cache 中读取而不是从内存中读取
-
什么时候将 cache 中的数据写回到内存呢 ?
- 写直达:把数据同时写入内存和 cache 中(写直达法很直观,也很简单,但是问题明显,无论数据在不在 Cache 里面,每次写操作都会写回到内存,这样写操作将会花费大量的时间,无疑性能会受到很大的影响。)
- 写回:****当发生写操作时,新的数据仅仅被写入 Cache Block 里,只有当修改过的 Cache Block「被替换」时才需要写到内存中,减少了数据写回内存的频率,这样便可以提高系统的性能
- 如果当发生写操作时,数据已经在 CPU Cache 里的话,则把数据更新到 CPU Cache 里,同时标记 CPU Cache 里的这个 Cache Block 为脏(Dirty)的,这个脏的标记代表这个时候,我们 CPU Cache 里面的这个 Cache Block 的数据和内存是不一致的,这种情况是不用把数据写到内存里的;
- 如果当发生写操作时,数据所对应的 Cache Block 里存放的是「别的内存地址的数据」的话,就要检查这个 Cache Block 里的数据有没有被标记为脏的,如果是脏的话,我们就要把这个 Cache Block 里的数据写回到内存,然后再把当前要写入的数据,先从内存读入到 Cache Block 里(注意,这一步不是没用的,具体为什么要这一步,可以看这个「回答 (opens new window)」),然后再写入的数据写入到 Cache Block,最后也把它标记为脏的;如果 Cache Block 里面的数据没有被标记为脏,则就直接将数据写入到这个 Cache Block 里,然后再把这个 Cache Block 标记为脏的就好了。
-
可以发现写回这个方法,在把数据写入到 Cache 的时候,只有在缓存不命中,同时数据对应的 Cache 中的 Cache Block 为脏标记的情况下,才会将数据写到内存中,而在缓存命中的情况下,则在写入后 Cache 后,只需把该数据对应的 Cache Block 标记为脏即可,而不用写到内存里。
-
缓存一致性问题
- 现在 CPU 都是多核的,由于 L1/L2 Cache 是多个核心各自独有的,那么会带来多核心的*缓存一致性(Cache Coherence***)**** 的问题,如果不能保证缓存一致性的问题,就可能造成结果错误。
- 第一点,某个 CPU 核心里的 Cache 数据更新时,必须要传播到其他核心的 Cache,这个称为*写传播(Write Propagation***)****;
- 第二点,某个 CPU 核心里对数据的操作顺序,必须在其他核心看起来顺序是一样的,这个称为*事务的串形化(Transaction Serialization***)****。
- CPU 核心对于 Cache 中数据的操作,需要同步给其他 CPU 核心;
- 要引入「锁」的概念,如果两个 CPU 核心里有相同数据的 Cache,那么对于这个 Cache 数据的更新,只有拿到了「锁」,才能进行对应的数据更新。
-
总线嗅探 ?
- 写传播的原则就是当某个 CPU 核心更新了 Cache 中的数据,要把该事件广播通知到其他核心。最常见实现的方式是*总线嗅探(Bus Snooping***)****。
- CPU 需要每时每刻监听总线上的一切活动,但是不管别的核心的 Cache 是否缓存相同的数据,都需要发出一个广播事件,这无疑会加重总线的负载。
-
总线嗅探只是保证了某个 CPU 核心的 Cache 更新数据这个事件能被其他 CPU 核心知道,但是并不能保证事务串形化。
-
MESI 协议
- Modified(已修改):「已修改」状态就是我们前面提到的脏标记,代表该 Cache Block 上的数据已经被更新过,但是还没有写到内存里。
- Exclusive(独占):独占状态的时候,数据只存储在一个 CPU 核心的 Cache 里,而其他 CPU 核心的 Cache 没有该数据。这个时候,如果要向独占的 Cache 写数据,就可以直接自由地写入,而不需要通知其他 CPU 核心,因为只有你这有这个数据,就不存在缓存一致性的问题了,于是就可以随便操作该数据。在「独占」状态下的数据,如果有其他核心从内存读取了相同的数据到各自的 Cache ,那么这个时候,独占状态下的数据就会变成共享状态。
- 「独占」和「共享」状态都代表 Cache Block 里的数据是干净的,也就是说,这个时候 Cache Block 里的数据和内存里面的数据是一致性的。
- Shared(共享):共享」状态代表着相同的数据在多个 CPU 核心的 Cache 里都有,所以当我们要更新 Cache 里面的数据的时候,不能直接修改,而是要先向所有的其他 CPU 核心广播一个请求,要求先把其他核心的 Cache 中对应的 Cache Line 标记为「无效」状态,然后再更新当前 Cache 里面的数据。
- Invalidated(已失效):「已失效」状态,表示的是这个 Cache Block 里的数据已经失效了,不可以读取该状态的数据。