05、计算机指令

古老年代的编程

　　以前编程都用一种叫“打孔卡”的物理设备，首先是需要先把程序构思出来或者写在纸上，然后在纸带上或者卡片上打洞，这样，要写的程序、要处理的数据，就变成一条条纸带或者一张张卡，之后再交给当时的计算机去处理。在特定的位置打洞或者不打洞来代表“0”或者“1”。

　　原因很简单，就是计算机或者CPU没有能力直接理解这些高级语言，就算是现代的个人PC也只能处理所谓的“机器码”，也就是一连串的“0”和“1”这样的数字。

机器码和指令

　　高级语言如何变成一串串“0”和“1”的，这一串串的“0”和“1”有事怎么在CPU中处理的，就需要理解 “机器码“ 和 “计算机指令” 了。

　　从硬件的角度来看，CPU就是一个超大规模集成电路，通过电路实现了加法、乘法乃至各种各样的处理逻辑。而从软件的角度来看，CPU就是一个执行各种计算机指令的逻辑机器，这里的计算机指令，就好比一门CPU能够听的懂的语言，我们也叫它为机器语言。

　　不同的CPU能听懂的语言不太一样，不同的CPU就有两种不同的计算机指令集，代表不同的语法，单词。

　　一个计算机程序，不可能只有一条指令，而是由成千上万条指令组成的。但是 CPU 里不能一直放着所有指令，所以计算机程序平时是存储在存储器中的。这种程序指令存储在存储在存储器里面的计算机，我们就叫作存储程序型计算机（Stored-program Computer）。

从编译到汇编，代码怎么变成机器码？

　　了解了计算机指令和计算机指令集，接下来我们来看看，平时编写的代码，到底是怎么变成一条条计算机指令，最后被 CPU 执行的呢？哪一段C程序语言代码，要让它在Linux系统上跑起来，我们需要把整个程序翻译成一个汇编语言的程序，这个过程一般叫编译成汇编代码。

　　针对汇编代码，我们可以再用汇编器（Assembler）翻译成机器码（Machine Code）。这些机器码由“0”和“1组成的机器语言表示。这一条条机器码，就是一条条的计算机指令。一行 C 语言代码，有时候只对应一条机器码和汇编代码，有时候则是对应两条机器码和汇编代码。汇编代码和机器码之间是一一对应的。因为汇编代码其实就是“给程序员看的机器码”，也正因为这样，机器码和汇编代码是一一对应的。