温故知新，跟着七牛云CEO许式伟学架构(02)，地基之上编程语言诞生和进化

对于现代计算机来说，虽然CPU指令是一个很有限的指令集，但是CPU执行的指令序列（或者叫“程序”）并不是固定的，它依赖于保存在存储中的数据，由软件工程师（或者叫“程序员”）编写的软件决定。

计算机的程序可能被保存在计算机主板的ROM上(这段程序也叫计算机的启动程序)，也可能被保存在外置的存储设备(比如硬盘)上，并在合适的时机加载执行。程序称得上是计算机的灵魂。指令序列的可能性是无穷的，程序的可能性就是无穷的。 今天计算机创造的世界如此多姿多彩，正是得益于程序无穷的可能性。

编程的史前时代

在第一门面向程序员的编程语言出现前，人们只能通过理解CPU指令的二进制表示，将程序以二进制数据方式刻录到存储（比如ROM或硬盘）上。这个时期的编程无疑是痛苦的，效率是极其低下的：且不说我们怎么去修改和迭代我们的程序，光将我们的想法表达出来就极其困难。我们首先要把表达的执行指令翻译成二进制的比特数据，然后再把这些数据刻录到存储上。这个时候软件和硬件的边界还非常模糊，并不存在所谓软件工程师（或者叫“程序员”）这样的职业。写程序也并不是一个纯软件的行为，把程序刻录到存储上往往还涉及了硬件的电气操作。

为了解决编程效率的问题，汇编语言（和解释它的编译器）诞生了。汇编语言的编译器将汇编语言写的程序编译成为CPU指令序列，并将其保存到外置的存储设备（比如硬盘）上。汇编语言非常接近计算机的CPU指令，一条汇编指令基本上和CPU指令一一对应。

与机器对话

汇编语言的出现，让写程序（编程）成为一个纯软件行为（出现“程序员”这个分工的标志），人们可以反复修改程序，然后通过汇编编译器将其翻译成机器语言，并写入到外置的存储设备（比如硬盘）。并且，程序员可以按需执行该程序。

在表达能力上，汇编语言主要做了如下效率优化：

用文本符号(symbol)表达机器指令，例如 add 表示加法运算，而不用记忆对应的 CPU 指令的二进制表示。
用文本符号(symbol)表达要操作的内存地址，并支持内存地址的自动分配。比如我们在程序中使用了“Hello” 这样一段文本，那么汇编编译器将为程序开辟一段静态存储区（通常我们叫“数据段”）来存放这段文本，并用一个文本符号（也就是“变量名 -variable”）指向它。用变量名去表达一段内存数据，这样我们就不用去关注内存的物理地址，而把精力放在程序的逻辑表达上。
用文本符号(symbol)表达要调用的函数（function，也叫“过程 -procedure”）地址。对 CPU 指令来说，函数只有地址没有名字。但从编程的角度，函数是机器指令的扩展，和机器指令需要用文本符号来助记一样，函数的名称也需要用文本符号来助记。
用文本符号(symbol)表达要跳转的目标地址。高级语言里面，流程控制的语法有很多，比如 goto、if .. else、for、while、until 等等。但是从汇编角度来说，只有两种基本的跳转指令：无条件跳转（jmp）和条件跳转 (je、jne)。同样，跳转的目标地址用文本符号（也就是“标签 -label”）有助于程序逻辑的表达，而不是让人把精力放在具体的指令跳转地址上。

汇编从指令能力上来说，和机器指令并无二致，它只不过把人们从物理硬件地址中解脱出来，以便专注于程序逻辑的表达。

可自我迭代的计算机

假设今天我们的信息科技的一切尚不存在，那么从架构设计角度，我们从工程上来说，如何更高效地完成从0到1的信息科技的构建？

Herman Hollerith设计的打孔卡片

最早的输入输出设备并不是键盘和显示器，而是打孔卡和打印机。用打孔卡来作为机器指令的输入，早在18世纪初就被用在织布机上了。早期的数字计算机就是用打孔卡来表达程序指令和输入的数据。

1886年，何乐礼完成了改良后的原型机，取名为「何乐礼电力制表系统」(Hollerith Electric Tabulating System)。经由毕林斯的协助，这部机器获得巴尔的摩公共卫生署(Baltimore Department of Health) 用来做死亡统计，取得不错的成效，于是随后纽泽西州以及纽约市的公共卫生署也陆续采购使用。从巴斯卡以降，多少计算机先驱充满期待却无法达成的事——计算机的商业化，终于在何乐礼手中达成。这当然要归功于何乐礼结合打孔卡片与电流控制，让计算机展现巨大的效能。但除了技术因素之外，还有一个成功关键在于新的商业模式。何乐礼并不是直接将机器卖给客户，而是透过西屋电气这样的大公司提供租赁服务，让客户每月支付租金即可。如此一来客户就不会因为购置金额庞大而裹足不前，何乐礼也能取得资金专心研发，瞄准最大的目标—— 1890年的人口普查。

我们可以想象一下，第一台以键盘 + 显示器为标准输入输出的现代计算机出现后，一个最小功能集的计算机主板的ROM上，应该刻上什么样的启动程序？换句话说，这个现代计算机具备的最基本功能是什么？

从高效的角度，它最好具备下面的这些能力:

键盘和显示器的驱动程序。
当时最主流的外置存储设备（不一定是现代的硬盘）的驱动程序。
一个汇编程序编辑器。
可从存储中读取汇编程序代码，修改并保存到存储中。
一个汇编编译器。可将汇编程序代码编译成机器代码程序，并保存到存储中。
可以执行一段保存在外置存储设备中的机器代码程序。

本质上，我们是要实现一个最小化的计算能力可自我迭代的计算机。

汇编语言的出现要早于操作系统。操作系统的核心目标是软件治理，只有在计算机需要管理很多的任务时，才需要有操作系统。所以，在没有操作系统之前，BIOS包含的内容很可能是下面这样的：

外置存储设备的驱动程序；
基础外部设备的驱动程序，比如键盘、显示器；
汇编语言的编辑器、编译器；
把程序的源代码写入磁盘，从磁盘读入的能力。

最早期的计算机毫无疑问是单任务的，计算的职能也多于存储的职能。每次做完任务，计算机的状态重新归零（回到初始状态）都没有关系。但是，有了上面这样一个BIOS程序后，计算机就开始发展起它存储的能力：程序的源代码可以进行迭代演进了。这一步非常非常重要。计算机的存储能力的重要性如同人类发明了纸。纸让人类存储了知识，一代代传递下去并不断演进，不断发扬光大。而同样有了存储能力的计算机，我们的软件程序就会不断被传承，不断演进发扬光大，并最终演进出今天越来越多姿多彩的信息科技的世界。

软件是活的书籍

软件是活的书籍，是我们人类知识传承能力的一次伟大进化。

书籍能够通过文字来记载事件、传递情感、揭示规律、传承技术。书籍能够让人们进行远程的沟通（飞鸽传书），也能够让我们了解古人的生活习性，与古人沟通（虽然是单向的）。

这些事情软件都可以做到，而且做得更好。为什么我说软件是活的书籍，有两方面的原因：

其一，表达方式的多样性。书籍只能通过文字描述来进行表达，这种表达方式依赖于人们对文字的理解，以及人的想象能力对场景进行还原。软件除了能够通过文字，还能够通过超链接、声音、动画、视频、实时的交互反馈等方式来还原场景。

其二，对技术的现场还原。书籍只能通过文字来描述技术，但是因为人与人对同样的文字理解不同，领悟能力不同，这些都可能导致技术的传承会出现偏差，如果文字的记载不够详尽，可能就会出现“谁也看不懂，学不会”的情况，从而导致技术的失传。但是，软件对技术的还原可以是精确的，甚至软件本身可以是技术的一部分。当软件是技术的一部分的时候，技术传承就是精确的，失传的概率就大大降低（除非技术本身适应不了潮流，退出了历史舞台）。

信息科技发展到今天，已经影响人类活动的方方面面。无论你从事什么职业，不管你是否会从事软件开发的工作，你都无法和信息科技脱节。如果希望能够站在职业发展的至高点，你就需要理解和计算机沟通的语言，也就需要理解软件工程师们的语言。不仅如此，如果你把编程语言升华为人类知识传承能力的进化，你就更能够清晰地预判到这样的未来：每一个小孩的基础教育中一定会有编程教育，就如同每一个小孩都需要学习物理和数学一样。

编程范式的进化

从思想表达的角度来说，我们通常会听到以下这些编程范式：

过程式。过程式就是以一条条命令的方式，让计算机按我们的意愿来执行。今天计算机的机器语言本身就是一条条指令构成，本身也是过程式的。所以过程式最为常见，每个语言都有一定过程式的影子。过程式语言的代表是Fortran、C/C++、JavaScript、Go等等。过程式编程中最核心的两个概念是结构体（自定义的类型）和过程（也叫函数）。通过结构体对数据进行组合，可以构建出任意复杂的自定义数据结构。通过过程可以抽象出任意复杂的自定义指令，复用以前的成果，简化意图的表达。
函数式。函数式本质上是过程式编程的一种约束，它最核心的主张就是变量不可变，函数尽可能没有副作用（对于通用语言来说，所有函数都没副作用是不可能的，内部有IO行为的函数就有副作用）。既然变量不可变，函数没有副作用，自然人们犯错的机会也就更少，代码质量就会更高。函数式语言的代表是Haskell、Erlang等等。大部分语言会比较难以彻底实施函数式的编程思想，但在思想上会有所借鉴。函数式编程相对小众。因为这样写代码质量虽然高，但是学习门槛也高。举一个最简单的例子：在过程式编程中，数组是一个最常规的数据结构，但是在函数式中因为变量不可变，对某个下标的数组元素的修改，就需要复制整个数组（因为数组作为一个变量它不可变），非常低效。所以，函数式编程里面，需要通过一种复杂的平衡二叉树来实现一个使用界面（接口）上和过程式语言数组一致的“数组”。这个简单的例子表明，如果你想用函数式编程，你需要重修数据结构这门课程，大学里面学的数据结构是不顶用了。
面向对象。面向对象在过程式的基础上，引入了对象（类）和对象方法（类成员函数），它主张尽可能把方法（其实就是过程）归纳到合适的对象（类）上，不主张全局函数（过程）。面向对象语言的代表是Java、C#、C++、Go等等。

从“面向对象”到“面向连接”

面向对象的核心思想是引入契约，基于对象这样一个概念对代码的使用界面进行抽象和封装。它有两个显著的优点：

清晰的使用界面，某种类型的对象有哪些方法一目了然，而不像过程式编程，数据结构和过程的关系是非常松散的。
信息的封装。面向对象不主张绕过对象的使用接口侵入到对象的内部实现细节。因为这样做破坏了信息的封装，降低了类的可复用性，有一天对象的内部实现方式改变了，依赖该对象的相关代码也需要跟着调整。

面向对象还有一个至关重要的概念是接口。通过接口，我们可以优雅地实现过程式编程中很费劲才能做到的一个能力：多态。由于对象和对象方法的强关联，我们可以引入接口来抽象不同对象相同的行为（比如鸟和猪是不同的对象，但是它们有相同的方法，比如移动和吃东西）。这样不同对象就可以用相同的代码来实现类似的复杂行为，这就是多态了。

多数面向对象语言往往还会引入一个叫继承的概念。大家对这个概念褒贬不一。虽然继承带来了编码上的便捷性，但也带来了不必要的心智负担：本来复合对象的唯一构造方法是组合，现在多了一个选择，继承。

Go语言是多范式更好的例子。它没有声称自己是多范式的，但是实际上每一种编程范式它都保留了精华部分。这并没有使得Go语言变得很复杂，整个语言的特性极其精简。Go语言之所以没有像C++那样声称是多范式的，是因为Go官方认为Go是一门面向连接的语言。

什么是面向连接的语言？

所谓面向连接就是朴素的组合思想。研究连接，就是研究人与人如何组合，研究代码与代码之间怎么组合。

面向对象创造性地把契约的重要性提高到了非常重要的高度，但这还远远不够。这是因为，并不是只有对象需要契约，语言设计的方方面面都需要契约。比如，代码规范约束了人的行为，是人与人的连接契约。如果面对同一种语言，大家写代码的方式很不一样，语言就可能存在很多种方言，这对达成共识十分不利。所以Go语言直接从语言设计上就消灭掉那些最容易发生口水的地方，让大家专注于意图的表达。

再比如，消息传递约束了进程(这里的进程是抽象意义上的，在Go语言中叫goroutine)的行为，是进程与进程的连接契约。消息传递是多核背景下流行起来的一种编程思想，其核心主张是：尽可能用消息传递来取代共享内存，从而尽可能避免显式的锁，降低编程负担。Go语言不只是提供了语言内建的消息传递机制(channel)，同时它的消息传递是类型安全的。这种类型安全的消息传递契约机制，大大降低了犯错的机会。

其他方面的进化

除了编程范式，编程语言的进化还体现在工程化能力的完善上。工程化能力主要体现在如下这些方面：

包(package)，即代码的发布单元
版本(version)，即包的依赖管理
文档生成(doc)
单元测试(test)

从语言的执行器的行为看，出现了这样三种分类的语言：

编译的目标文件为可执行程序。典型代表是Fortran、C/C++、Go等。
生成跨平台的虚拟机字节码，有独立的执行器（虚拟机）执行字节码。典型代表为Java、Erlang等。
直接解释执行。典型代表是JavaScript。当然现在纯解释执行的语言已经不多。大多数语言也只是看起来直接执行，内部还是会有基于字节码的虚拟机以提升性能。

语言对架构的影响是什么？

无论服务端，还是客户端，我们可以统一将其架构图简化为下图所示：

淡紫色是硬件层次的依赖，是我们程序工作的物理基础。
淡绿色的是软件层次的依赖，是我们程序工作的生态环境。
桔色的是库或源代码层次的依赖，是我们程序本身的组成部分。细分的话它又可以分两部分：一部分是业务无关的框架和基础库，还有一部分是业务架构。

描述每个模块的规格时，采用的规格描述语言会面临如下两种选择：

选择某种语言无关的接口表示
选择团队开发时采用的语言来描述接口

语言的选择在实践中对业务架构决策的影响仍然极其关键：

原因之一是开发效率。抛开语言本身的开发效率差异不谈，不同语言会有不同的社区资源。语言长期以来的演进，社区所沉淀下来的框架和基础库，还有你所在的企业长期发展形成的框架和基础库，都会导致巨大的开发效率上的差异。
原因之二是后期维护。语言的历史通常都很悠久，很难实质性地消亡。但是语言的确有它的生命周期，语言也会走向衰落。选择公司现在更熟悉的语言，还是选择一个面向未来更优的语言，对架构师来说也是一个两难选择。

怎么实现可自我迭代的计算机？

目前我们已知的功能需求有如下这些：

键盘和显示器的驱动程序。
外置存储设备的驱动程序。
汇编程序编辑器。可从外置存储中读取汇编程序代码，修改并保存到外置存储中。
汇编编译器。可将汇编程序代码编译成机器代码程序，并保存到外置存储中。
支持执行一段保存在外置存储设备中的机器代码程序。

外置存储需要保存的内容有：

汇编程序的源代码
汇编编译器编译出来的可执行程序

操作系统的设计者们设计了文件系统这样的东西，来组织这些文件。虽然文件系统的种类有很多（比如：FAT32、NTFS、EXT3、EXT4 等等），但是它们有统一的抽象：文件系统是一颗树；节点要么是目录，要么是文件；文件必然是叶节点；根节点是目录，目录可以有子节点。但是，文件系统（File System）是否是唯一的可能性？当然不是。键值存储(Key-Value 存储) 也挺好，尤其是早期外置存储容量很可能极其有限的情况下。可以做这样统一的抽象：

每个文件都有一个名字（Key），通过名字（Key）可以唯一定位该文件，以进行文件内容的读写；
为了方便管理文件，可以对文件名做模糊查询（List），查询（List）操作支持通配符（比如我们现在习惯用的*和?）；
未来外置存储的空间有可能很大，需要考虑文件管理的延展性问题；可以考虑允许每个文件设定额外的元数据（Meta），例如创建时间、编辑时间、最后访问时间、以及其他用户自定义的元数据。通过元数据我们也可以检索（Search）到我们感兴趣的文件。

BIOS和外置存储上的软件分工的标准是什么？

BIOS是刻在计算机主板ROM上的启动程序，它的变更非常麻烦。所以BIOS负责的事情最好越少越好，只做最稳定不变的事情。

首先是外部设备的驱动程序：键盘和显示器的驱动程序、外置存储设备的驱动程序。一方面，只要键盘、显示器、外置存储没有大的演进，驱动程序就不变，所以这块是稳定的；另一方面，它们是BIOS干其他业务的基础。所以，这个事情BIOS必然会做。

其次是汇编程序编辑器。编辑器的需求是模糊的，虽然我们知道它支持用户来编写程序，但是整个编辑器的操作范式是什么样的，没有规定。所以它不像是给键盘写一个驱动程序那样，是一个确定性的需求，而有很多额外的交互细节，需要去进一步明确。

再次是汇编编译器。汇编编译器从输入输出来看，似乎需求相对确定。输入的是汇编源代码，输出的是可执行程序。但认真分析你会发现，它实际上也有很大的不确定性。其一，CPU会增加指令，这时候汇编指令也会相应地增加。对于大部分应用程序，CPU新增的指令如果自己用不到，可以当它不存在。但是汇编语言及编译器需要完整呈现CPU的能力，因此需要及时跟进。其二，虽然汇编指令基本上和机器指令一一对应，但是它毕竟是面向程序员的生产力工具，所以汇编语言还是会演进出一些高阶的语法，比如宏汇编指令。所谓宏汇编指令，就是用一个命令去取代一小段汇编指令序列，它和C语言里面的宏非常类似。所以汇编语言并不是稳定的东西，它和其他高级语言类似，也会迭代变化。这就意味着汇编编译器也需要相应地迭代变化。

最后执行一段保存在外置存储设备中的机器代码程序。这个需求看似比较明确，但是实际上需求也需要进一步细化。它究竟是基于外置存储的物理地址来执行程序，还是基于文件系统中的文件（文件内容逻辑上连续，但是物理上很可能不连续）来执行程序？实现上，这两者有很大的不同。前者只需要依赖外置存储的驱动程序就可以完成，后者则还需要额外理解文件系统的格式才能做到。

BIOS到底怎么把执行控制权交到外置存储呢？

CPU加电启动时，它会从存储的一个固定地址开始执行指令，这个固定地址指向的正是BIOS程序。类似的，我们的BIOS也可以认定一个外置存储的固定地址来加载程序并执行，而无需关心磁盘的数据格式是什么样的。这个固定地址所在的数据区域，我们可以把它叫做引导区。引导区的存在非常重要，它实际上是BIOS与操作系统的边界。对于BIOS来说，执行外置存储上的程序能力肯定是需要具备的，否则它没有办法把执行权交给外置存储。但是这个能力可以是非常简约的。BIOS只需要执行引导区的程序，这个程序并不长，完全可以直接读入到内存中，然后再执行。我们是否需要基于文件系统中的文件来执行程序的能力？答案是需要。因为汇编编译器编译后的程序在外置存储中，需要有人能够去执行它。

BIOS需要负责的事情是：

键盘和显示器的驱动程序；
外置存储设备的驱动程序；
支持执行外置存储中引导区的机器代码程序；
跳转到外置存储的固定地址，把执行权交给该地址上的引导程序。

外置存储上的引导程序拿到执行权后干什么呢？

需要有人负责支持外置存储的数据格式，提供统一的功能给其他程序使用。无论它是文件系统，还是Key-Value存储系统。
需要有人提供管理外置存储的基础能力，比如查询（List）一下外置存储里面都有些什么文件。它可以实现为一个独立的程序，比如我们命名为ls。
需要有人执行外置存储上的可执行程序。它可以实现为一个独立的程序，比如我们命名为sh。
汇编程序编辑器。其实这个程序和汇编语言没什么关系，就是一个纯正的文本编辑器。我们可以把这个程序命名为vi。
汇编编译器。它可以实现为一个独立的程序，比如我们命名为asm。

引导程序拿到执行权后，我们不管它额外做了哪些事情，最终它要把执行权交给sh程序。因为，sh程序算得上是可自我迭代的计算机扩展性的体现：通过sh程序来执行外置存储上的任意程序，这也相当于在扩展CPU的指令集。

最终，我们设计出来的“可自我迭代的计算机”，它的系统架构看起来是这样的：

参考

posted @ 2021-12-24 10:15 TaylorShi 阅读(133) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

TaylorShi