Meta 近日宣布公司未来人工智能路线图,2024 年将斥资 90 亿美元购买 35 万张英伟达 H100 显卡,从而建立一个“大规模的计算基础设施”。这让人们的焦点,重新拉回到算力设施。作为先进计算的典型代表,位于无锡“神威・太湖之光”的超级计算机的算力也非常值得关注。然而这样的高性能计算的技术,在中国历史上则差点走偏了路。
中国高性能计算机,源自高科技 863 计划。这是中国科技发展史上的一次总决战,它在 1986 年 3 月发起,中国很多高科技成果是从这里的一纸计划走出。神舟飞船、歼 20 战机、高铁、5G 通信、杂交水稻、干细胞移植等进展,都离不开 30 多年前提出的“863”计划打下的坚实基础。该计划的设计者预测是 2 亿元,但最后批下来的专款是 100 个亿,当年全国财政总支出也仅约 2000 亿元。
信息技术的发展自然也在 863 之列。值得关注的是,中国计算机借助于顶层设计的开放性,从而避开先行者日本的大坑。惊心动魄的技术路线选择,让高性能计算机在中国 IT 发展史上成为一段传奇。
1982 年是人工智能浪潮兴起第二波的新浪头,各个国家都有盘算。日本通产省决定大规模建设第五代计算机,以专家知识系统和推理机入手,重构计算机体系。当时人们已经注意到了冯・诺依曼的存储与计算分开导致的串行执行程序的缺陷。日本决定采用大规模并行处理信息的新方式,建立了一套新操作系统:知识信息系统 KIPS。它采用“逻辑结构元件”和“知识基础元件”,来模拟人脑的思考回路。它也连接了天量的数据库和知识库,语音和图像识别都存储在相应装置,试图开发出可以对人类自然语言进行相应的程序。
能听能看有思维的计算机,让日本政府对这个疯狂的想法很着迷,投入 8 亿美元,组织富士通、NEC、日立等八家企业联合研发。第五代计算机,是当时计算机,也是人工智能的一个巅峰计划。充满了大量知识的智能系统,洋溢着乐观的科技辉光,投射在各个国家的高科技路线图的板墙上。
中国高科技发展项目 863 计划,不可能忽视日本这个超越了计算机行业的国家级计划。863 计划在信息技术领域设立了三个主题,其中之一就是 306。863-306 主题就是“智能计算机”,这就是呼应日本“第五代计算机”而来。
306 主题未来的技术路线图是什么?两个首席专家,产生了分歧。硬件出身的首席认为,可以沿着日本第五代知识系统计算机前行,而另外一个深谙系统工程的软件专家汪成为则从朴素的应用条件出发,对此表示了谨慎的怀疑。第五代计算机虽然热门,但是否就一定是唯一方向?
汪成为首席提出了著名的四不原则,表达了中国科技发展的路线。“不了解世界,就不能了解发展趋势;不了解中国,就不能优化战略部署”。正是这种实事求是的原则,使得 863-306 主题一直处于反复的研讨之中,而没有匆忙上马。人们需要思考,“智能计算机”的“智能”的含义到底是什么?
人工智能 AI 的复杂超过了人们的想象,甚至在学科归类上,一开始也含糊不清。人工智能既然要模仿人的思维,自然属于认知范畴,属于哲学命题,因此中国的人工智能学会一开始其实就挂在了中国社科院之下。而 AI 的很多重要分支,如语音识别,又跟社会学、语言学密不可分。语文大师往往是语音识别方向不可缺少的支撑,甚至当年清华四大国学大师赵元任的声调学也是 AI 学科的重要参考。
智能计算机的突破方向,一直处于讨论之中。直到 1987 年底,在钱学森的指点下,“不一定就是五代机,而是寻找更多的可能性”才成为共识。然而,这是一个“开放性共识”,它只是关闭了一个选项而没有给出明确答案。未来之路,依然没有共识。
专家组注意到了日本第五代计算所表现出来的缓慢进展。这在 1988 年日本五代机成果交流会上,体现在日本首席科学家的预期已经大幅度降低,五代机的进度明显呈现了延迟。
最后决定大方向的是美国之行。1990 年,新任命 306 专家组在美国考察了一圈,发现美国计算机的方向。与日本侧重知识处理系统所不同,美国则发力在个人计算机、高速工作站、超级计算机。彼时个人计算机已经呈现出勃勃生机,1987 年末,苹果、IBM 的台式机性能,已经超过了昂贵的 LISP 机专用工作站。而在 1980 年代初期,LISP 机是人工智能研究的重要工具。
商业应用是最好的科技导航图。这次之行,306 专家组确定了两个重要的方向。第一就是摆脱日本五代机的方向,向高性能计算机 HPC 进军 —— 尽管 HPC 一开始并没有列入 863 计划中。这是一个科技史值得屏息凝视的一刻,树上的花骨朵正在非如期绽放。正如《伟大为什么不能被计划》一书所展示的那样“目标反而会阻碍成就达成”,创新的自由会形成自我修正的机制,从而在过程中找到真正伟大的目标。
第二就是发展策略。战略方向已经确定,战术打法也非常重要。在当时,呼声很高的是要求中国先发展芯片、鼠标、显示器等微电子技术。306 专家组根据当时的实际情况,采用了“先应用后基础、先整机后零部件”的思路,决定采用硅谷成熟的零部件而专注于发展整机。而多处理机服务器则作为整机的重要突破口。
作为大工程,这是一个重大的战略主题转移,就像是一艘大航母在确定的路线上突然 90 度转向。这次转向最大的收获,就是中国曙光服务器的诞生。“曙光 1 号”只用了 200 万元人民币就开发成功。当曙光降临的那一天,美国立刻宣布解除此前断供的 10 亿次计算机的禁运令。曙光公司,也随之商业化,成为中国超算计算机的顶梁柱。
曙光服务器的诞生,就像是一次地壳运动的扩张新生,引起了连绵不断的山脉延伸。它形成了今后中国“神威・太湖之光”超级计算机。与此同时,306 项目负责人也带领弟子启动了中国芯片“龙芯”的研发。而龙芯研发者的学生,则创立了用于 AI 芯片的寒武纪公司。三代人血脉传承,波澜壮阔的画卷随之展开。这些传承至今仍然还在山水吞吐之间,能量汹涌。
863-306 是 863 计划中,取得丰硕成果最多的主题之一,然而它的起点却是慢得出奇。这种巨大反差,让人们有机会去思考举国体制下的“大工程”的特征。既然是面向未来的大科技项目,自然有相当的探索性,不确定性是最大的特点。这意味大工程一开始,未必就会有大工程共识。分歧、摩擦、不快、缓慢,这些与“快节奏”相悖、甚至激发负面情绪的过程,反而让人们有足够的时间去思考,大工程的方向是什么?批判性思维、无法和谐的观点,反而会产生良好的顿挫效果,使得人们的思考变得更加的周详。而全球视野的对比和取经,则让人们形成新的思考洪流。
在大工程的顶层设计期间,慢就是快。分歧就是大工程规划期间的最美好的礼物。异议、异类,都是一种宝贵的自我修正机制。这样,即使一开始设计起点搞错了,依然有机会重新校正回来。大工程共识,是一列等待出发的列车,当为目的地争论不休的人们相互妥协的时候,面红耳赤的人们就可以一起上车了。
863-306 是中国计算机史,也是人工智能历史上,自我修正的大工程典范。它避开了日本在五代机的大坑。到了 1992 年,日本已经意识到这是一条绝路,而停止了项目的继续发展。好的顶层设计,会有令人激动的收获。而产业化也成为“863”计划最鲜明的特征之一。1988 年 8 月,与“863”计划相衔接的“火炬”计划即《高技术产业发展计划》开始实施。二者遥相呼应,为科技力的商业化打下良好基础。当年的百亿元,早就创造了上万亿元的产值。
863-306 项目,在硬件上造就了中国高性能计算机的根基,而在软件上则孵化了智能接口,从而催生了汉字识别汉王、语音之王合肥科大讯飞这样的上市公司,以及快易通的机器翻译。从科技突破,到商业化的切换,创新的闭环让 306 项目光彩夺目。中国芯片还远远无法跟英伟达的 GPU、英特尔、AMD 相比较,然而大工程创新依然有着巨大的诱惑力。创意自由、批判性思维、开放的顶层设计则是最宝贵的创新财富。而既定计划的自我修正,大工程共识的威力,则是这段掩卷之后依然心潮不平的大工程创新的最精彩桥段。