展望芯片技术

写这篇文章的原因是前几天在学帝 @XDDongfang 的一个帖（暂时找不到是哪个帖了）里和 @dons222 @思维机器等聊天，也讲到计算机语言什么的，学帝鼓励 “也应该进军芯片” ，我回复 “我随后写一篇《展望芯片技术》” 。

我在《偏微分方程张量矩阵可以归为计算机语言》 https://tieba.baidu.com/p/6655949347 的 18 楼说可以将芯片的设计分工，这样可以简单易行。

节选如下：

“

大家可能会拿 GPU 说事，说设计 GPU 需要图形学知识，这么说也对。但可以把设计 GPU 的工作分成 2 部分，打个比方，小明负责设计图形函数，小刚负责设计逻辑电路。小刚只要把小明提供的图形函数用逻辑电路实现就可以了。

显然，设计图形函数是数学，设计逻辑电路是系统设计。

当然，还要一个小红，把逻辑电路变成物理电路，小红和小刚的不同是，小刚不必过多关心硬件工艺，主要关心逻辑设计，小红需要关心硬件工艺，把逻辑设计转换为硬件设计。

”

芯片在计算机层面的设计和发展方向，我写了一篇《CPU 应该搞 0 级 Cache ，而不是大寄存器》 https://tieba.baidu.com/p/7764325871 。其实归纳下来很简单，就是一句话：把成本都花在 Cache 上，比什么都强。

Cache 能造快一点的就造快一点的，能造离 CPU 核近一点的就造近一点的，不能再快也不能再近，就多造一点，增加数量（容量），也是好的。

这样的话，摩尔定律还是能继续有效比较长的一段时期的。

在 QQ 群里，我和网友争论过这个问题，现在，我想对他说：你懂底层，会玩寄存器，玩 10 个就差不多了，再多就乱了（顾不过来），而且现在的大寄存器一个顶 4 个，你还要按位（寻址）访问（数据），这不就是要管理很多个寄存器？就像耍杂技同时在手里抛接三个球、四个球，球太多就忙不过来了，也无暇关心其它事。少玩几个寄存器，把底层的编译器 / 编译器的底层写得小而坚固，我们可以关心点其它事情，比如共商大计，展望未来，大展宏图，喝酒品茶，谈玄论道，吟诗作赋，陶冶情操，增长课外知识，培养业余爱好，唱摇滚什么的。

芯片的电路设计，也不难，我写过

《用逻辑电路实现一个开平方算法》 https://tieba.baidu.com/p/6865666198

《设计逻辑电路的开关元件》 https://tieba.baidu.com/p/6867831769

《设计逻辑电路的开关元件（2）》 https://tieba.baidu.com/p/6898604921

电路设计一个关键的技术是计算和控制误差耦合，这有一定难度。但误差耦合可以等价为阻抗匹配问题来看，这样就容易理解了。在《设计逻辑电路的开关元件（2）》里讲到这部分，节选一段如下：

“

这似乎引出了 “输入阻抗” 和 “输出阻抗” 的问题，两个元件要连在一起用，输入阻抗和输出阻抗要匹配，或者说符合彼此给出的规格，大概就是输入阻抗和输出阻抗问题吧。

规格是指阻抗的范围，两个元件要连在一起用，自己的输出端阻抗要在对方给出的输入阻抗范围内。以及，对方的输入端阻抗要在自己给出的输出阻抗范围内。

”

想知道输入端阻抗和输出端阻抗，就要将元件的内部电路等效为电阻电路，来计算出等效的输入端电阻和输出端电阻。典型的，把三极管这样的非线性元件等效为电阻，比如

这 4 个图是否都正确，在正确的基础上，哪一个最简化而最接近实际？

若干个元件连接成一个电路，把元件替换为等效电阻，就可以画出整个电路的等效电阻图，定义出电路的输入端和输出端，这样就是一个模块，可以计算出输入端的等效电阻和输出端的等效电阻。进一步可以计算出在额定电压下，输入端接入的电阻的范围，即输入阻抗，和输出端接入的电阻的范围，即输出阻抗。

在额定电压和这些电阻范围内，电路里各个电阻两端的电压都可以获得正常的工作电压。这样就达到了阻抗匹配的效果。即这样的额定电压和输入输出模块的阻抗匹配，使得即使有误差耦合，但各个电阻两端的电压都在正常范围内，电路可正常工作。

上面说， “进一步可以计算出在额定电压下 ”，好像这个额定电压是一个值，那如果稍微偏差一点，会不会计算出的输入阻抗和输出阻抗范围就有误？

好问题。实际中，额定电压也是一个范围，同理，计算出额定电压在某个范围时的输入阻抗范围和输出阻抗范围，就可以了。

同学们，以我们的数学知识、物理知识、计算机知识，计算阻抗匹配没问题吧？来，给点信心，给点掌声 …… ！？

计算出了阻抗匹配，也就掌握和解决了误差耦合。

《设计逻辑电路的开关元件》里给出过继电器的构造图：

可知继电器的等效电阻图

继电器的等效电阻就是两个不相干的电阻，因此，可以说继电器没有误差耦合，是一个理想的开关元件。全部由继电器组成的电路的电路计算很简单。

我不知道为什么要用 Verilog HDL 和 VHDL 这样的硬件设计语言，我觉得，数字硬件设计是很简单的。软件界一直流传着一个说法：软件界很羡慕硬件设计，硬件设计只要把模块一个个凑起来就行了，一些元件凑成模块，一些模块凑成更大的模块，一些更大的模块凑成更大更大的模块 …… 像搭积木一样。

所以，我们按照这样把模块的线路图画出来，把每个模块的输入输出参数定义好，不就设计出来了？

我一直认为设计电路用模块线路图就可以，我一直提倡这个方法。

我在《CPU 应该搞 0 级 Cache ，而不是大寄存器》 https://tieba.baidu.com/p/7764325871 的结尾说

“

我提倡用模块线路图来设计硬件电路，硬件电路本来就是模块化的，用模块线路图设计很适合。模块的规格，包括接口和电路参数作为模块的说明书单独说明就好。

其实设计 CPU 很简单，主要是制造工艺和电路计算比较难。

”

我在《研究一下 CPU 除法》 https://tieba.baidu.com/p/7508676984 的结尾说

“

我提倡用模块电路图 + 模块规格来做硬件电路设计，真的很爽，爽死了，无敌。

模块规格包括模块定义、接口、参数等。

”

有人说，模块线路图给人看可以，但是怎么把模块线路图展开为光刻机能读懂的 Map ？这里的 Map 指硅片上微观元件的结构和布局，光刻机根据 Map 在硅片上光刻。

这好办，我们不是程序员吗？写一个程序把模块线路图递归展开为 Map 不就行了？

综上，一个开源团队提供出一套芯片设计方案是可能的，或者说，一个开源团队主导负责一款芯片的设计和研发生产是可能的。

接下来，我们来展望未来的芯片技术。小时候，看科普读物《明天的科学》，讲到了未来的光子计算机，就是使用光子芯片的计算机。光子芯片由光子开关组成。文中说光速比电信号速度快很多，因此，光子开关比电子电路快，光子芯片比集成电路快，光子计算机比电子计算机快。

除了光子计算机，我还想到量子计算机。这个量子计算机不是 “退火” 、塌缩、 “平行宇宙” 的那个 “量子计算机”，这个量子计算机仍然是冯诺依曼计算机，只是采用量子开关。

量子开关类似电子开关（三极管）、光子开关，只不过利用量子间作用来实现开关效果。

现在芯片技术已经达到了几纳米的粒度，其实这么小的微观元件间的作用已经可以是量子作用了，当然，目前的芯片运行还是依靠和宏观一样的欧姆定律。

蛋白质的分子比几纳米大，而原子分子电子（共价键）之间的作用是量子作用。

目前的芯片的几纳米的粒度在分子水平，也差不多在原子水平，当然，目前的芯片运行还是依靠和宏观一样的欧姆定律。

那么，能不能利用分子原子间的作用（量子作用）来实现开关效果呢？

分子原子间的作用，我们最熟悉的，最普遍的就是化学反应。

我写过一篇《浅谈生物体信号传递》 https://tieba.baidu.com/p/7743406689 ，里面说 “神经信号的生化反应在分子级的反应速度应该是纳秒级的，就是说跟计算机 CPU 主频差不多是一个水平” 。

我们再来计算看看。设人的手指到大脑的神经通路长 1 米，手指的感觉传递到大脑的时间是 0.1 秒，则神经信号传递的速度 = 1 米 / 0.1 秒 = 10 米 / 秒。传递 1 纳米的距离需要的时间 = 1 纳米 / ( 10 米 / 秒 ) = 0.1 纳秒。

假设 CPU 的一个核的集成电路的面积是 0.1 * 0.1 平方毫米，相当于边长 = 0.1 毫米的正方形。一个时钟周期里，电信号必须从核的这一端传递到核的另一端，一端到另一端的距离按边长算，也就是 0.1 毫米，一个时钟周期按 1 纳秒算，也就是主频 1 GHz，则电信号传递速度 = 0.1 毫米 / 1 纳秒 = 10 万米 / 秒。

这里，我们计算出的

神经信号传递速度 = 10 米 / 秒，

电信号传递速度 = 10 万米 / 秒

显然，电信号远远比神经信号快，电信号速度是神经信号的 1 万倍。

神经信号是化学反应实现，化学反应是分子原子间的作用，是量子作用，不过从上面的神经信号传递速度 = 10 米 / 秒来看，这个量子作用的速度比电信号慢 1 万倍，如果用这个量子作用来实现量子开关，那速度也比电子开关慢 1 万倍，用这个量子开关制造计算机，速度比电子计算机慢 1 万倍。

也就是说，仿照神经信号传递的化学反应来制造量子开关，速度比电子开关慢 1 万倍，这个不是我们要的效果，我们希望量子开关比电子开关快。

但其实神经信号传递速度 = 10 米 / 秒这个说法也有点问题，我们是按照人的体型和反应时间来估算这个速度的，但自然界中动物有大有小，如果神经信号传递速度总是 10 米 / 秒，那动物体型越大，从身体局部到大脑的神经通路越长，反应速度越慢？动物体型越小，反应速度越快？好像不是这样。

刚在网上查了一下恐龙的第二大脑的资料，看到神经系统传导速度大概是 100 米 / 秒，以前的科学家认为恐龙在屁股那里有一个神经球，也就是第二大脑，如果没有第二大脑，尾巴的感觉传到大脑的时间太长， “切掉恐龙的尾巴，等烤熟了，它的大脑也许才能感觉到疼痛并做出反应。” 但现在的科学家又认为这个第二大脑的说法是错误的。见知乎《为什么说有的恐龙有两个脑子，是真的吗？》 https://www.zhihu.com/question/302602677/answer/540057319 。

说起恐龙的尾巴，我就想起《妖精的尾巴》 …… 虽然没看过。

总之，能不能找到比电信号更快的量子作用？

上文说到继电器没有误差耦合，是理想的开关元件，能不能做出来一个原子、量子层面的继电器？

小时候看《明天的科学》，书里展望了光子计算机，神经网络、模糊数学。要实现光子计算机，就要先实现光子开关。

可以用光的干涉来实现光子开关。一束光和另一束光干涉会产生条纹，这意味着它们的光子的运动方向发生了改变。也就是说，通过干涉，可以让一束光让另一束光的光子的运动方向改变，这个特性可以用来实现光子开关，即用光信号控制光信号。

我在《谁能证明：标准波面的光若能汇集于一点，则它们的光程长度必然相等》 https://tieba.baidu.com/p/7692891691 的 11 楼提出了光子碰撞定理，并且对 @dons222 说 “过两天我会在另一篇文章里让你看到光子碰撞定理的实际应用”，这个实际应用就是光子开关。光子碰撞就是光子对光子的干涉，就是光的干涉。

也可以说，光子和光子之间不一定总是无视对方和可以穿过对方，有时候会发生干涉，可以把干涉理解为光子和光子之间的相互作用，比如碰撞。

既然找到了光子和光子之间的相互作用，比如可以让一个光子去碰撞另一个光子使之改变运动方向，顺理成章的，当然可以用一个光子控制另一个光子的运动方向，也就是用光信号控制光信号，也就是光子开关。

虽然我在《谁能证明：标准波面的光若能汇集于一点，则它们的光程长度必然相等》的 12 楼又说了，光子碰撞定理不一定成立，但是，用光的干涉实现光子开关是可以的。

光子开关有多快？光子开关由光的某些介质制造而成，或者刻在 “集成光路” 上。集成光路的底板是光的某种介质，就像集成电路的底板是硅片。

于是，光子开关的速度就和光在介质中传播的速度有关。光在真空中的速度是 30 万千米 / 秒，在介质中的速度小于真空中的速度。

假设光在介质中的速度是 10 万千米 / 秒，可以认为，光信号的传递速度也是 10 万千米 / 秒。上文计算出的电信号传递速度 = 10 万米 / 秒，显然光信号的速度是电信号的 1000 倍，即光信号比电信号快 1000 倍。这样的话，光子 CPU 的主频比电子 CPU 快 1000 倍，我们现在用的 CPU （电子 CPU）主频是 1 GHz 水平，光子 CPU 的主频可以达到 1 THz 水平。

也就是说，以后买一台光子计算机的笔记本，相当于买了 1000 台电子计算机的笔记本。一台光子计算机 PC，相当于 1000 台电子计算机 PC 。一台光子计算机服务器，相当于 1000 台电子计算机服务器。

只是 CPU 快还不够，内存和 CPU Cache 也要快，用光子开关制作双稳态光路，双稳态光路组成的光子内存和 CPU Cache 比电子内存和 CPU Cache （我们现在用的）快 1000 倍。

上文说到做一个量子层面的继电器，由此想到我写过《出题：请计算 2 个铁原子之间的摩擦力大小》 https://tieba.baidu.com/p/6564151919 。

我在《谁能证明：标准波面的光若能汇集于一点，则它们的光程长度必然相等》里也展望了一下光刻机。

我还写过《设计一个硬件实现的 Dictionary（字典）》 https://tieba.baidu.com/p/6429003216 ，《用 CPU 计算 100 万个点的三维坐标旋转》 https://tieba.baidu.com/p/7697407520 。

在《左手坐标系坐标变换》 https://tieba.baidu.com/p/7668913258 里提出了用 CPU 多核计算代替 FPGA / DSP / GPU ，

在《大自然的密码：色彩的起源》 https://tieba.baidu.com/p/7679825850 里提出了超 • 冯诺依曼计算机。

假设光子 CPU 的一个核的集成光路的面积是 0.1 * 0.1 平方毫米，相当于边长 = 0.1 毫米的正方形。一个时钟周期里，光信号必须从核的这一端传递到核的另一端，一端到另一端的距离按边长算，也就是 0.1 毫米，则一个时钟周期 = 0.1 毫米 / ( 10 万千米 / 秒 ) =

一个时钟周期按 1 纳秒算，也就是主频 1 GHz，则电信号传递速度 = 0.1 毫米 / 1 纳秒 = 10 万米 / 秒。

神经构造简化为由某种分子组成，

模块线路图设计程序员递归展开光刻线路图

光子计算机

量子计算机

在原子量子的层面搞一个继电器？

光刻机

posted on 2022-01-06 04:38 凯特琳阅读(43) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

凯特琳

展望芯片技术

导航

公告

凯特琳

展望 芯片技术

导航

公告

展望芯片技术