《左手坐标系坐标变换》里的回复

《左手坐标系坐标变换》 https://tieba.baidu.com/p/7668913258 。

25 楼

回复 22 楼 dons222 思维机器，

是的是的，其实我习惯用 Sql 而对 GPU 一无所知，所以我还是很看好用 Sql 计算的，用 Sql 进行大量数据的关系运算。

但进一步想了想，比如矩阵乘法， GPU 处理一个矩阵的元素和另一个矩阵的元素的对应关系就是一个寻址，而数据库按表处理的话，根据一个表的字段查找另一个表的一笔记录的字段，即使用索引，也是一个复杂的工序（程序），相比寻址的话。

GPU 是不是有 Cache ？将内存的数据批量复制到 GPU Cache 进行计算，完成后再复制回内存，这些应该有驱动执行 / 控制，上层程序调用驱动，上层程序比如图形库 GL 。

用户程序 -> 3D 库（比如 Unity3D） -> 图形库 GL -> 驱动 -> GPU （指令集）

应该是这么一个架构。

这样，将数据传送给 GPU 运算再返回，也是一次轻量 IO 了。

由上，产生一个想法，可以写一个程序来计算图形函数和算法，就像 GPU 一样，只不过现在是在 CPU 里运行。也就是说，我们写一些程序，让这些程序在 CPU 里运行来代替 GPU 。

这个想法当然会引出问题： GPU 不就是为了将图形计算交给专门的硬件芯片（GPU）而产生的吗？怎么现在又要回到老路，在 CPU 里计算了？ CPU 执行软代码能有 GPU 固化的硬代码（复杂指令集）快吗？而且 GPU 应该对浮点数和整数运算都做过增强，比如支持更多位数的浮点数和整数运算，比如 128 位，复杂指令集和更多位数的四则运算这些固化的运算可以预先设计好需要的大寄存器。大寄存器指位数多，比如 128 位， 256 位，对寄存器而言，位数大也就是容量大，当然，数量也要够。

GPU 也可能支持需要更少的时钟周期的除法，除法需要的时钟周期越少，需要的电路规模越大，见《研究一下 CPU 除法》 https://tieba.baidu.com/p/7508676984 。

上面这些关于 GPU 硬件结构和设计的内容是我猜的。

接着说为什么现在要回到 CPU 计算的思路，上面说了，将数据传送给 GPU 运算再返回，也是一次轻量 IO 了。如果由 CPU 进行（图形）计算，则数据在内存里，不用复制到 GPU Cache，也不用计算好后从 GPU Cache 复制回内存，也不用驱动介入。

当然，并不是说由 CPU 计算，数据在内存里就不用复制数据了，从内存到 CPU Cache 也要复制数据的。

一件可喜的事是，现在多核很普遍，一个流传很久的课题是要怎么利用这些多核。用一个或几个核来做图形计算不香吗？

大规模的矩阵运算，可以用并行计算，事实上一般还不至于把一个矩阵分到几个 CPU 核上运算，但是，如果有成百上千个矩阵，一个 CPU 核分配 100 个矩阵，用 10 个核来并行计算 1000 个、几千个矩阵运算还是可以的吧？

当然， GPU 应该也设计了一定的并行计算能力。

3D 、三维旋转、高维旋转，确实是 “计算密集型” 应用吧。

我挺有兴趣开发这样的程序，用 CPU 的一个或几个核来做图形计算、卷积计算、矩阵计算 …… 各种 “计算密集” 的计算。

26 楼

民科吧的《巜草根科学探索》螺旋结构与液状的研究探索》 https://tieba.baidu.com/p/7672945207 让我看到了未来科技的景象。

未来的科学包括：

1 数学的突破和繁荣

2 科学思想和方法、实践的多样化，以及由此带来的技术的蓬勃发展

从《巜草根科学探索》螺旋结构与液状的研究探索》可以看到第 2 点。

数学可以作为可能性证明、边界证明、方向指导、理论预言、理性探究，当然，还有计算方法。

数学会广泛的用于工程技术的推理论证。

既是科学的皇后，也是科学的仆人，让人们站得更高，看得更远，让理性提升，让知识就是力量，这是数学应该担负起的职责吧！

另一方面，各色能人又不囿于数学，可以充分发挥各自才干钻研发明创造，以此造就（科学）知识和技术的繁荣。

各色能人虽然不囿于数学，但又可以容易的随时从数学家、计算机、软件包那里获得帮助和支持。

以数学为主导的科学流派称为数学流派，代表人物： XDDongfang

工程师流派： dons222 思维机器，他们用工程技术的思想和成果发展科学，改变世界。

物理流派：渝中寿人

评论家流派：水星之魅

左老师的《世界顶级数论猜想》 https://tieba.baidu.com/p/7667545281

《颠覆性电光椭圆波动理论电子版》 https://tieba.baidu.com/p/7672885825

回复 25 楼 dons222 思维机器，

FPGA 和 DSP 我听说过，但懒得去了解，我喜欢用通用的玩出专用的效果。

我以前提出过 “轻量操作系统” 的概念，我认为未来硬件标准化是趋势，硬件标准化可以让操作系统轻量。

另一方面，操作系统发展了几十年，需求已经很清楚，可以提炼和精简出来，这也可以让操作系统轻量。

轻量操作系统可以广泛的用于各种服务器场合， “服务器” 不一定很大，有大有小，比如智能设备和物联网节点。

从 26 楼的回复看来，运行速度上， FPGA / DSP > 实时操作系统 > 通用（分时）操作系统

如果让通用（分时）操作系统轻量化，并只用于完成一项工作，那么，运行速度表现可以接近实时操作系统。

一项工作可以是多个工作组成，不是说只做一件事。一项工作可以由多个工作进程组成，不是说只有一个进程。

一项工作比如体操机器人。

分时操作系统轻量化后，只用于一项工作，则只剩下操作系统进程和工作进程，当然工作进程可以有多个。

从最原始的中断处理到进程 / 线程的调度 / 切换，内存的 GC 甚至外存的 GC ，管理工作（管理成本）还是要的，实时操作系统也要处理各种中断。

现在的通用操作系统的进程/线程切换的工作量太繁杂了，进程切换要更新 CPU 存储管理部件的页表，这可以，但从资料上来看，具体做的事情太多，线程切换也是，线程切换就计算一下哪个线程之前对 CPU 的使用率最高就优先给哪个线程执行，主要是计算这个算法，但资料上来看，线程切换的工作也太多太杂，本来，如果只是计算线程对 CPU 的使用率并据此评估出接下来由哪个线程执行，如果只是做这个计算的话， 1000 纳秒也就是 1 微秒内可以做完这个计算吧？那粗略的，就可以按 1 微秒切换一次线程来算，既然 1 微秒可以切换一次线程，那 1 秒钟可以切换 100 万次线程吧？

这就是著名的 “1 秒钟切换 100 万次线程” 观念，是我提出的，我一直在推销这个观念。

经过在 QQ 群里的实践碰撞修正再认识后，发现这个观念越发牢靠了。

如此，这样短暂的线程切换，对于实时系统来说，也只相当于一次快速的程序启动（热身），也就是，分时系统如果可以做到 1 秒钟切换（创建） 100 万个线程的话，那一次线程切换（创建）就相当于实时系统的一个程序（任务）启动（加载 / 热身）。

这很激动人心。

当然，即便线程切换（创建）如此之快（廉价），我们也不会随意的切换（创建）线程，我们仍然会使用现有的线程池和异步任务技术，来让程序高效。

异步任务的切换时间是 CPU 核之间 mutex 的级别，就是几十纳秒的级别，这就更轻量了。

而事实上，如果用一个多核 CPU 只从事一件工作的话，比如体操机器人，则应该是若干个进程（线程）运行于若干个核上，本来也很少需要切换进程 / 线程。

多核的好处时，操作系统需要进行管理时，操作系统进程只要运行于一个核，在这个核上计算好线程的优先级，然后通知其它核的线程切换即可。在操作系统进程计算期间，其它核上的线程可以照常工作，而事实上，操作系统进程计算完调度计划后，计划并不一定让其它核的线程切换，因为整个 CPU 本来就在做一项工作嘛，也没有其它任务来抢占 CPU 。

当然，线程没事做的时候，会挂起，有请求了，比如外设有输入了（体操机器人接到指令或响应外界发生的情况），那么线程恢复运行。

因为上面说了， “1 秒钟切换 100 万次线程” ，所以线程挂起和恢复是很快的， 1 秒钟可以挂起 / 恢复 100 万次。

我做过测试，在 PC 上， C# 里的 FileStream. Read () 方法 1 秒钟可以执行 100 万次以上， Read() 只是读取 "aa" 这样很短的字符串，所以读取都是从缓冲区，也就是内存，甚至是 CPU Cache 里读取，这个时间很短，因此 Read() 的时间主要是花在 Read() 的时候切换到 IO 线程，又从 IO 线程切换回用户线程，简而言之就是时间主要花费在切换线程上。

因为每次 Read() 要切换到 IO 线程，又从 IO 线程切换回用户线程，是 2 次切换，所以， 1 秒钟执行 100 万次 Read() ，实际上是 200 万次线程切换呢！

当然， QQ 群里的网友指出，这不是线程切换，而是系统调用，但就算是系统调用，你从用户代码切换到系统调用，又切换回来，也要保存和恢复寄存器上下文吧！

让线程切换和系统调用一样轻量，是可以做到的。

这是轻量操作系统。综上，分时操作系统的运行速度表现是可望 “无限” 接近实时操作系统的，分时操作系统也可望成为更广泛的领域，包括各种专业领域通用的操作系统和解决方案。

另一方面，是编程语言， 26 楼你们也说了， FPGA / DSP 的编程比较麻烦，可以看出来，修改和维护也麻烦。编程语言和编程模型比较底层，一方面是编程难度大，另一方面是保证代码安全的难度也大。

我和 QQ 群里的网友正在研制一门新的通用的编程语言 D++ 。

D++ 的目标是通用高效安全简洁。这看起来像口号，但这是实际所需。

这里，我们尝试展望一种通用架构，这个通用架构包括了硬件、操作系统、编程语言，语言的通用高效安全简洁是这个架构的一部分。

C / C++ 是通用语言，从底层来说也高效，但不安全，又因其太灵活，导致编程范式众多，因此，代码也不简洁。

================================

在 QQ 群里，我对馥岚过野说，这几天回复的内容里，有很多知识是从你那里学来的。 “这几天回复的内容” 就是本文的内容。

我又对馥岚过野 :| 左边说，当然，也是我们讨论了一年的成果。

posted on 2021-12-28 01:35 凯特琳阅读(38) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

阅读排行：
· 阿里最新开源QwQ-32B，效果媲美deepseek-r1满血版，部署成本又又又降低了！
· 单线程的Redis速度为什么快？
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决：字节Trae VS Cursor，谁才是开发者新宠？
· 展开说说关于C#中ORM框架的用法！

历史上的今天：
2020-12-28 调幅是电子技术，调频是量子技术
2020-12-28 出一道题：证明超外差收音机的混频原理
2018-12-28 设计一个硬件实现的 Dictionary（字典）

凯特琳

《左手坐标系坐标变换》里的回复

导航

公告

搜索

常用链接

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论

凯特琳

《左手坐标系坐标变换》 里 的 回复

导航

公告

搜索

常用链接

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论

《左手坐标系坐标变换》里的回复