据可靠内部消息,微软正积极筹备一场新的技术革命,那就是启动下一代操作系统的研发计划这将再次展现其作为科技巨头的雄心和实力。

与面向C端的Windows个人电脑操作系统不同,微软的新操作系统,是面向B端的操作系统,目标指向是AI算力集群和云计算平台。首先会在“星际之门”项目上应用,成为通用人工智能GPT-6的软件基础平台,待产品完善后,慢慢切换到Azure云计算平台,取代目前Azure云使用的Linux操作系统。后续,微软新一代操作系统,将以商品形式向市场发售,发售对象是云计算企业、算力中心、私有云客户、超算、政府、科研及军事部门,但是不包括中国市场。

根据已有的一些信息,微软下一代操作系统,与LAXCUS分布式操作系统有很多相似之处。微软能够投入巨资研发新操作系统,应该是看到算力产业巨大的发展潜力和商业价值。凭借其深厚的技术积累和广泛的用户基础,微软下一代操作系统将更为强大和灵活。

微软在PC时代辉煌过,但是在移动互联网时代落伍了,后来凭借云计算和AI,重新站在产业市场前列。研发面向AI算力集群和云计算平台的新一代操作系统,显然是想夯实他在AI和算力市场的领导地位。

未来20年,是AI驱动下的算力时代。算力将成为一种重要的基础资源,必然深处社会各个领域,如何更好地管理算力、使用算力、节约算力,是亟待解决的问题。

做过研发的都知道,技术问题,如果能够从底层解决,要比从应用层解决效率更高,并且更稳定更可靠,也更容易实现标准化和通用化。

做为操作系统行业资深大佬的微软,显然非常明白这些情况。参考Windows的发展历程,通过操作系统辐射相关应用产业,占领产业制高点,通吃整个软件产业链,是微软一贯做法。

以微软的技术实力和商业能力,一旦完成新一代操作系统研发,投入市场后,B端软件市场将面临重新洗牌的局面,很多企业应用将面临下课的风险。市场将从现在的群雄并起、诸候争据,变成一家独大。进一步,届时微软凭借B端C端两大操作系统,完成计算机B端C端的深度整合,将再一次站在软件世界之巅,成为计算机产业当之无愧的王者,世界将再次匍匐在他的脚下,微软将再次复现PC时代的辉煌。

目前微软新一代操作系统处于产品研发阶段,但是它与LAXCUS分布式操作系统目标一应用方向相同,所以技术和功能应该也大差不差这里暂且以LAXCUS分布式操作系统7.0版本为样板,反向推演微软新一代操作系统1.0的大致轮廓。

 

一、产品定位

从物理形态来说,微软新操作系统属于多机操作系统,与LAXCUS分布式操作系统一致,但是与单机操作系统有本质区别。多机操作系统主要运行在云计算平台和计算机集群上,管理和调度海量的计算机资源,旨在解决大规模、超大规模分布式计算和分布式存储遇到的算力瓶颈问题。所以,无论是数据处理、实时分析、AI模型训练,都是微软新操作系统拿手好戏。凭借海量的硬件算力资源,结合软件的系统函数库,它能够用更短的时间,实现更快更强的计算效果,这也是多机操作系统的产品属性和商业价值所在。

技术是相通,如果估算不错的话,微软新操作系统能够支持的计算机规模上限,应该与LAXCUS分布式操作系统类似。在IB网络环境下,单集群模式能够达到8000至10000个节点,多集群模式,可以超过100万节点。这个支持能力,将为微软的“星际之门”项目和Azure云计算平台提供有效基础算力保障。

同样的,在中国,LAXCUS分布式操作系统也可以将全国算力中心连接起来,形成“全国算力一张网”,集中管理调度,为企业提供更好的算力服务。

 

二、资源聚合

对计算机集群的资源聚合能力,肯定也是微软新操作系统的基本功能之一。所谓资源聚合,就是通过网络,将分散的物理计算机节点连接起来,成为一个集中的虚拟超级计算机。无论物理上有多少台计算机,在软件层面,都是一台逻辑透明的“单机运行环境”,基于此,微软新操作系统将实现计算资源的集中管理、高效利用、无缝计算服务。同时,基于资源聚合的逻辑透明的“单机运行环境”,也将大幅简化应用软件的开发流程,降低开发难度,使开发者像编写单机应用软件一样,开发出具备超大规模计算能力的分布式应用软件。这对当下复杂的AI、大数据、HPC开发工作来说,是一个巨大的福音。

参考LAXCUS分布式操作系统,微软新操作系统的资源聚合,硬件包括:CPU、GPU、磁盘、内存、网络等。软件的资源聚合,将由操作系统和系统函数库(在LAXCUS分布式操作系统是DSDK)提供,操作系统运行过程中,以软件接口形式交付给应用软件使用。

三、云管能力

云管能力应该也是微软新操作系统的又一重要基本功能。通过内置的云管理工具,用户可以方便地部署、监控和管理计算集群,实现对计算资源的实时掌控。微软新操作系统很可能提供云管API,并完成云管标准化。如果情况属实,那么微软凭借新操作系统,将吃下又一个企业应用市场,届时很多云管应用软件将面临下课风险,这是相关从业者需要警醒的。

 

四、虚拟化

虚拟化是资源聚合的反向动作,能够将一台物理计算机中划分成多台虚拟计算机,分配给用户使用,从而达到资源复用、降低使用成本的目的。所以虚拟化也应该是微软新操作系统的核心功能之一。通过多种虚拟化技术,包括容器化、虚拟机等,能够为用户提供灵活多样的计算环境。无论是开发、测试还是生产环境,用户都可以根据自己的需求选择合适的虚拟化方案,快速创建和管理虚拟机或容器,实现计算资源的灵活分配和管理。

目测,虚拟化将是微软新操作系统的一个选件。因为像“星际之门”这样的算力集群,更多是对算力的渴求,而对虚拟化需求并不强烈,虚拟化更适合Azure这样的云计算平台和云计算服务企业。

微软如果将虚拟化功能集成进入他的新一代操作系统,通过操作系统辐射应用市场,必然会对其它虚拟机厂商形成冲击,比如VMWare、OpenStack等虚拟机厂商。具体参考微软和网景的浏览器大战。

 

五、冗余容错

计算机集群是由大量计算机通过网络连接起来的物理环境。它在运行过程中,无法保证每个节点都处于正常运行状态,促使冗余容错机制是所有分布式系统必须具备的基础能力。所以可以肯定的是,为了保证计算机集群运行环境整体的稳定性和可靠性,微软新操作系统一定会采用各种各样的冗余容错技术,确保服务的连续性和可用性。

通常一个简单的冗余容错流程是:操作系统保持对所有计算机的追踪,一旦发现并判断是某个节点出现故障,立即启动备份节点,替换故障节点,并根据冗余记录,将相关业务迁移到新的正常节点运行,并隔离故障节点,然后将上述信息报告给系统管理员。

实际的冗余容错机制非常多,也更复杂,比如时间冗余、空间冗余、信息冗余、回滚容错、TRM容错、灾难恢复等,确保系统在面对硬件故障或者外部攻击时能够保持正常运行。

近年来,由于AI技术突飞猛进,冗余容错引入了AI元素,比如LAXCUS分布式操作系统采用的自适应机制和智能感知技术,它们在强化操作系统对计算机集群的自动化管控、减少人力干预、降低运维成本时作用明显。

 

六、安全

现在,系统安全已经是所有操作系统的基础功能,所以微软新操作系统应该也会安全方面下足了功夫,比如加密技术和访问控制策略,从而确保用户数据的安全性和隐私性。另外,微软新操作系统应该也会内置一些安全工具和机制,如防火墙、入侵检测等,为用户提供全方位的安全保障。

所以,从事相关研发的企业也要小心了,微软新操作系统会吃掉你们的市场。

 

七、分布式编程接口

微软新操作系统的又一个核心重要组成部分是分布式编程接口,与之对应,在LAXCUS分布式操作系统是DSDK。只有提供了分布式编程接口,开发者才能编写基于微软新操作系统的应用软件。如果微软实现这样的开发框架,且且应用生态成型,类似Slurm这样的分布式编程框架也要下课了,微软将吃下又一个企业市场。

 

八、分布式应用软件

当新操作系统和分布式编程接口成型,微软的工作重心肯定将转向分布式应用软件,并通过分布式应用软件构建应用生态。不同传统单机操作系统上的应用软件,运行新操作系统上的应用软件,将更多是企业应用软件。这些企业软件以算力需求庞大、计算能力强大著称。比如大规模的数据计算、数据分析、机器学习等工作。

因为多机操作系统不同于单机操作系统,分布式应用软件也与单机应用软件不同。以LAXCUS分布式操作系统为例,分布式应用软件将分为前端和后端两个部分。其中前端将主要负责人机交互工作,后端分散在计算机集群上运行,提供大规模、超大规模的计算和存储支撑。前后端相互作用,共同组织实施大型计算任务,比如AI训练、分子模拟、流体力学、结构力学、高端武器仿真测试等工作。

微软大概率会为分布式应用软件构建一个类似App Store 的应用商店,辅助完成生态建设,实现开发者和用户的链接、交流、交易。

 

九、对AI的支持

作为面向AI算力集群的操作系统,微软新操作系统一定会深度支持AI。可能的做法是在操作系统中内置了AI算法和框架,如TensorFlow、PyTorch等,这将方便用户进行模型训练和推理。同时,微软新操作系统还将支持GPU加速、分布式训练等先进技术,为AI应用提供强大的算力支持。

为节约AI算力能耗和GPU使用规模,目前英伟达已经联合了Transformer研发团队,重构AI大模型的软件基础框架。因为AI大模型软件基础框架的重要性,与以前开源开放不同,这一次他们不开源了。在AI领域不肯掉队的微软,应该也有类似的打算。

 

十、兼容Windows

为了保持用户的使用习惯和避免用户流失,微软的新操作系统一定会兼容现有的Windows平台,使得企业用户可以无缝迁移到新系统,继续使用他们熟悉的Windows应用和服务,比如像SQL Server这样的企业应用软件。而且微软为提高新操作系统的覆盖面和产业生态,很可能会向使用Windows Server的企业推荐新操作系统,以取代Windows Server。无论是计算性能和计算规模,微软新操作系统都远胜Windows Server。

 

十一、生态

生态建设肯定是微软最重注的环节,这事关微软新操作系统能够走多远。产品层面的做法应该是开放API、提供开发工具、技术支持等方式,吸引开发者和企业加入其生态体系,实现云计算、AI、算力应用业务的标准化和通用化,就像苹果iOS和谷歌Android曾经做过的那样。

最近一段时间,美国一批高科技公司,包括微软、苹果、谷歌、Meta、特斯拉、亚马逊、甲骨文正在大量囤积英伟达算力芯片。硬件算力基础设施,除了微软的“星际之门”,特斯拉也升级了他的Grok超级计算机,马斯克将其称为“超级算力工厂”。这些硬件算力基础设施,如果再配合微软的新一代操作系统,结合新的Transformer框架,以及GPT-6、Llama3等通用人工智能大模型,他们已经为即将到来的通用人工智能产业大爆发做好准备,再一次站在世界的前列!

结束语

目前微软新一代操作系统尚未出炉,具体的技术和功能仍有变数,但是总体的技术框架和应用方向不会有变化。

微软的野望,凭借新一代操作系统再一次展现得淋漓尽致,一旦完成下一代操作系统和AI产业布局,微软很可能成为全球第一个突破5万亿美元的超级公司。

在AI时代,微软通过从AI应用、AI通用大模型、AI算力基础设施、AI操作系统的谋篇布局,正在重构AI软硬件市场,再一次展示了强大的技术和产业实力。而我们已经严重落后。

但是,给予我们压力的不只是微软,我们还面临国外政府和一众高技术企业,从硬件到软件的全面围堵和降维打击。在此希望国内的企业和职能部门,多关注全球科技前沿动向,重视国内AI投融资市场和软硬件生态建设,多做点实事,不要在无谓的抄袭、炒作、弯道超车宣传中渡过。

与诸群共勉!

 

posted on 2024-05-28 19:00  laxcus  阅读(27)  评论(0编辑  收藏  举报