IBM系统工程师论“传统小型机”与“PC服务器”区别

我把在IBM UNIX WORLD上听到的IBM系统科技事业部System p系统工程师朱汉东先生的讲解搬来共享给大家。你从中找自己想了解的那部分吧，小型机说了很多年，PC服务器也是大家比较熟悉的，他们区别还是非常大的，UNIX 跟PC服务器的CPU不同，最简单台式机、笔记本用的CPU Intel的奔腾等非常清楚。但是提小型机处理器的名字都搞不清楚，现在他们用的CPU处理器都叫RISC处理器，常见的Intel包括AMD都是CISC处理器，那RISC跟CISC有什么区别，RISC是精简指令集计算机，CISC是复杂指令计算机。

RISC技术是IBM一个研究院在1974年发明的，IBM对计算机研究非常深入，在70年代就发现我们能够用20%的指令就可以完成80%的工作，并且这20%的指令都是非常简单和基础的指令。如果要另外完成20%工作需要非常复杂的指令，如果要在CPU里面实现指令，就导致CPU非常复杂，这个机器效率非常低，所以这就导致RISC技术的产生，RISC技术改写了计算机发展的历程。技术产生导致RISC System/6000的诞生。其实RISC技术，CPU是一种架构，这里面有非常多的型号，POWER5是比较典型的代表。IBM的POWER在RISC芯片里面典型代表，RISC有一个二次跟八次法则，它的效率非常高，功率非常低，可靠性非常高。CISC代表性是大家非常了解的x86，在至强这一代处理器是非常典型的，它的特点主频非常高，但是效率非常低，散热量非常大，曾经看到一个新闻，以后CPU可以煮鸡蛋都有可能。

RISC和CISC两种架构，设计的理念完全不同，所以中间的主频没有任何可比性，最重要看实际的性能。 IBM POWER6会出超过4个G的了。这里要谈一下大家非常关心安腾，这两天大家看到网上关于Intel 安腾2CPU终于出来了，现在谈双核已经不是先进技术了，IBM在2001年POWER4已经是业界第一款双核处理器。安腾是不是RISC，安腾不是 RISC架构，那它是什么架构，他有一个架构是EPIC，这是这两年刚刚诞生的，它是不是比RISC或CISC更先进的，它不是，它是两个不兼容的东西，它既不是一个更先进的技术，也不是有什么新的发明。跟CPU紧密相关的，64位、32位，这是我们经常说的x86，从8位到16位到 32位，这两年炒64位和双核非常多。这64位和32位有什么区别，为什么64位包括X86体系架构，如果32位物理内存只能访问4G，一次访问最大的物理内存，当然也可以通过其他的手段访问超过4G的内存，以前8086、8088要访问1M内存采用非常复杂的技术，在今天4G的内存对于很多应用显得太小了，尤其是数据库的操作，尤其是一些Java的应用服务器，Java非常吃内存的，4G内存非常小的，我这个机器配了1G内存，IBM跑System p系列服务器，如果我给你做一个方案，我们就要做一个配置，我们怎么配，怎么连，这程序是Java写的非常吃内存，所以在64位机器可以提供存储空间到 64位，64位的空间多大?也就是2的64次方，比2的32次方高太多，并且可以对64位数据进行数学和逻辑运算。

它表示数据的范围更大，它的精度更准，对于大型数据库支撑能力更强，以及对SMP扩展能力，一个存储器支持CPU个数更多了。其实64位计算从IBM，从p的角度谈得很少，因为我们在1997年、1998年谈得最多的，IBM RS/6000就发布了RS64处理器，是第一款64位处理器，从那时代开始我们CPU已经全部是64位，这中间经过POWER4，POWER4+， POWER5以及POWER5+，所以我们今天64位已经是非常成熟的技术。AMD64跟Intel EM64T是什么关系?在x86情况下的扩充，引进了64位的指令，在32位模式下不能算作典型的64位处理器，所以现在应该叫x86-64，而不是+ 64，真正64位处理器IBM POWER是真正64位处理器。包括EM64T是什么意思?是增强型的64位内存技术，仅仅是一个访问64位的内存，很多寄存器还是32位上操作，所以不是一个典型或完全意义的64位操作期，这跟我们说RISC64位完全两码事。

这里面看一下IBM POWER的处理器，今天谈的2001年POWER4是一个划时代的，2001年p系列，UNIX有绝对优势领先竞争友商，业界第一款双核机器，到今天很多人讨论真双核，假双核，其实真正第一款双核处理器IBM2001年p690到p615已经全部商品化了，我们客户享受双核技术已经很多了年。中间经过POWER4+引进动态逻辑分区，现在大家讨论做虚拟机，实际上IBM在 POWER4+已经到动态逻辑分区。到POWER5引进并发多线程，到POWER5+引进了四核处理器，引进了微分区，这都是我们非常先进的技术。并且我们POWER6是呼之欲出的产品，很快大家可以看到更先进的产品。

今天POWER5+产品上的CPU类型，一个是505、510到570年用的DCM 的类型，也就是双核模块处理器，一个里面有两个CPU。两个CPU在蓝颜色里面，粉色的是缓存。高端服务器是多核模块，在一个里面封装了八个POWER5 +的处理器，其实中间四个里面每个两个CPU，角上四个是三级缓存，每个里面有36M。在POWER5的时候，在中低端服务器，主要用双核处理器，505 到570用的效率非常高。

在高端服务器上，590、595扩展到32个、64个CPU，我们发展了更先进的MCM技术，用户对性价比要求非常高，IBM从去年开始发布了QCM(四核处理器)，把先进的封装工艺放到中低端服务器上，产生了四核处理器，今天505Q到560Q，今天的产品线凡是产品后面带Q都采用4颗处理器，既具有高端服务器的先进封装技术，又具有高端的性能，我们可以在同样的机器里面安装更多CPU个数，性价比更高一些，让中低端用户可以用到高端的先进性和优越性。

坦白来说关于内存方面翻一番质量，我们用处四的都是DDR533的内存，这已经是非常先进的内存了，PC服务器也有DDR533的内存，当然更多是SDR，还有更高端用DDR633和DDR667的内存，内存有两个关键，一个是内存的带宽，是DDR多少的主频，还有一个就是内存的可靠性是一个非常重要的话题，比如碰到Windows蓝屏那是典型的内存错误，p系列用的内存是 DDR533，这不是最好的也是差不多最好的内存。内存Chipkill什么意思?中间相当于一个内存桥，上面有一些空闲或多余的内存位置，比如内存条1G，实际上内存容量比1G要多，设计专门留出一部分做冗余，大家看到存的信息非常像读取硬盘，分配到四个ECC words里，如果有原因导致内存错误，就可以把错误的信息有可能恢复回来，这样避免非常多的内存错误。这是我们Chipkill内存，早在p系列诞生之前就已经发明了这个技术，我们把这个技术用在IBM的System p上面。

在PC服务器里面，非常多的主流内存保护技术，HP的ProLiant非常有代表性，它主要是Advanced ECC，还有Online Spare，ECC谈了很多年，就是错误检测的校验，只能修正一位的错误，如果两位错误修正不了，Chipkill可以检测和修复多位错误，到底可以修复多少错误，根据你错误发生的原因不同，有不同的级别，有能恢复和不能恢复的，这有一个第三方的研究报告，采用Chipkill内存以后可靠性比ECC提高 100倍。

前面谈了CPU和内存，你用一台小型机也不会拆开来看看，所以大家在使用的过程中经常涉及小型机的扩展性，这是我们实际应用非常重要的考虑因素，你的服务器要满足什么样的应用环境非常重要。扩展性两方面，一个水平扩展性，另一个垂直扩展性。水平扩展性是指一台服务器内部有多大的扩展空间，同一台服务器配多说CPU和内存，有多少卡，有多大连接能力，以及它的灵活性。p系列服务器，从最低端到最高端的595都有强大的扩展性，System p550Q，在4U的主机柜，这里面可以选择配两颗CPU或四颗CPU双核的，如果配双核可以配两颗或四颗的，也可以选择四颗处理器，或者8个，如果选择 4个有1.5/1.6不同的配置，所以一个4U的服务器，可以配出非常多的组合，所以扩展性非常好。垂直扩展性是整个产品线上下有多大的跨度，一台机器应用，现在国家经济发展非常快，我的应用在这上面部署，可能过了三年，业务的压力翻了一个数量级，需要更大的机型才能支持，p5机型，算POWER5的处理器，不算其他POWER PC和刀片服务器，最少配一个1.5GHz CPU，最大是63个2.3GHz处理器，最高tpmC可以做到400万。

PC服务器支持的可扩展性一般不超过4路CPU配置，只有IBM可以做到16个 CPU，因为x86体系结构只能允许4颗CPU，并且市场上PC服务器大部分是1路、2路以下的服务器占据市场绝大部分市场份额。如果你的应用将来增长非常大，选PC服务器迟早有一天不够用。

这里是看一下p系列产品，IBM p系列扩展有三，一种是向上扩展，一种水平向外扩展，还有一种是内部扩展。从最低端p5185到最高端590、595的64颗2.3GHz为MCM的处理器。这里面带Q的是四颗处理器。还有刀片服务器，工作站等产品线。向上扩展和向外扩展很好理解。什么叫内部扩展，买一个POWER5+处理器可以同时运行两个线程，有人说这和多线程没什么区别，但是这里面IBM并发多线程跟大家说的多线程有什么区别? 其实有一个非常大的区别，它是CPU自己实现的硬件多线程，假设一个505Q只有1U配了4个CPU，操作系统会列出8个CPU，有4个是物理CPU，每一个CPU有两个并发的多线程，所以系统认为是8个CPU的服务器。如果是64个CPU配满，操作系统会认为 128个CPU的服务器。所以这可以内置每一个POWER5的处理器。有了这技术可以无偿获得性能的提升，尤其是数据库，或者Java的服务器，根据实验室统计是可以免费获得40-45%之间的性能提升。

下面介绍一下扩展性，这是IBM System p5 560Q的机柜，后面有非常多的PCI扩展线，可以支持非常多的网络设备、存储设备等。这是内部这是CPU book，每一个里面就有4个CPU，如果装两个book就8个CPU。560Q是一个中档的服务器，它tpmC值可以满足相当多客户的要求，可以个 CPU，这里面配一个板子，再加一个CPU的book。如果八颗CPU服务器的560的tpmC值接近60万，很多中小型客户最大值也就这么多，但是考虑将来业务的扩展性，这机器要到16路，你再会再加一个，你的系统不会重装，也不需要重新部署。

前面谈的都是一些具体的物理上的东西，CPU、内存、主频、扩展性等，小型机和PC 服务器架构完全不同，它们比较CPU主频没什么可比性，更多的是看服务器的最终性能，这在大家平时的选型和使用过程当中有直接联系的。一般考虑性能并不等于主频，性能到底等于什么?性能最好用你跑的应用是在线交易，是Java服务器，还是网络服务器等，比如TPC-C测试，它是衡量服务器的综合性指标，不是只衡量CPU或者内存，是衡量机器CPU到内存到I/O体系的连接，可以说是一个全能的体现。

从TPC-C交易委员会官方网站上得到的结果，不分厂商还是单机，现在达到最好的结果前四名，这里面没有一台PC服务器进入这个排名，其实不光没有进入前四名，实际上离前十名远得很。我们看在已经公布的47次测试结果，有45次在10万以下，只有两次一个是11万，一个是14万。如果你的业务tpmC要超过10万，比如校园一卡通的项目，tpmC值都奔着2、30万去了，所以PC服务器根本做不到。从性能角度来看，它们的差别非常大。

回到最早的UNIX和Windows操作系统不同，PC服务系更多跑 Windows，也有用户跑Linux，如果跑Linux非常接近UNIX，小型机都是跑UNIX，前面提到对小型机厂商CPU型号不太了解，可能觉得 UNIX操作系统的名字也怪怪的，UNIX AIX是我们小型机操作系统的名字。UNIX主要是多用户，多任务的网络操作系统，而Windows主要面向个人用户的操作系统，从开始诞生到现在发展就是完全不同的，UNIX安全性非常高，系统管理性强，UNIX主要跑后台服务，以及中间件或数据库等。

有人觉得奇怪UNIX那么难用，都是命令行怎么还说是管理功能很强的操作系统，当你真正要管理一个后台服务器的时候，你发现命令行非常简单、非常直接。反过来Windows操作系统的安全性差，经常会中病毒，甚至把整个机器废掉的可能性都有，它的漏洞和Bug太多。但是Windows也有优点就是界面美观，易用性强，以及游戏软件和办公软件丰富。小型机里面 UNIX操作系统非常多，比如IBM的AIX等大家平时接触的更少，Gartner做了一个预测，2008年以后，操作系统仅存在三种AIX、Linux 和Windows，也就是在小型机UNIX领域，AIX是代表性的环境，其他的友商UNIX操作系统的份额将越来越少。今天在AIX上的投入是有保证的。

AIX操作系统是一个稳定性、扩展性、操作性强的UNIX操作系统，它的安全性非常好，AIX带一个L是什么意思，和Linux有非常好的亲和性，亲和到什么程度，一种在AIX上面可以跑绝大部分Linux的应用，比如不喜欢AIX的环境和界面，喜欢Linux的KDE的界面。

总结一下，回答最开始的问题，我们给大家客观比较一下，UNIX和PC服务器有什么不同，UNIX小型机性能好、安全性高，扩展性强，运行关键性服务，是企业级客户的选择。PC服务器性能低，安全性较差，扩展性受局限，有大量廉价的兼容配件，并且便宜，界面也好，个人使用方便。当你考虑小型机的时候，IBM p系列有非常大的优势，相对友商的UNIX的小型机，我们有POWER虚拟化技术，以及POWER5的强大性能，还有RAS功能，内存可靠性只是其中一方面，以及对POWER的长久承诺，这是一个关键的技术，IBM POWER是IBM核心技术，IBM对这个架构有非常长久的承诺，不像其他厂商像RISC芯片前途已经十分渺茫。UNIX和Linux有很好的结合性，在我们产品有非常多的选择，包括最低端一直到最高端的，从价格上从5万不到一直到几十万、几百万的服务器都有，有非常大的灵活性供大家选择。

posted @ 2010-09-13 17:37 Mashimaro 阅读(786) 评论(0) 编辑收藏举报

流氓兔の家

IBM系统工程师论“传统小型机”与“PC服务器”区别

公告