从Top500、天河一号和超级计算机引起的话题

天河一号是今年秋天中国超级计算机领域的大事件（凤凰新闻），我特意关注了一下超级计算机前500强排行榜，并摘抄前六名的数据如下：

#	System Name	Vendor	OS	Processor	Interconnect	Rmax (PFlops)	Rpeak (PFlops)	Cores	Installation Year
1	Jaguar	Cray Inc.	Linux	AMD Six Core 2600 MHz	Proprietary	1.759	2.331	224162	2009
2	Roadrunner	IBM	Linux	PowerXCell 8i 3200 MHz	Infiniband	1.042	1.376	122400	2009
3	Kraken XT5	Cray Inc.	Linux	AMD Six Core 2600 MHz	Proprietary	0.832	1.029	98928	2009
4	JUGENE	IBM	CNK/SLES 9	PowerPC 450 850 MHz	Proprietary	0.826	1.003	294912	2009
5	Tianhe-1	NUDT	Linux	Intel EM64T Xeon 2530 MHz	Infinband DDR 4x	0.563	1.206	71680	2009
6	Pleiades	SGI	SLES10 + SGI ProPack 5	Intel EM64T Xeon 3000 MHz	Infiniband	0.544	0.673	56320	2009

可见天河一号 Rmax/Rpeak 的比率仅仅为 0.467, 效率是前10名中最低的，如果猜的不差应该是因为它CPU和GPU混搭的结构导致的 (Intel Xeon processors and AMD GPUs，前10只有天河一号是这种架构) , 看来GPU走向通用高性能计算还要个三五年才能修成正果。另外国内新闻号称天河一号达到了PFlops（每秒10^15次浮点运算）量级，由上表可见是吹牛了，那只是理论峰值而已。

出版于2003年的“The Sourcebook of Parallel Computing” 预计第一个PFlops的超级计算机会在2009年出现，结果保守了，2008年下半年就有了，真所谓形式比人强啊！：）

“超级计算机前500强排行榜”一直以来都采用LINPACK程序做基准测试，前几天心血来潮也用LINPACK测了一下我新买的DELL Studio 14笔记本，RMax 是 16.7893 GFLOPS，还行，是排第一个Jaguar的大约10万分之一（1/104,769），：）而新闻上讲nVidia's Tesla C1060 GPU 单精度浮点运算可以达到 933 GFLOPS，看来未来的高性能计算中，GPU必然占越来越大的份额这一点是无需质疑的了。