从Top500、天河一号和超级计算机引起的话题
天河一号是今年秋天中国超级计算机领域的大事件(凤凰新闻),我特意关注了一下超级计算机前500强排行榜,并摘抄前六名的数据如下:
# | System Name | Vendor | OS | Processor | Interconnect | Rmax (PFlops) | Rpeak (PFlops) | Cores | Installation Year |
1 | Jaguar | Cray Inc. | Linux | AMD Six Core 2600 MHz | Proprietary | 1.759 | 2.331 | 224162 | 2009 |
2 | Roadrunner | IBM | Linux | PowerXCell 8i 3200 MHz | Infiniband | 1.042 | 1.376 | 122400 | 2009 |
3 | Kraken XT5 | Cray Inc. | Linux | AMD Six Core 2600 MHz | Proprietary | 0.832 | 1.029 | 98928 | 2009 |
4 | JUGENE | IBM | CNK/SLES 9 | PowerPC 450 850 MHz | Proprietary | 0.826 | 1.003 | 294912 | 2009 |
5 | Tianhe-1 | NUDT | Linux | Intel EM64T Xeon 2530 MHz | Infinband DDR 4x | 0.563 | 1.206 | 71680 | 2009 |
6 | Pleiades | SGI | SLES10 + SGI ProPack 5 | Intel EM64T Xeon 3000 MHz | Infiniband | 0.544 | 0.673 | 56320 | 2009 |
可见天河一号 Rmax/Rpeak 的比率仅仅为 0.467, 效率是前10名中最低的, 如果猜的不差应该是因为它CPU和GPU混搭的结构导致的 (Intel Xeon processors and AMD GPUs,前10只有天河一号是这种架构) , 看来GPU走向通用高性能计算还要个三五年才能修成正果。另外国内新闻号称天河一号达到了PFlops(每秒10^15次浮点运算)量级,由上表可见是吹牛了,那只是理论峰值而已。
出版于2003年的“The Sourcebook of Parallel Computing” 预计第一个PFlops的超级计算机会在2009年出现,结果保守了,2008年下半年就有了,真所谓形式比人强啊! :)
“超级计算机前500强排行榜”一直以来都采用LINPACK程序做基准测试,前几天心血来潮也用LINPACK测了一下我新买的DELL Studio 14笔记本,RMax 是 16.7893 GFLOPS,还行,是排第一个Jaguar的大约10万分之一 (1/104,769),:) 而新闻上讲nVidia's Tesla C1060 GPU 单精度浮点运算可以达到 933 GFLOPS,看来未来的高性能计算中,GPU必然占越来越大的份额这一点是无需质疑的了。
posted on 2009-12-23 22:31 薛定谔的旺财(刘杨) 阅读(623) 评论(1) 编辑 收藏 举报
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 周边上新:园子的第一款马克杯温暖上架
· Open-Sora 2.0 重磅开源!
· 分享 3 个 .NET 开源的文件压缩处理库,助力快速实现文件压缩解压功能!
· Ollama——大语言模型本地部署的极速利器
· [AI/GPT/综述] AI Agent的设计模式综述