p4计算机发展面临的挑战
教学目标:理解计算机性能评价 计算机面临的挑战 现代科学对计算机发展的影响
- 重点计算机发展面临的挑战
- 阅读《computer organization and design 》第一章4-8节
例子 讲解编译的好坏决定了程序的性能 一个机器具有ABC三类指令:序列1 A2 B1 C2 序列2 A4 B1 C1 问那个序列更快 序列1:5条指令 序列2:6条指令 (不一定指令少的执行速度就比指令多的快)
解:序列1有5条指令: 序列2有6条指令
序列1 :2 x 1 + 1 x 2 + 2 x 3 =10 (clock) 序列2: 4 x 1 + 1 x 2 + 1 x 3 = 9 (clock)
序列1的CPI = 10 / 5=2 序列2: CPI = 9 / 6 =1.5
(由此来看虽然序列1只用了五条指令但它的cpl比序列2执行时间要长 )
MIPS(Million Instructions Per Second ) 因为每条指令的执行时间不同,所以MIPS是一个平均值 MIPS可以作为衡量机器性能的好坏但并不是绝对的
- 原因不同机器的指令集不一样
- 程序由不同的指令混合而成
- 每一类指令使用的频道是动态变化的(不同机器执行效果也不一样)
- Peak MIPS(不实用的 ) 峰值 用MIPS表示性能有局限性
MFLOPS 机器影响因素比较大 取决运算器性能好坏(编译花费的时间 这部分时间并不是执行程序所耗费时间 所以会有偏差):有局限性
从不同的角度衡量不同的编译器也各有好坏
用一套基础的程序 在不同的机器上测试运行时间 如何评价机器综合性能?
例子:假设一个程序1在机器A上跑了1秒 机器B上跑10秒 程序2在机器A上跑了1000秒 在机器B上跑了100秒结论是?
程序1 A机器比B机器快10倍 从程序而来说机器B比机器A快了10倍 (两台机器到底那台好呢???)无法比较要用综合的值来判断
Total execution time(综合评价指标) 机器A两个程序总执行时间1001秒 机器B两个程序总执行时间110秒 机器B 要比机器A快9.1倍 用总执行时间考察机器好坏
计算机某方面改进,系统的性能是否成比例提高
受改进影响部分的执行时间
(Amdashl定律)改进后程序的执行时间 = 改进部分性能提高的倍数+未受改进影响部分的执行时间
(除非改进部件使用频率非常高 否则改进后的性能也不会成比例提高)
功耗问题
- 动态能量:CMOS主要的能量消耗动态消耗
- 晶体管翻转消耗的能量(0101001)
- 开关频率是时钟速率的函数
- 容器负债是晶体管扇出数和所用技术(决定导线和晶体管的函数)晶体管数越多负载就越大
减少芯片动态功耗方法
降低时钟频率
降低工作电压(5v降到1.5v) 但是降低工作电压到1.5伏下晶体管漏洞会更严重 大约30% - 40%芯片功耗是因为漏电引起的(静态功耗)
静态功耗:即使芯片内晶体管关闭,还有漏电流发生(晶体管不工作的情况下还会漏电)
- 静态功耗与电压和漏电流成正比
- 即使晶体管总是关闭,增加晶体管的塑料也会增加芯片功耗
功耗是限制处理器性能提高的主要因素
cpu实现技术难度大
从硅晶圆生产 到cpu封装测试完成 要经过40余道工序 涉及 微电子 精密仪器 高分子 光学.... 生产车间环境要求高
主频速度不断提高
集成度 复杂度不断提升
磁盘容量不断增加
微处理器体系结构
RISC与CISC的融合 面临两个物理极限
线宽走到了极限 不可能再小了 集成电路线宽接近原子直径
功耗 一个芯片集成二十多亿晶体管 功耗散热 只考提高主频和集成度提高性能很难
并行处理技术
- 多处理技术/ (采用多核 一个任务跑不下来分发给其他的核一起运算
) - 缓存技术(Cache Buffer)
- 分支预测技术
- 预取技术
- 超标量 超长指令只技术
- 总结就是从体系架构上想办法去优化
存储墙(Memory Wall)
处理器性能和存储性能存在巨大差距 计算机性能受限瓶颈上在访存计算机性能再快在数据的提炼慢 也会限制计算机性能提高
功耗墙(power wall)
主频高功耗也会高 功耗约束导致处理设计发生巨大改革从单核走向多核
并行任务处理 多核同时去完成类似任务
I/O (I/O 墙)
处理器的主频与I/O总线时钟频率存在巨大差异 I/O访问瓶颈
新型计算模型
光计算:用光来说互联网网络就是用光纤传输 光盘(光存储)现在只能进行模拟运算 如果突破数值计算有可能成为最快计算能力计算机
超导计算:主频可达到几百G 但是环境要在0下 没有继续发展说因为低温超导 一般不可能在这种环境 突破:常温超导
量子计算:128位量子计算机运算能力相当于天河一号
计算机应用趋势
并行化:气象预报 地震分析 数学建模 核模拟 这些对计算机的要求是没有上限的
微型化:芯片发展到现在越做越小 奔腾4芯片主频3ghz上 计算能力超过早期巨型机运算能力
网络化:网络革命IPV6和云计算
智能化和虚拟化
计算机仿生学 心理学.... 提高对图像 声音识别 面部识别 AI 物理环境模拟 虚拟主播
总结
针对指令集体及结构 提高计算机性能
提高时钟频率 (处理器中的流水线技术)
优化cpu中数据通路结构降低CPI
编译优化 减少指令条数或者复杂度
计算机面临挑战
存储墙 I/O墙 功耗墙