p4计算机发展面临的挑战

教学目标:理解计算机性能评价 计算机面临的挑战 现代科学对计算机发展的影响

  • 重点计算机发展面临的挑战 
  • 阅读《computer organization and design 》第一章4-8节

例子 讲解编译的好坏决定了程序的性能 一个机器具有ABC三类指令:序列1   A2 B1 C2    序列2 A4 B1 C1 问那个序列更快 序列1:5条指令 序列2:6条指令 (不一定指令少的执行速度就比指令多的快)

解:序列1有5条指令: 序列2有6条指令

序列1 :2 x 1  + 1 x 2 + 2 x 3 =10 (clock)     序列2: 4 x 1 + 1 x 2 + 1 x 3 = 9 (clock)

序列1的CPI = 10 / 5=2                                       序列2: CPI = 9 / 6 =1.5 


(由此来看虽然序列1只用了五条指令但它的cpl比序列2执行时间要长 )

MIPS(Million Instructions Per Second ) 因为每条指令的执行时间不同,所以MIPS是一个平均值 MIPS可以作为衡量机器性能的好坏但并不是绝对的

  • 原因不同机器的指令集不一样 
  • 程序由不同的指令混合而成
  • 每一类指令使用的频道是动态变化的(不同机器执行效果也不一样)
  • Peak MIPS(不实用的 ) 峰值 用MIPS表示性能有局限性

MFLOPS 机器影响因素比较大 取决运算器性能好坏(编译花费的时间 这部分时间并不是执行程序所耗费时间 所以会有偏差):有局限性 
从不同的角度衡量不同的编译器也各有好坏

用一套基础的程序 在不同的机器上测试运行时间 如何评价机器综合性能?

例子:假设一个程序1在机器A上跑了1秒 机器B上跑10秒 程序2在机器A上跑了1000秒 在机器B上跑了100秒结论是?

程序1 A机器比B机器快10倍 从程序而来说机器B比机器A快了10倍 (两台机器到底那台好呢???)无法比较要用综合的值来判断

Total execution time(综合评价指标) 机器A两个程序总执行时间1001秒 机器B两个程序总执行时间110秒 机器B 要比机器A快9.1倍 用总执行时间考察机器好坏

计算机某方面改进,系统的性能是否成比例提高

                                                                                        受改进影响部分的执行时间

(Amdashl定律)改进后程序的执行时间 = 改进部分性能提高的倍数+未受改进影响部分的执行时间

(除非改进部件使用频率非常高 否则改进后的性能也不会成比例提高)

功耗问题

  • 动态能量:CMOS主要的能量消耗动态消耗
  • 晶体管翻转消耗的能量(0101001)
  • 开关频率是时钟速率的函数
  • 容器负债是晶体管扇出数和所用技术(决定导线和晶体管的函数)晶体管数越多负载就越大

减少芯片动态功耗方法

降低时钟频率

降低工作电压(5v降到1.5v) 但是降低工作电压到1.5伏下晶体管漏洞会更严重 大约30% - 40%芯片功耗是因为漏电引起的(静态功耗)

 静态功耗:即使芯片内晶体管关闭,还有漏电流发生(晶体管不工作的情况下还会漏电)

  • 静态功耗与电压和漏电流成正比
  • 即使晶体管总是关闭,增加晶体管的塑料也会增加芯片功耗

功耗是限制处理器性能提高的主要因素

cpu实现技术难度大

从硅晶圆生产 到cpu封装测试完成 要经过40余道工序 涉及 微电子 精密仪器 高分子 光学.... 生产车间环境要求高

 

主频速度不断提高

集成度 复杂度不断提升

磁盘容量不断增加

 

微处理器体系结构

RISC与CISC的融合 面临两个物理极限 

线宽走到了极限 不可能再小了 集成电路线宽接近原子直径

功耗 一个芯片集成二十多亿晶体管 功耗散热 只考提高主频和集成度提高性能很难

并行处理技术

 

  • 多处理技术/ (采用多核 一个任务跑不下来分发给其他的核一起运算
  • 缓存技术(Cache Buffer)
  • 分支预测技术
  • 预取技术
  • 超标量 超长指令只技术
  • 总结就是从体系架构上想办法去优化

存储墙(Memory Wall)

处理器性能和存储性能存在巨大差距 计算机性能受限瓶颈上在访存计算机性能再快在数据的提炼慢 也会限制计算机性能提高

功耗墙(power wall)

主频高功耗也会高 功耗约束导致处理设计发生巨大改革从单核走向多核 

并行任务处理 多核同时去完成类似任务 

I/O (I/O 墙)

处理器的主频与I/O总线时钟频率存在巨大差异 I/O访问瓶颈

 

新型计算模型

光计算:用光来说互联网网络就是用光纤传输 光盘(光存储)现在只能进行模拟运算 如果突破数值计算有可能成为最快计算能力计算机

超导计算:主频可达到几百G 但是环境要在0下 没有继续发展说因为低温超导 一般不可能在这种环境 突破:常温超导

量子计算:128位量子计算机运算能力相当于天河一号

计算机应用趋势

并行化:气象预报 地震分析 数学建模 核模拟 这些对计算机的要求是没有上限的

微型化:芯片发展到现在越做越小 奔腾4芯片主频3ghz上 计算能力超过早期巨型机运算能力

网络化:网络革命IPV6和云计算

智能化和虚拟化

计算机仿生学 心理学.... 提高对图像 声音识别 面部识别 AI 物理环境模拟 虚拟主播 

 

总结

针对指令集体及结构 提高计算机性能

提高时钟频率 (处理器中的流水线技术)

优化cpu中数据通路结构降低CPI 

编译优化 减少指令条数或者复杂度

计算机面临挑战

存储墙 I/O墙 功耗墙

 

posted on 2022-01-11 11:35  故事少了完结  阅读(256)  评论(0)    收藏  举报

导航