计算机系统基础:计算机可靠性知识笔记
1、计算机可靠性介绍
计算机的硬件故障通常都是由于元器件失效造成的。元器件的可靠性分为三个阶段:开始阶段元器件处于不稳定阶段失效率比较高、第二阶段是正常工作阶段,失效率最低、第三阶段元器件开始老化,失效率就又开始提高。又称为“浴盆曲线”。
计算机的可靠性:从 开始运行t=0到某时刻t这个时间段内,可以正常运行的概率。
失效率:单位时间内失效的元件数与元件总数的比例。
可靠性与失效率的关系:
平均无故障时间(MTBF):两次故障之间正常工作的时间平均值。
公式:MTBF=1/λ
平均修复时间(MRBF):表示计算机的可维护性,指从故障发生到机器 修复的平均时间。
公式:A=MTBF/(MTBF+MTRF)
RAS:可靠性R、可用性A、可维修性S三个指标来衡量计算机系统。
2、计算机可靠性模型
2.1 串联系统
当一个系统有N个子系统组成,当所有的子系统都能正常工作才能正常工作。这种系统成为串联系统。
系统的可靠性R度量值=R1*R2*...Rn
失效率
λ=λ1+λ2+λ3+..+λn
2.2 并联系统
当一个系统有N个子系统组成,只要有一个子系统可以正常工作,系统就能正常工作,这样的系统成为并联系统。
系统的可靠性R度量值=1-(1-R1)*(1-R2)*(1-R3)...(1-Rn)
系统失效率公示
在并联系统中只有一个子系统是有效的,其余n-1个子系统成为冗余子系统。
2.3 N模冗余系统
N模冗余系统由N个(N=2n+1)相同的子系统和一个表决器组成,表决器把N个子系统中占多数相同结果的输出作为系统输出。
3、提高系统可靠性方法
1、提高元器件质量、改进加工工艺和工艺结构。
2、发展容错技术,使得计算机硬件有故障的情况下,仍然可以运行。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
· 没有源码,如何修改代码逻辑?
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· .NET10 - 预览版1新功能体验(一)
2019-10-03 设计模式:里氏替换原则
2019-10-03 设计模式:里氏替换原则
2018-10-03 MongoDB高可用集群搭建
2018-10-03 MongoDB高可用集群搭建
2018-10-03 MongoDB高可用集群搭建