可靠性测试-故障模型库

  • 什么是可靠性测试:

    系统的可靠性是指在发生故障的情况下,系统的数据部丢失,故障恢复后系统能够正常工作。可靠性测试是有针对性的对系统注入特定的故障的一种测试活动。

  • 什么是故障模型库

    故障模型库是将故障整理分类后的故障集合。

  • 故障模型库分类
    1. 操作系统

按网络资源分类:创建大量socket连接(tcp连接)、配置ip地址(占用指定的ip)、删除指定网卡ip地址

按系统操作分类:操作系统吊死、关闭主机(poweroff -f)、修改用户密码、重启主机(shutdown -r)

按系统资源分类:部分cpu核心失效、限制用户资源(cpu、句柄、进程,修改/etc/security/limits.conf)消耗jvm、消耗cpu、消耗内存、消耗系统io、消耗系统进程数、消耗句柄

 

      2.网络QoS

         按网卡分类:禁用网卡、删除网卡驱动、网卡启停断续、修改网卡工作模式(ethtool)

         按网络服务分类:FTP服务吊死、停止网络服务(rcnetwork stop命令停止所有网卡服务)

         按网络连接分类:TCP端口占用、TCP连接吊死、网络单通(iptables)、网络风暴、网络闪断(iptables         反复丢掉数据报文来模拟)、限制网络带宽(tc)、消耗网络带宽

         按网络数据分类:数据报文错误(tc)、数据报文丢失(iptables)、数据报文丢失(tc)、数据报文乱         序(tc)、数据报文延迟抖动(tc)、数据报文重复(tc)

      3.文件系统

         按文件系统分类:抢占文件系统空间(dd)、修改文件系统权限、损坏文件、修改目录

      4.系统进程

         按进程操作分类:挂起进程、挂起线程、结束进程、结束线程、进程启动、进程死循环

         按进程状态分类:进程转为D状态、进程转为Z状态

      5.磁盘

         磁盘系统故障类型主要有:DF(device fault)全F坏道,不提供读写

                     UNC坏道,读出错,写可修复,此故障发生最为频繁

                     WP(write projected)写保护,写出错,读正常

                     ICRC 链路传输出现误码,持续出现的话会导致I/O阻塞

                     DS(disk slow)慢盘

  这些都是平时项目过程中测试过的可靠性场景,这些故障有些可以通过shell命令模拟,有些需要特定的工具(磁盘就需要rdisk.ko工具),系统进程的操作都是通过内部开发的一个工具实现的,可靠性测试深不可测啊 ,需要在这条路上继续摸索。

---------------------------------------------------------------------------------------------------------------

如需转载,请注明出处,多谢!

         

posted on 2014-09-09 14:55  暗流爱  阅读(1004)  评论(0编辑  收藏  举报