测试计划及测试用例

1.测试用例的概念和作用

1.测试用例的概念和作用

1.1. 引言

对一个测试工程师来说,测试用例的设计编写是一项必须掌握的能力，但有效的设计和熟练的编写测试用例却是一个十分复杂的技术，测试用例编写者不仅要掌握软件测试技术和流程，而且要对整个软件不管从业务，还是对软件的设计、程序模块的结构、功能规格说明等都要有透彻的理解。
测试的设计方法不是单独存在的，具体到每个测试项目里都有很多种方法，每种类型都有各自的特点。

1.2测试用例的定义

1.1.1 什么是测试用例？

测试用例是执行测试的依据，把测试系统的操作步骤用文档的形式描述出来

（1）测试用例是为达到最佳的测试效果或高效的揭露隐藏的错误，而精心设计的少量测试数据，包括测试输入、执行条件和预期的结果，实际结果
（2）测试用例是执行的最小实体。 
（3）测试用例是测试工作的指导，是软件测试的必须遵守的准则，更是软件测试质量稳定的根本保障

1.1.2.测试用例特征

1、有效性：测试用例的能够被使用，且被不同人员使用测试结果一致
2、可重复性：良好的测试用例具有重复使用的功能。(回归测试)
3、易组织性：好的测试用例会分门别类地提供给测试人员参考和使用(功能、性能、易用分类编号)
4、清晰、简洁：好的测试用例描述清晰，每一步都应有相应的作用，有很强的的针对性，不应出现一些无用的操作步骤。
5、可维护性：由于软件开发过程中需求变更等原因的影响，常常对测试用例进行修改、增加、删除等，以便测试用符合相应测试要求。

1.3编写测试用例的好处

1.1.3测试用例的作用

在开始实施测试之前设计好测试用例，可以避免盲目测试并提高测试效率。
测试用例的使用令软件测试的实施重点突出、目的明确。
在软件版本更新后只需修正少部分的测试用例便可展开测试工作，降低工作强度、缩短项目周期。
检验软件是否满足客户需求、体现一个测试人员的工作量、展现测试用例的设计思路

1.4测试用例的4个特性

代表性：能够代表并覆盖各种合理的和不合理、合法的和不合法的、边界的和越界的以及极限的输入数据、操作等。
针对性：对程序中的可能存在的错误有针对性地测试
可判定性：测试执行结果的正确性是可判定的，每一个测试用例都应有相应的期望结果
可重现性：对同样的测试用例，系统的执行结果应当是相同的。

1.5测试用例通常包括一下几个组成元素

用例编号、测试模块、用例标题、用例级别、测试环境、测试输入、执行操作、预期结果,实际结果….

1.6测试用例示例

2.编写测试用例的基本方法

2.1等价划分法

应用场景：多用于输入框

1.1.4概念

有效，无效
等价类划分是指分步骤地把海量（无限）的测试用例集减得很小，但过程同样有效。
等价类 ：何为等价类，某个输入域的集合，在这个集合中每个输入条件都是等效的。
一般可分为有效等价类和无效等价类
 
比如：一个青少年考试的分数（备注13-17岁为青少年）
假设青少年年龄为x,13<=x<=17,数学成绩为y：0<=y<=100  
那么年龄按照等价类划分可分为x<13,13<=x<=17,x>17,有效等价类是13<=x<=17，无效等价类是x<13，x>17
数学成绩按照等价类划分可分为y<0,0<=y<=100,y>100,有效等价类是0<=y<=100，无效等价类是y<0，y>100

1.1.5示例

1.1.5.示例
 	计算两个1～100之间整数的和。
    如果要进行完全测试，一共要设计多少个测试用例呢？
    加数1有1～100共计100个取值，加数2也有1～100共计100个取值，所以他们之间的组合就有100*100=10000种组合可能，但这只是测试了正常范围内的取值。如果用户输入的数据不在1～100之间呢，穷举测试肯定不可能的。由此引入了等价类划分思想。
等价类划分为：
有效等价类：指符合《需求规格说明书》，输入合理的数据集合
无效等价类：指不符合《需求规格说明书》，输入不合理的数据集合

我们将输入域分成了一个有效等价类（1～100）和两个无效等价类（<1,>100），并为每一个等价类进行编号，然后我们就可以从每一个等价类中选取一个代表性的数据来测试，设计如下表所示的测试用

1.1.6练习案例

划分等价类并编号,下表为等价类划分的结果

2.2边界值法

一般边界值分析是因为程序开发循环体时的取数可能会因为<,<=搞错。
 	比如下面代码
　　for(int i = 0;i <100; i ++)
{
　　int j = i+1;
　　System.out.println("循环第“+j+"次")//循环地做某件事情
}
　　这里的程序是循环了100次，所以会做100次;
　　如果程序员不小心，把i <100写成i <= 100，则多循环添加一次，这时候边界值检查是一个很好的测试方法。
比如：在一个系统中，填写一个多少岁的青少年考了多少分（假设成年人年龄为x,13<=x<=17,数学成绩为y：0<=y<=100
根据上面的等价类划分法我们可知，年龄的有效等价类是13<=x<=17，所以边界值就是12， 18
数学成绩的,有效等价类是0<=y<=100，所以边界值就是-1，0，100，101

对数据进行软件测试，就是在检查用户输入的信息、返回的结果以及中间计算结果是否正确。即使最简单的程序要处理的数据量也可能极大，使这些数据得以测试的技巧是，根据一些关键的原则进行等价类的划分，以合理减少测试用例，这些关键的原则是：边界条件，次边界条件、空值和无效数据。

1.1.7确定边界值法（）

选取正好等于、刚刚大于或刚刚小于边界值作为测试数据

输入要求是1 ～ 100之间的整数，因此自然产生了1和100两个边界，我们在设计测试用例的时，要重点考虑这两个边界问题。
[1 100]  上点1 ，100   离点   0  101所属
  (1,100)  上点 2，99    离点  1  ，100
  (1,100]   上点 2，100    离点 1 ，101

注明:边界值不是从每个等价类中挑一个作为代表，而是把每个等价类的边界都进行测试。

2.3因果图法

1.1.8概念

因果图法比较适合输条件比较多的情况，测试所有的输入条件的排列组合。所谓的原因就是输入，所谓的结果就是输出

1.1.9因果图基本图形符号

恒等：若原因出现，则结果出现；若原因不出现，则结果不出现。
非（～）：若原因出现，则结果不出现；若原因不出现，则结果出现。
或（∨）：若几个原因中有一个出现，则结果出现；若几个原因都不出现，则结果不出现。
与（∧）：若几个原因都出现，结果才出现；若其中有一个原因不出现，则结果不出现。

1.1.9因果图的约束符号

E（互斥）：表示两个原因不会同时成立，两个中最多有一个可能成立
I（包含）：表示三个原因中至少有一个必须成立
O（惟一）：表示两个原因中必须有一个，且仅有一个成立
R（要求）：表示两个原因，a出现时，b也必须出现，a出现时，b不可能不出现
M（屏蔽）：两个结果，a为1时，b必须是0，当a为0时，b值不定

1.1.9因果图测试用例

例如：有一个处理单价为2.5元的盒装饮料的自动售货机软件。若投入2.5元硬币，按“可乐”、“啤酒”、或“奶茶”按钮，相应的饮料就送出来。若投入的是3元硬币，在送出饮料的同时退还5角硬币。

分析这一段说明，我们可列出原因和结果
原因(输入)：
投入2.5元硬币；
投入3元；
按“可乐”按钮；
按“啤酒”按钮；
按“奶茶”按钮。
中间状态：  ① 已投币；②已按钮
结果(输出)：
退还5角硬币；
送出“可乐”饮料；
送出“啤酒”饮料；
送出“奶茶”饮料；

2.4场景法

1.1.2测试用例设计的理想

现在的软件几乎都是用事件触发来控制流程的，事件触发时的情景便形成了场景，而同一事件不同的触发顺序和处理结果就形成事件流。这种在软件设计方面的思想也可以引入到软件测试中，可以比较生动地描绘出事件触发时的情景，有利于测试设计者设计测试用例，同时使测试用例更容易理解和执行。
 用例场景是通过描述流经用例的路径来确定的过程，
 这个流经过程要从用例开始到结束遍历其中所有基本流和备选流。

1.1.13银行案例ATM：

对于这7个场景中的每一个场景都需要确定测试用例。可以采用矩阵或决策表来确定和管理测试用例。
  从确定执行用例场景所需的数据元素入手构建矩阵。然后，对于每个场景，至少要确定包含执行场景所需的适当条件的测试用例。
	下面显示了一种通用格式，其中各行代表各个测试用例，而各列则代表测试用例的信息。
	本示例中，对于每个测试用例，存在一个测试用例ID、条件（或说明）、测试用例中涉及的所有数据元素（作为输入或已经存在于数据库中）以及预期结果。

2.5错误推测法

错误猜测法是测试经验丰富的人喜欢使用的一种测试用例设计方法。
一般这种方法是基于经验和直觉推测程序中可能发送的各种错误，有针对性地设计。只能作为一种补充。

例如，测试手机终端的通话功能，可以设计各种通话失败的情况来补充测试用 例：
1) 无SIM 卡插入时进行呼出（非紧急呼叫）
2) 插入已欠费SIM卡进行呼出
3) 射频器件损坏或无信号区域插入有效SIM卡呼出
4) 网络正常，插入有效SIM卡，呼出无效号码（如1、888、333333、不输入任何号码等）
5) 网络正常，插入有效SIM卡，使用“快速拨号”功能呼出设置无效号码的数字
 
技巧：最重要的是要思考和分析测试对象的各个方面，多参考以前发现的bug的相关数据，总结的经验，个人多考虑异常的情况、反面的情况、特殊的输入，以一个攻击者的态度对待程序，就能设计出比较完善的测试用例来。

2.6正交表法

正交实验法就是利用排列整齐的表 -正交表来对试验进行整体设计、综合比较、统计分析，实现通过少数的实验次数找到较好的生产条件，以达到最高生产工艺效果，这种试验设计法是从大量的试验点中挑选适量的具有代表性的点，利用已经造好的表格—正交表来安排试验并进行数据分析的方法。正交表能够在因素变化范围内均衡抽样，使每次试验都具有较强的代表性，由于正交表具备均衡分散的特点，保证了全面实验的某些要求，这些试验往往能够较好或更好的达到实验的目的。正交实验设计包括两部分内容：第一，是怎样安排实验；第二，是怎样分析实验结果。

应用场景：在一个界面中有多个控件，每个控件有多个取值，控件之间可以相互组合，不可能（也没有必要）为每一种组合编写一条用例，如何使用最少最优的组合进行测试。——正交排列法

判定表，因果图也是考虑控件组合，但是组合数量较少（一般不会超过20中）
公式：Ln(mk)
k是表的列数，表示控件的个数（因数个数）
m是每个控件的取值个数（因数水平）
n是表的行数，也就是需要测试组合的次数
正交表查询地址：https://www.york.ac.uk/depts/maths/tables/orthogonal.htm
正交排列法：http://support.sas.com/techsup/technote/ts723_Designs.txt

正交表测试用例设计方法的特点是什么？
1、用最少的实验覆盖最多的操作，测试用例设计很少，效率高，但是很复杂；
2、对于基本的验证功能，以及二次集成引起的缺陷，一般都能找出来；但是更深的缺陷，更复杂的缺陷，还是无能为力的；
3、体的环境下，正交表一般都很难做的。大多数，只在系统测试的时候使用此方法。

3.测试用例的评审和变更

测试用例并非一成不变。如果软件修改之后发生变化，或者需求发生变更，那么测试用例便不再满足当前版本软件的测试需求，由此需要进行修改和变更操作。

首先要清楚内部评审的定义，是测试组内部的评审，还是项目组内部的评审。评审的定义不同，内容也不会相同。 
如果是测试组内部的评审，应该着重于：
1.测试用例本身的描述是否清晰；
2.是否考虑到测试用例的执行效率.往往测试用例中步骤不断重复执行，验证点却不同，而且测试设计的冗(rong)余性，都造成了效率的低下；
3.是否针对需求文档，测试用例是否覆盖了所有的软件需求；
4.是否完全遵守了软件需求的规定。这并不一定的，因为即使再严格的评审，也会出现错误，应具体情况具体对待。 

如果是项目组内部的评审，也就需要评审委员会来做了，角度不同，评审的标准也不同。比如收集客户需求的人员注重你的业务逻辑是否正确，分析软件需求规格的人注重你的用例是否跟规格要求一致，开发负责人会注重你的用例中对程序的要求是否合理。 


测试用例的评审能够使用例的结构更清晰，覆盖的用户场景更全面对于测试工程师来说也是一个快速提高用例设计能力的过程。 
1、需要评审的原因 
测试用例是软件测试的准则，但它并不是一经编制完成就成为准则。由于用例开发人员的设计经验和对需求理解的深度各不相同，所以用例的质量难免会有不同程度的差异。 
 
2、进行评审的时机 
一般会有两个时间点。第一，是在用例的初步设计完成之后进行评审第二是在整个详细用例全部完成之后进行二次评审。如果项目时间比较紧张，尽可能保证对用例设计进行评审，提前发现其中的不足之处。 


3、参与评审人员 
这里会分为多个级别进行评审。 
1)部门评审，测试部门全体成员参与的评审。 
2)公司评审，这里包括了项目经理、需求分析人员、架构设计人员、开发人员和测试人员。 
3)客户评审，包括了客户方的开发人员和测试人员。这种情况在外包公司比较常见。 

4、评审内容 
评审的内容有以下几个方面 
1)用例设计的结构安排是否清晰、合理，是否利于高效对需求进行覆盖。 
2)优先极安排是否合理。 
3)是否覆盖测试需求上的所有功能点。 
4)用例是否具有很好可执行性。例如用例的前提条件、执行步骤、输入数据和期待结果是否清晰、正确期待结果是否有明显的验证方法。
5)是否已经删除了冗余的用例。 
6)是否包含充分的反面测试用例。充分的定义，如果在这里使用2&8法则，那就是4倍于正面用例的数量，毕竟一个健壮的软件，其中80%的代码都是在"保护"20%的功能实现。 
7)是否从用户层面来设计用户使用场景和使用流程的测试用例。 
8)是否简洁，复用性强。例如，可将重复度高的步骤或过程抽取出来定义为一些可复用标准步骤。 

5、评审的方式 
1)召开评审会议。与会者在设计人员讲解之后给出意见和建议，同时进行详细的评审记录。 
2)通用邮件与相关人员沟通 
3)通用IM(办公通讯)工具直接与相关人员交流 
方式只是手段，得到其它人员对于用例的反馈信息才是目的。 
无论采用那种方式，都应该在沟通之前把用例设计的相关文档发送给对方进行前期的学习和了解，以节省沟通成本。 

6、评审结束标准 
在评审活动中会收集到用例的反馈信息，在此基础上进行用例更新，直到通过评审。

测试计划

--一场对所有软件BUG展开的歼灭战
确定测试范围
制定测试策略
测试资源安排
-------测试时间、工作量、人员
-------由于每个人的思维存在局限性，每项测试最后安排不少于2个人测试，以便交叉测试
进度安排
-------最好能预留一段缓冲时间，用于应对计划的变更，以及让测试员有时间完善和补充测试用例
风险及对策
-------可考虑建立后备机制

5.软件缺陷和软件缺陷种类

软件缺陷，常常又被叫做Bug，从产品内部看，缺陷是软件产品开发或维护过程中存在的错误、毛病等各种问题；从产品外部看，缺陷是系统所需要实现的某种功能的失效或违背。

格蕾丝·赫柏（Grace Murray Hopper），是一位为美国海军工作的电脑专家，也是最早将人类语言融入到电脑程序的人之一。而代表电脑程序出错的“bug” 这名字，正是由赫柏所取的。1947年9月9日，赫柏对Harvard Mark II设置好17000个继电器进行编程后，技术人员正在进行整机运行时，它突然停止了工作。于是他们爬上去找原因，发现这台巨大的计算机内部一组继电器的触点之间有一只飞蛾，这显然是由于飞蛾受光和热的吸引，飞到了触点上，然后被高电压击死。所以在报告中，赫柏用胶条贴上飞蛾，并把“bug”来表示“一个在电脑程序里的错误”，“Bug”这个说法一直沿用到今天。

5.2软件缺陷的种类划分

按照软件缺陷的产生原因，可以将其划分为不同的缺陷类别：
　　1、功能不正常
　　简单地说就是所应提供的功能，在使用上并不符合产品设计规格说明书中规定的要求，或是根本无法使用。这个错误常常会发生在测试过程的初期和中期，有许多在设计规格说明书中规定的功能无法运行，或是运行结果达不到预期设计。最明显的例子就是在用户接口上所提供的选项及动作，使用者操作后毫无反应。

　　2、软件在使用上感觉不方便

　　只要是不知如何使用或难以使用的软件，在产品设计上一定是出了问题。所谓好用的软件，就是使用上尽量方便，使用户易于操作。如微软推出的软件，在用户接口及使用操作上确实是下了一番功夫。有许多软件公司推出的软件产品，在彼此的接口上完全不同，这样其实只会增加使用者的学习难度，另一方面也凸显了这些软件公司的集成能力不足。

　　3、软件的结构未做良好规划

　　这里主要指软件是以自顶向下方式开发，还是以自底向上方式开发。如果是以自顶向下的结构或方法开发的软件，在功能的规划及组织上比较完整，相反以自底向上的组合式方法开发处的软件则功能较为分散，容易出现缺陷。

　　4、提供的功能不充分

　　这个问题与功能不正常不同，这里指的是软件提供的功能在运作上正常，但对于使用者而言却不完整。即使软件的功能运作结果符合设计规格的要求，系统测试人员在测试结果的判断上，也必须从使用者的角度进行思考，这就是所谓的“从用户体验出发”。

　　5、与软件操作者的互动不良

　　一个好的软件必须与操作者之间可以实现正常互动。在操作者使用软件的过程中，软件必须很好地响应。例如在浏览网页时，如果操作者在某一网页填写信息，但是输入的信息不足或有误。当点击“确定”按钮后，网页此时提示操作者输入信息有误，却并未指出错误的哪里，操作者只好回到上一页重新填写，或直接放弃离开。这个问题就是典型的在软件对操作互动方面未做完整的设计。

　　6、使用性能不佳

　　被测软件功能正常，但使用性能不佳，这也是一个问题。此类缺陷通常是由于开发人员采用了错误的解决方案，或使用了不恰当的算法导致的，在实际测试中有很多缺陷都是因为采用了错误的解决方法，需要加以注意！

　　7、为做好错误处理

　　软件除了避免出错之外，还要做好错误处理，许多软件之所以会产生错误，就是因为程序本身对于错误和异常处理的缺失。例如被测软件读取外部的信息文件并已做了一些分类整理，但刚好所读取的外部信息文件内容已被损毁。当程序读取这个损毁的信息文件时，程序发现问题，此时操作系统不知该如何处理这个情况，为保护系统自身只好中断程序。由此可见设立错误和异常处理机制的重要性！

　　8、边界错误

缓冲区溢出问题在这几年已成为网络攻击的常用方式，而这个缺陷就属于边界错误的一种。简单来说，程序本身无法处理超越边界所导致的错误。而这个问题，除了编程语言所提供的函数有问题之外，很多情况下是由于开发人员在声明变量或使用边界范围时不小心引起的。
9、计算错误

　　只要是计算机程序，就必定包括数学计算。软件之所以会出现计算错误，大部分出错的原因是由于采用了错误的数学运算工时或未将累加器初始化为0.

　　10、使用一段时间所产生的错误

　　这类问题是程序开始运行正常，但运行一段时间后却出现了故障。最典型的例子就是数据库的查找功能。某些软件在刚开始使用时，所提供的信息查找功能运作良好，但在使用一段时间后发现，进行信息查找所需的时间越来越长。经分析查明，程序采用的信息查找方式是顺序查找，随着数据库信息的增加，查找时间自然会变长。这就需要改变解决方案了！

　　11、控制流程的错误

　　控制流程的好坏，在于开发人员对软件开发的态度及程序设计是否严谨。软件在状态间的转变是否合理，要依据业务流程进行控制。例如，用软件安装程序解释这类问题最方便直观。用户在进行软件安装时，输入用户名和一些信息后，软件就直接进行了安装，未提示用户变更安装路径、目的地等。这就是软件控制流程不完整导致的错误问题。

　　12、在大数据量压力下所产生的错误

　　程序在处于大数据量状态下运行出现问题，就属于这类软件错误。大数据量压力测试对于Server级的软件是必须进行的一项测试，因为服务器级的软件对稳定性的要求远比其它软件要高。通常连续的大数据量压力测试是必须实施的，如让程序处理超过10万笔数据信息，再来观察程序运行的结果。

　　13、在不同硬件环境下产生的错误

　　这类问题的产生与硬件环境的不同相关。如果软件与硬件设备有直接关系，这样的问题就是数量相当多。例如有些软件在特殊品牌的服务器上运行就会出错，这是由于不同的Server内部硬件了不同的处理机制。

　　14、版本控制不良导致的错误

　　出现这样的问题属于项目管理的疏忽，当然测试人员未能尽忠职守也是原因之一。例如一个软件被反映有安全上的漏洞，后来软件公司也很快将修复版本提供给用户。但在一年后他们推出新版本时，却忘记将这个已解决的bug-fix加入到新版本中。所以对用户来说，原本的问题已经解决了，但想不到新版本升级之后，问题又出现了。这就是由于版本控制问题，导致不同基线的merge出现误差，使得产品质量也出现了偏差。

　　15、软件文档的错误

　　最后这类缺陷是软件文档错误。这里所提及的错误，除了软件所附带的使用手册、说明文档及其它相关的软件文档内容错误之外，还包括软件使用接口上的错误文字和错误用语、产品需求设计PD、UI Spec等的错误。错误的软件文档内容除了降低产品质量外，最主要的问题是会误导用户！

5.3软件缺陷的属性

1.1.14按照严重程度划分

一般分为5个等级:
系统崩溃，严重，一般，次要，建议

1.1.15按优先级分:

修正优先级：高，中，低

1.1.16bug定级示例

1级，系统崩溃
定义：严重阻碍测试和开发工作
对应优先级：最高
具体可分为：
1.功能完全没有实现
2.应用闪退/崩溃无法运行
3.应用必现安全模式，无法运行
4.其他导致功能无法测试的问题
2级，至关重要
定义：非阻碍用例执行的严重问题
对应优先级：高
具体可分为：
1.简单操作应用闪退/崩溃，卡死
2.数据丢失
3.严重影响系统，自身功能无法运行
4.严重数值计算错误
5.数据库损坏或无法保存配置
6.安全性问题（包括数据加密等）
3级，主要
定义：功能存在缺陷，但不影响应用和系统的稳定性
对应优先级：中
具体可分为：
1.内存泄露（长时间不用的对象需要被回收，不被回收占内存）
2.功能实现逻辑覆盖不全面
3.非必现，但复现概率超过50%的闪退/崩溃和安全模式
4级，一般
定义：对应用熟悉度高才能感知到的问题，对应用基本功能实现无影响
对应优先级：中
具体可分为：
1.轻微数值计算错误
2.功能实现有误，与产品文档不完全贴切
3.用户简单操作，即可明显感知的UI问题
5级，较小
定义：界面，性能缺陷
对应优先级：低
具体可分为：
1.操作界面错误（提示显示规则，刷新规则是否与文档一致） 
2.边界条件显示错误  　 　 　
3.提示信息和界面效果展示错误（包括未给出信息、信息提示错误等） 
4.复现率低于5%的闪退/崩溃和安全模式  　 　 　
5.插件兼容和性能未优化问题  　 　 　
6.非正常操作导致UI显示异常

6级，建议
定义：对于产品的意见或者建议
对应优先级：低
具体可分为：
1.对于产品设计方面的意见和建议
2.对于产品界面优化方面的意见和建议
3.对于产品需要优化增强用户体验方面的意见和建议

1.1.17按照测试种类分

逻辑功能类，性能类，界面类，易用性类，安装，兼容性类

1.1.18按照功能模块分

1.1.19软件缺陷类型

1.1.20按照解决方案划分

1.1.21按照BUG生命周期

5.4.缺陷报告(Bug报告，提的Bug)

5.5bug的处理

6.测试用例执行和故障管理流程图

posted @ 2020-11-21 20:54 霖尤li 阅读(1107) 评论(0) 收藏举报

刷新页面返回顶部

霖尤li