简单随机抽样
前言
抽样方法
-
简单随机抽样:抽签法和随机数表法;系统抽样;分层抽样
-
三种抽样方法的区别和联系
运算技巧
- \(A,B,C\)三种不同型号的产品,数量比为\(3:4:7\),分层抽样抽出容量为\(n\)的样本,样本中\(A\)产品有\(15\)件,求样本容量\(n\)。
法1:\(\cfrac{3}{3+4+7}\times n=15\),解得\(n=70\);
法2:引入比例因子,三种产品的数量分别为\(3k,4k,7k\),则\(3k=15\),即\(k=5\),
故样本容量为\(n=3k+4k+7k=14k=14\times 5=70\);
- 利用随机数表法时,由于每一位上的数字都是随机等可能出现的,故读数的方向可以向左、向右,也可以向上、向下,甚至斜向读数都可以,一般从左向右读数。
解析: 从随机数表第 \(1\) 行的第 \(6\) 列和第 \(7\) 列数字开始由左到右依次选取两个数字,则选出的 \(6\) 个红色球的编号依次为 \(21\),\(32\) , \(09\) , \(16\),\(17\) ,\(02\) ,故选出的第 \(6\) 个红色球的编号为 \(02\) . 答案: \(C\) .
典例剖析
①采用随机抽样法,将零件编号为\(00\),\(01\),\(\cdots\),\(99\),抽出20个;
②采用系统抽样法,将所有零件分成\(20\)组,每组\(5\)个,然后每组中随机抽取一个;
③采用分层抽样法,随机从一级品中抽取\(4\)个,二级品中抽取\(6\)个,三级品中抽取\(10\)个,则【\(\qquad\)】
\(A.\)不论采用哪种抽样方法,这\(100\)个零件中每个被抽到的概率都是\(\cfrac{1}{5}\)
\(B.\)①②两种抽样方法,这\(100\)个零件中每个被抽到的概率都是\(\cfrac{1}{5}\),③并非如此
\(C.\)①③两种抽样方法,这\(100\)个零件中每个被抽到的概率都是\(\cfrac{1}{5}\),②并非如此
\(D.\)采用不同的抽样方法,这\(100\)个零件中每个被抽到的概率各不相同
分析:根据三种抽样的定义,简单随机抽样、系统抽样、分层抽样都是随机抽样,每个个体被抽到的概率都相等,都是等概率抽样。故选\(A\)。
解后反思:
-
总体容量为\(N\),样本容量为\(n\),不论哪一种抽样方法,在整个抽样过程中,每一个个体被抽到的概率都为\(\cfrac{n}{N}\);
-
原理:总体容量为\(N\),样本容量为\(n\),求个体\(a\)被抽到的概率。
分析:从\(N\)个任意抽取\(n\)个的所有可能为\(C_N^n\)种,其中抽到个体\(a\)的可能为\(C_1^1\cdot C_{N-1}^{n-1}\)种,
故个体\(a\)被抽到的概率为\(P=\cfrac{C_1^1\cdot C_{N-1}^{n-1}}{C_N^n}=\cfrac{A_{N-1}^{N-1}/A_{n-1}^{n-1}}{A_N^N/A_n^n}=\cfrac{A_{N-1}^{N-1}\cdot A_n^n}{A_N^N\cdot A_{n-1}^{n-1}}=\cfrac{n}{N}\)。
- 总体容量为\(362\),样本容量为\(40\),再采用系统抽样方法抽取,此时需要先剔除\(2\)个个体,则此时每一个个体如\(A\),被抽到的概率还是\(\cfrac{40}{362}\);
分析:个体\(A\)被抽到,需要第一次抽取时未被剔除,其概率为\(\cfrac{360}{362}\);而第二次个体\(A\)必须被抽到,其概率为\(\cfrac{40}{360}\),两次抽取是相互独立事件,由相互独立事件的概率乘法公式可知,个体\(A\)被抽到的概率为 \(\cfrac{360}{362}\times\)\(\cfrac{40}{360}=\)\(\cfrac{40}{362}\).
分析:系统抽样得到的样本编号成等差数列,令\(a_1=7\), \(a_2=32\),\(d=25\),所以\(a_n=7+25(n-1)\leq 500\),所以\(n\leq 20\),最大编号为\(7+25\times 19=482\)。
分析:总体容量为\(6+12+18=36\),
当样本容量是\(n\),由题意可知,系统抽样的间隔为\(\cfrac{36}{n}\),
分层抽样的比例是\(\cfrac{n}{36}\),抽取的工程师人数为\(\cfrac{n}{36}\times 6=\cfrac{n}{6}\),
抽取的技术员人数为\(\cfrac{n}{36}\times 12=\cfrac{n}{3}\),抽取的技工人数为\(\cfrac{n}{36}\times 18=\cfrac{n}{2}\),
所以\(n\)应该是\(6\)的倍数,\(36\)的约数,即\(n=6,12,18\),
当样本容量为\((n+1)\)时,总体容量是\(35\)人,系统抽样的间隔为\(\cfrac{35}{n+1}\),
由于\(\cfrac{35}{n+1}\)必须是整数,所以\(n\)只能取\(6\),即样本容量为\(n=6\)。
解析 : 根据题意, \(\cfrac{9}{n-1}=\cfrac{1}{3}\) ,解得 \(n=28\)。 故每个个体被抽到的概率为 \(\cfrac{10}{28}=\cfrac{5}{14}\).
解析: 在简单随机抽样过程中,个体 \(a\) 每一次被抽中的概率是相等的,因为总体容量为\(10\) ,故个体 \(a\) “第一次被抽到” 的可能性为 \(\cfrac{1}{10}\), “第二次被抽到” 说明第一次没有抽到且第二次必须抽到,依照相互独立事件的概率乘法公式可得,“第二次被抽到” 的可能性为 \(\cfrac{9}{10}\)\(\times\)\(\cfrac{1}{9}\)\(=\)\(\cfrac{1}{10}\) ,故选 \(A\) . 注意,此题目强调的重点是抽取某一个个体,此时与抽不抽其他的个体无关。
难点剖析
✍️ 人教 2019A 版教材将简单随机抽样分为放回简单随机抽样和不放回简单随机抽样,其中两种抽样方法都是等概率抽样,即每一个个体被抽到的概率都相等。
解释:比如用 放回简单随机抽样 的方法从含有 \(10\) 个个体的总体中抽取一个容量为 \(3\) 的样本,其中某一个个体 \(a\) “第一次被抽到” 和 “第二次被抽到” 的可能性都是 \(\cfrac{1}{10}\),原因是有放回的抽样,故每次面临的情况是完全一致的 . 如果用 不放回简单随机抽样 的方法从含有 \(10\) 个个体的总体中抽取一个容量为 \(3\) 的样本,其中某一个个体 \(a\) “第一次被抽到” 的可能性为 \(\cfrac{1}{10}\), “第二次被抽到” 说明第一次没有抽到且第二次必须抽到,依照相互独立事件的概率乘法公式可得,“第二次被抽到” 的可能性为 \(\cfrac{9}{10}\)\(\times\)\(\cfrac{1}{9}\)\(=\)\(\cfrac{1}{10}\)[这二者是相互独立的,原因参见] ,故某个个体 \(a\) “第一次被抽到” 和 “第二次被抽到” 的可能性都是 \(\cfrac{1}{10}\) . 同理,“第三次被抽到” 的可能性为 \(\cfrac{9}{10}\)\(\times\)\(\cfrac{8}{9}\)\(\times\)\(\cfrac{1}{8}\)\(=\)\(\cfrac{1}{10}\)[这三者是相互独立的] ,在简单随机抽样中,每个个体被抽到的机会都相等,与顺序无关;
综上所述,简单随机抽样中的放回简单随机抽样和不放回简单随机抽样,都是等概率抽样,即每一个个体被抽到的概率都相等。
✍️ 判定一个抽样是不是简单随机抽样,需要看它是否满足以下两个条件:
① 总体的个体数有限;
② 是等可能抽样;
✍️ 在简单随机抽样中,每个个体被抽到的机会都相等,与顺序无关;[1] 若一个总体含有 \(N\) 个个体,用简单随机抽样方法抽取 \(n\) 个,则每个个体被抽到的可能性为 \(\cfrac{n}{N}\) . [2]
原理:总体容量为\(N\),样本容量为\(n\),求个体\(a\)被抽到的概率。分析:从\(N\)个任意抽取\(n\)个的所有可能为\(C_N^n\)种,其中抽到个体\(a\)的可能为\(C_1^1\cdot C_{N-1}^{n-1}\)种,
故个体\(a\)被抽到的概率为\(P=\cfrac{C_1^1\cdot C_{N-1}^{n-1}}{C_N^n}=\cfrac{A_{N-1}^{N-1}/A_{n-1}^{n-1}}{A_N^N/A_n^n}=\cfrac{A_{N-1}^{N-1}\cdot A_n^n}{A_N^N\cdot A_{n-1}^{n-1}}=\cfrac{n}{N}\)。 ↩︎