9.1 随机抽样
\(\mathbf{{\large {\color{Red} {欢迎到学科网下载资料学习}} } }\)【高分突破系列】 高一数学下学期同步知识点剖析精品讲义!
\(\mathbf{{\large {{\color{Red} {跟贵哥学数学,so \quad easy!}} }}}\)
必修第二册同步拔高,难度2颗星!
模块导图
知识剖析
全面调查和抽样调查
(1)像人口普查,对每一个调查对象都进行调查的方法,称为全面调查;
根据一定的目的,从总体中抽取一部分个体进行调查,并以此为依据对总体情况作出估计和推断的调查方法,称为抽样调查.
Eg 全面调查的特点是数据全面可靠,而费时费力,故用于重大事件调查或样本少的调查,
比如对小区人员核酸检测、调查高一(1)班学生课外阅读时间;
抽样调查的优势在于对人力、财力、物力要求低,节约调查时间等,适合样本数据较多的情况,比如了解珠江的水质情况、了解全市学生的平均身高.
抽样调查的核心是样本的代表性,每个个体被抽到的概率相等,样本数据能够反应总体.
(2)调查对象的全体称为总体,组成总体的每一个调查对象称为个体.从总体中抽取的那部分
个体称为样本,样本中包含的个体数称为样本容量.
Eg 调查高一年级\(1234\)名学生的课外阅读时间,随机抽取\(100\)名学生,其中总体:\(1234\)名学生的课外阅读时间,个体:每个学生的课外阅读时间,样本:抽取的\(100\)名学生的课外阅读时间,样本容量:\(100\).
简单随机抽样
① 简单随机抽样的方法
一般地,设一个总体含有\(N\)个个体,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,则这样的抽样方法叫做简单随机抽样,方法有抽签法和随机数表法.
② 样本平均数
一般地,总体中有\(N\)个个体,它们的变量值分别为\(Y_1\),\(Y_2\),…,\(Y_N\),则称
为总体均值,又称总体平均数.
如果总体的\(N\)个变量值中,不同的值共有\(k(k≤N)\)个,不妨记为\(Y_1\),\(Y_2\),…,\(Y_k\),其中\(Y_i\)出现的频数\(f_i (i=1,2,…,k)\),则总体均值还可以写成加权平均数的形式
如果从总体中抽取一个容量为\(n\)的样本,它们的变量值分别为\(y_1\),\(y_2\),…,\(y_n\),则称
为样本均值,又称样本平均数.
分层随机抽样
一般地,按一个或多个变量把总体划分为若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样.
Eg 若高一年级学生中男女比例是\(1:2\);学霸学渣比例是\(1:4\),我们调查学生饮食习惯,可采取简单随机抽样;调查学生身高,常识告诉我们性别对身高影响大,故采取按男女比例分层抽样;调查学生听课效率,则按照学霸学渣比例分层抽样.
获取数据的途径
① 通过调查获取数据 ② 通过试验获取数据
③ 通过观察获取数据 ④ 通过查阅获取数据
经典例题
【题型一】 调查方法
【典题1】 下列调查方式中合适的是( )
A.要了解一批节能灯的使用寿命,采用普查方式
B.调查你所在班级同学的身高,采用抽样调查方式
C.调查珠江某段水域的水质情况,采用抽样调查方式
D.调查全市中学生的就寝时间,采用普查方式
【解析】 对于\(A\),要了解一批节能灯的使用寿命,应采用抽样调查方式,\(A\)错误;
(用普查,那调查完后都没灯用了,哈哈)
对于\(B\),调查你所在班级同学的身高,班级人数较少,应采用普查方式,\(B\)错误;
对于\(C\),调查珠江某段水域的水质情况,只能抽取部分水质检查,应采用抽样调查方式,\(C\)正确;
对于\(D\),调查全市中学生的就寝时间,全市学生人数较多,应采用抽样调查方式,\(D\)错误.
故选:\(C\).
【点拨】 当样本个数较少或对于重大事件时,可采取全面调查;当样本个数较多时,采取抽样调查.
【典题2】 某中学进行了该学年度期末统一考试,该校为了了解高一年级\(1000\)名学生的考试成绩,从中随机抽取了\(100\)名学生的成绩单,就这个问题来说,下面说法正确的是( )
A.\(1000\)名学生是总体 \(\qquad \qquad \qquad \qquad \qquad \qquad\) B.每个学生是个体
C.\(1000\)名学生的成绩是一个个体 \(\qquad \qquad \qquad \qquad\) D.样本的容量是\(100\)
【解析】 根据题意得,本题的总体、个体与样本考查的对象都是学生成绩,而不是学生,
所以选项\(A\)、\(B\)表达的对象都是学生,不是成绩,\(A\)、\(B\)都错误;
\(C\)中\(1000\)名学生的成绩是总体,不是个体,所以\(C\)是错误的;
\(D\)中样本的容量是\(100\),\(D\)是正确的.
故选:\(D\).
【点拨】 注意对调查对象的理解.
巩固练习
1.(★) 下列哪种工作不能使用抽样方法进行( )
A.测定一批炮弹的射程
B.测定海洋水域的某种微生物的含量
C.高考结束后,国家高考命题中心计算数学试卷中每个题目的难度
D.检测某学校全体高二学生的身高和体重的情况
2 (★) 在以下调查中哪个不适合抽样调查( )
A.调查班级学生每周的锻炼时间 \(\qquad \qquad \qquad \qquad\) B.调查地区新冠的发病率
C.调查一批地雷的杀伤半径 \(\qquad \qquad \qquad \qquad\) D.调查湖中所有鱼中草鱼的比例
3 (★) 从某年级\(500\)名学生中抽取\(60\)名学生进行体重的统计分析,就这个问题来说,下列说法正确的是( )
A.\(500\)名学生是总体 \(\qquad \qquad \qquad \qquad \qquad \qquad\) B.每个被抽取的学生是个体
C.抽取的\(60\)名学生的体重是一个样本 \(\qquad \qquad \qquad\) D.抽取的\(60\)名学生的体重是样本容量
参考答案
- 【答案】 \(D\)
【解析】 抽样是为了用总体中的部分个体(即样本)来估计总体的情况,选项\(A\)、\(B\)、\(C\)都是从总体中抽取部分个体进行检验.选项\(D\)是检测全体学生的身体状况,所以,要对全体学生的身体都进行检验,而不能采取抽样的方法.
故选:\(D\). - 【答案】 \(B\)
【解析】 对于\(A\),调查班级学生每周的锻炼时间,总体信息量较大,应适合抽样调查;
对于\(B\),调查地区新冠的发病率,因病人传染性强,不能漏掉一个发病者,应适用普查,不能用抽样调查;
对于\(C\),调查一批地雷的杀伤半径,具有破坏性,应适合抽样调查;
对于\(D\),调查湖中所有鱼中草鱼的比例,总体数量大,应适合抽样调查.
故选:\(B\). - 【答案】 \(C\)
【解析】 从某年级\(500\)名学生中抽取\(60\)名学生进行体重的统计分析,
在\(A\)中,\(500\)名学生的体重是总体,故\(A\)错误;
在\(B\)中,每个被抽查的学生的体重是个体,故\(B\)错误;
在\(C\)中,抽查的\(60\)名学生的体重是一个样本,故\(C\)正确;
在\(D\)中,\(60\)是样本容量,故\(D\)错误.
故选:\(C\).
【题型二】简单随机抽样
【典题1】 用简单随机抽样的方法从含有\(10\)个个体的总体中,抽取一个容量为\(3\)的样本,其中某一个体\(a\)“第一次被抽到”的可能性,“第二次被抽到”的可能性分别是\(\underline{\quad \quad}\) .
【解析】 在抽样过程中,个体\(a\)每一次被抽中的概率是相等的,
\(\because\)总体容量为\(10\),
故个体\(a\)“第一次被抽到”的可能性,“第二次被抽到”的可能性均为\(\dfrac{1}{10}\).
【点拨】 抽样的核心问题是样本的代表性,故要求保证对样本抽取的概率均相等.这好比你去买彩票,不可能说先让别人去买,我接着买中奖的概率大些,常识告诉你是不可能的!
【典题2】 因乙肝疫苗事件,需要对某种疫苗进行检测,现从\(800\)支中抽取\(60\)支进行检验,利用随机数表抽取样本时,先将\(800\)支按\(000\),\(001\),…,\(799\)进行编号,如果从随机数表第\(7\)行第\(10\)列的数开始向右读,则得到的第\(4\)个样本个体的编号是\(\underline{\quad \quad}\) (下面摘取了随机数表第\(7\)行至第\(9\)行)
【解析】 找到第\(7\)行第\(10\)列的数开始向右读,第一个符合条件的是\(157\),第二个数\(245\),第三个数\(506\),第四个数\(887\)不合题意舍去,第五个数\(704\)符合题意.
∴第\(4\)个样本个体的编号是\(704\),
故答案为\(704\).
【点拨】 编号是三位数字,故读数的时候是三个数字连着读下去的.
【题型三】 分层随机抽样
【典题1】 下列问题中,最适合用分层抽样方法抽样的是( )
A.某电影院有\(32\)排座位,每排有\(40\)个座位,座位号是\(1~40\),有一次报告会坐满了听众,报告会结束以后为听取意见,要留下\(32\)名听众进行座谈
B.从\(10\)台冰箱中抽出\(3\)台进行质量检查
C.某乡农田有山地\(8000\)亩,丘陵\(12000\)亩,平地\(24000\)亩,洼地\(4000\)亩,现抽取农田\(480\)亩估计全乡农田平均产量
D.从\(50\)个零件中抽取\(5\)个做质量检验
【解析】 \(A\).总体容量较多,差异不明显,不适合分层抽样,
\(B\).总体容量比较少,使用简单抽样即可,
\(C\).总体容量较多,样本差异比较明显,使用分层抽样,
\(D\).总体容量比较少,使用简单抽样即可,
故选:\(C\).
【点拨】 用分层抽样还是简单随机抽样,看总体中样本之间差异是否明显,这是对调查目的而言,本质是要保证抽样具有代表性!
【典题2】 交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为\(N\),其中甲社区有驾驶员\(96\)人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为\(8\),\(23\),\(27\),\(43\),则这四个社区驾驶员的总人数\(N\)为\(\underline{\quad \quad}\).
【解析】 \(\because\)甲社区有驾驶员\(96\)人,在甲社区中抽取驾驶员的人数为\(8\),
\(\therefore\)每个个体被抽到的概率为\(\dfrac{8}{96}=\dfrac{1}{12}\),样本容量为\(8+23+27+43=101\),
\(\therefore\)这四个社区驾驶员的总人数\(N\)为\(101 \div \dfrac{1}{12}=1212\).
【点拨】 分层抽样是每层按比例进行抽样的.
【典题3】 某单位有老年人\(27\)人,中年人\(55\)人,青年人\(81\)人.为了调查他们的身体状况,需从他们中抽取一个容量为\(36\)的样本,你觉得最适合抽取样本的方法是\(\underline{\quad \quad}\),抽取的老年人有\(\underline{\quad \quad}\)人,中年人有\(\underline{\quad \quad}\)人,青年人有\(\underline{\quad \quad}\)人.
【解析】 由于调查目的是单位人员的身体状况,明显比例以人员年纪进行分层抽样.
若直接计算抽取老年人\(36 \times \dfrac{27}{27+55+81} \approx 5.96\),结果不是整数,
故这样直接分层抽样不可取,(也不能说四舍五入的)
通过观察数值,可先从中年人中剔除一人,然后再分层,
此时总体人数是\(27+54+81=162\),每个个体被抽到的概率等于 \(\dfrac{36}{162}=\dfrac{2}{9}\),
所以老年人抽取\(27 \times \dfrac{2}{9}=6\)人,中年人\(54 \times \dfrac{2}{9}=12\)人,青年人 \(81 \times \dfrac{2}{9}=18\);
故答案是:先从中年人中剔除一人再分层抽样,\(6\),\(12\),\(18\).
巩固练习
1.(★) 下列问题中,最适合用简单随机方法抽样的是( )
A.某学校有学生\(1320\)人,为了了解学生身体发育情况,准备从中抽取一个容量为\(300\)的样本
B.从全班\(30\)名学生中,任意选取\(5\)名进行家访
C.为了准备省政协会议,某政协委员计划从\(1135\)个村庄中抽取\(50\)个进行收入调查
D.为了解某地区癌症的发病情况,从该地区的\(5000\)人中抽取\(200\)人进行统计
2.(★) 某高中为了了解本校学生考入大学一年后的学习情况,对本校上一年考入大学的同学进行了调查,根据学生所属的专业类型,制成如饼图,现从这些同学中抽出\(200\)人进行进一步调查,已知张三为理学专业,李四为工学专业,则下列说法不正确的是( )
A.采用分层随机抽样比简单随机抽样更合理
B.若按专业类型进行分层随机抽样,则理学专业和工学专业应抽取\(60\)人和\(40\)人
C.若按专业类型进行分层随机抽样,则张三被抽到的可能性比李四大
D.该问题中的样本容量为\(200\)
3.(★) 从一个容量为\(m(m≥3,m\in N)\)的总体中抽取一个容量为\(3\)的样本,当选取简单随机抽样方法抽取样本时,总体中每个个体被抽中的可能性是\(\dfrac{1}{3}\),则选取分层随机抽样方法抽取样本时,总体中每个个体被抽中的可能性是\(\underline{\quad \quad}\).
4.(★) 从某高中\(2021\)名学生中选取\(50\)名学生参加数学竞赛,若采用以下方法选取:先用简单随机抽样方法从\(2021\)名学生中剔除\(21\)名,再从余下的\(2000\)名学生中随机抽取\(50\)名.则其中学生丙被选取和被剔除的概率分别是\(\underline{\quad \quad}\) .
5.(★) 某班对一模考试数学成绩进行分析,利用随机数表法抽取样本时,先将\(70\)个同学按\(00\),\(01\),\(02\),…,\(69\)进行编号,然后从随机数表第\(9\)行第\(9\)列的数开始向右读,则选出的第\(10\)个样本中第\(8\)个样本的编号是\(\underline{\quad \quad}\) (注:如表为随机数表的第\(8\)行和第\(9\)行)
63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79
33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54.
6.(★) 假设要考察某公司生产的\(500\)克袋装牛奶的三聚氰胺是否超标,现从\(800\)袋牛奶中抽取\(60\)袋进行检验,利用随机数表抽取样本时,先将\(800\)袋牛奶按\(000\),\(001\),…,\(799\)进行编号,如果从随机数表第\(7\)行第\(8\)列的数开始向右读,请你依次写出最先检测的\(5\)袋牛奶的编号\(\underline{\quad \quad}\) (下面摘取了随机数表第\(7\)行至第\(9\)行)
84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76
63 01 63 78 59 16 95 56 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79
33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54.
7.(★) 某校高中生共有\(900\)人,其中高一年级\(300\)人,高二年级\(200\)人,高三年级\(400\)人,先采用分层抽取容量为\(45\)人的样本,那么高一、高二、高三年级抽取的人数分别为\(\underline{\quad \quad}\) .
8.(★★) 某单位有职工\(750\)人,其中青年职工\(350\)人,中年职工\(250\)人,老年职工\(150\)人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本,若样本中的青年职工为\(7\)人,则样本容量为 \(\underline{\quad \quad}\).
9.(★★) 某校高一年级有学生\(400\)人,高二年级有学生\(360\)人,现采用分层抽样的方法从全校学生中抽出\(55\)人,其中从高一年级学生中抽出\(20\)人,则从高三年级学生中抽取的人数为 \(\underline{\quad \quad}\).
10.(★★) 某工厂生产\(A\)、\(B\)、\(C\)三种不同型号的产品,某月生产产品数量之比依次为\(m:3:2\),现用分层抽样方法抽取一个容量为\(120\)的样本,已知\(A\)种型号产品抽取了\(45\)件,则\(C\)种型号产品抽取的件数为 \(\underline{\quad \quad}\) .
11.(★★) 某高中共有学生\(1000\)名,其中高一年级共有学生\(380\)人,高二年级男生有\(180\)人.如果在全校学生中抽取\(1\)名学生,抽到高二年级女生的概率为\(0.19\),现采用分层抽样(按年级分层)在全校抽取\(100\)人,则应在高三年级中抽取的人数等于\(\underline{\quad \quad}\).
参考答案
- 【答案】 \(B\)
【解析】 在\(B\)中,调查数量较少,适合运用简单随机抽样.故选\(B\). - 【答案】 \(C\)
【解析】 对于\(A\),\(\because\)饼图中学生专业类型鲜明,\(∴\)采用分层随机抽样比简单随机抽样更合理,故\(A\)正确;
对于\(B\),理学专业应抽取的人数为 \(200 \times \dfrac{30}{100}=60\),
工学专业应抽取的人数为\(200 \times \dfrac{20}{100}=40\),故\(B\)正确;
对于\(C\),张三与李四被抽到的可能性相等,故\(C\)错误;
对于\(D\),该问题中的样本容量为\(200\),故\(D\)正确.
故选:\(C\). - 【答案】 \(\dfrac{1}{3}\), \(\dfrac{1}{3}\)
【解析】 \(\because\)随机抽样每个个体被抽到的概率相等,
\(∴\)选取分层抽样抽取样本时总体中每个个体被抽中的概率仍为\(\dfrac{1}{3}\). - 【答案】 \(\dfrac{21}{2021}\), \(\dfrac{50}{2021}\)
【解析】 用简单随机抽样从\(2021\)名学生中剔除\(21\)名,
则学生甲被剔除的概率 \(P=\dfrac{21}{2021}\),被选取的概率是 \(P=\dfrac{50}{2021}\). - 【答案】 \(38\)
【解析】 \(70\)个同学按\(00\),\(01\),\(02\),…,\(69\)进行编号,从随机数表第\(9\)行第\(9\)列的数开始向右读,选出的第\(10\)个样本数分别是\(29\),(\(78\)舍去),\(64\),\(56\),\(07\),(\(82\)舍去),\(52\),\(42\),(\(07\)舍去),\(44\),\(38\),\(15\),\(51\);第\(8\)个样本的编号是\(38\). - 【答案】 \(331\)、\(572\)、\(455\)、\(068\)、\(047\)
【解析】 找到第\(7\)行第\(8\)列的数开始向右读,第一个符合条件的是\(331\),
第二个数是\(572\),第三个数是\(455\),第四个数是\(068\),
第五个数是\(877\)它大于\(799\)故舍去,第五个数是\(047\).
故答案为:\(331\)、\(572\)、\(455\)、\(068\)、\(047\) - 【答案】 \(15\)、\(10\)、\(20\)
【解析】 根据题意得,用分层抽样在各层中的抽样比为 \(\dfrac{45}{900}=\dfrac{1}{20}\),
则在高一年级抽取的人数是\(300 \times \dfrac{1}{20}=15\)人,高二年级抽取的人数是 \(200 \times \dfrac{1}{20}=10\)人,
高三年级抽取的人数是 \(400 \times \dfrac{1}{20}=20\)人,
故答案为\(15\)、\(10\)、\(20\). - 【答案】 \(15\)
【解析】 根据分层抽样的定义和方法,每个个体被抽到的概率等于 \(\dfrac{7}{150}=\dfrac{1}{50}\).
设样本容量等于\(n\),则有\(\dfrac{n}{750}=\dfrac{1}{50}\),解得\(n=15\),
故答案为\(15\). - 【答案】 \(17\)
【解析】 设从高一年级学生中抽出\(x\)人,由题意得 \(\dfrac{x}{360}=\dfrac{20}{400}\),解得\(x=18\),
则从高三年级学生中抽取的人数为\(55-20-18=17\)人,
故答案为:\(17\). - 【答案】 \(30\)
【解析】 \(\because\)分层抽样方法抽取一个容量为\(120\)的样本,\(A\)种型号产品抽取了\(45\)件,
\(\therefore B\)、\(C\)两种型号的产品共抽取:\(120-45=75\),
\(\because\)某工厂生产\(A\)、\(B\)、\(C\)三种不同型号的产品,某月生产产品数量之比依次为\(m:3:2\),
\(\therefore C\)种型号产品抽取的件数为: \(75 \times \dfrac{2}{3+2}=30\). - 【答案】 \(25\)
【解析】 \(\because\)高中共有学生\(1000\)名,在全校学生中抽取\(1\)名学生,抽到高二年级女生的概率为\(0.19\),
\(\therefore\)高二女生共有\(1000×0.19=190\)人,则高二共有学生\(180+190=370\)人,
则高三人数为人,
则采用分层抽样(按年级分层)在全校抽取\(100\)人,
则应在高三年级中抽取的人数等于 \(\dfrac{250}{1000} \times 100=25\)人,
故答案为:\(25\).