9.1 随机抽样

\(\mathbf{{\large {\color{Red} {欢迎到学科网下载资料学习}} } }\)【高分突破系列】 高一数学下学期同步知识点剖析精品讲义
\(\mathbf{{\large {{\color{Red} {跟贵哥学数学,so \quad easy!}} }}}\)

必修第二册同步拔高,难度2颗星!

模块导图

知识剖析

全面调查和抽样调查

(1)像人口普查,对每一个调查对象都进行调查的方法,称为全面调查;
根据一定的目的,从总体中抽取一部分个体进行调查,并以此为依据对总体情况作出估计和推断的调查方法,称为抽样调查.
Eg 全面调查的特点是数据全面可靠,而费时费力,故用于重大事件调查或样本少的调查,
比如对小区人员核酸检测、调查高一(1)班学生课外阅读时间;
抽样调查的优势在于对人力、财力、物力要求低,节约调查时间等,适合样本数据较多的情况,比如了解珠江的水质情况、了解全市学生的平均身高.
抽样调查的核心是样本的代表性,每个个体被抽到的概率相等,样本数据能够反应总体.
 

(2)调查对象的全体称为总体,组成总体的每一个调查对象称为个体.从总体中抽取的那部分
个体称为样本,样本中包含的个体数称为样本容量.
Eg 调查高一年级\(1234\)名学生的课外阅读时间,随机抽取\(100\)名学生,其中总体:\(1234\)名学生的课外阅读时间,个体:每个学生的课外阅读时间,样本:抽取的\(100\)名学生的课外阅读时间,样本容量:\(100\).
 

简单随机抽样

① 简单随机抽样的方法
一般地,设一个总体含有\(N\)个个体,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,则这样的抽样方法叫做简单随机抽样,方法有抽签法和随机数表法.
 

② 样本平均数
一般地,总体中有\(N\)个个体,它们的变量值分别为\(Y_1\)\(Y_2\),…,\(Y_N\),则称

\[\bar{Y}=\dfrac{1}{N} \sum_{i=1}^N Y_i \]

为总体均值,又称总体平均数.
如果总体的\(N\)个变量值中,不同的值共有\(k(k≤N)\)个,不妨记为\(Y_1\)\(Y_2\),…,\(Y_k\),其中\(Y_i\)出现的频数\(f_i (i=1,2,…,k)\),则总体均值还可以写成加权平均数的形式

\[\bar{Y}=\dfrac{1}{N} \sum_{i=1}^k f_i Y_i \]

如果从总体中抽取一个容量为\(n\)的样本,它们的变量值分别为\(y_1\)\(y_2\),…,\(y_n\),则称

\[\bar{y}=\dfrac{1}{n} \sum_{i=1}^n y_i \]

为样本均值,又称样本平均数.
 

分层随机抽样

一般地,按一个或多个变量把总体划分为若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样.
Eg 若高一年级学生中男女比例是\(1:2\);学霸学渣比例是\(1:4\),我们调查学生饮食习惯,可采取简单随机抽样;调查学生身高,常识告诉我们性别对身高影响大,故采取按男女比例分层抽样;调查学生听课效率,则按照学霸学渣比例分层抽样.
 

获取数据的途径

① 通过调查获取数据 ② 通过试验获取数据
③ 通过观察获取数据 ④ 通过查阅获取数据
 

经典例题

【题型一】 调查方法

【典题1】 下列调查方式中合适的是(  )
  A.要了解一批节能灯的使用寿命,采用普查方式
  B.调查你所在班级同学的身高,采用抽样调查方式
  C.调查珠江某段水域的水质情况,采用抽样调查方式
  D.调查全市中学生的就寝时间,采用普查方式
【解析】 对于\(A\),要了解一批节能灯的使用寿命,应采用抽样调查方式,\(A\)错误;
(用普查,那调查完后都没灯用了,哈哈)
对于\(B\),调查你所在班级同学的身高,班级人数较少,应采用普查方式,\(B\)错误;
对于\(C\),调查珠江某段水域的水质情况,只能抽取部分水质检查,应采用抽样调查方式,\(C\)正确;
对于\(D\),调查全市中学生的就寝时间,全市学生人数较多,应采用抽样调查方式,\(D\)错误.
故选:\(C\)
【点拨】 当样本个数较少或对于重大事件时,可采取全面调查;当样本个数较多时,采取抽样调查.
 

【典题2】 某中学进行了该学年度期末统一考试,该校为了了解高一年级\(1000\)名学生的考试成绩,从中随机抽取了\(100\)名学生的成绩单,就这个问题来说,下面说法正确的是(  )
  A.\(1000\)名学生是总体 \(\qquad \qquad \qquad \qquad \qquad \qquad\) B.每个学生是个体
  C.\(1000\)名学生的成绩是一个个体 \(\qquad \qquad \qquad \qquad\) D.样本的容量是\(100\)
【解析】 根据题意得,本题的总体、个体与样本考查的对象都是学生成绩,而不是学生,
所以选项\(A\)\(B\)表达的对象都是学生,不是成绩,\(A\)\(B\)都错误;
\(C\)\(1000\)名学生的成绩是总体,不是个体,所以\(C\)是错误的;
\(D\)中样本的容量是\(100\)\(D\)是正确的.
故选:\(D\)
【点拨】 注意对调查对象的理解.
 

巩固练习

1.(★) 下列哪种工作不能使用抽样方法进行(  )
  A.测定一批炮弹的射程
  B.测定海洋水域的某种微生物的含量
  C.高考结束后,国家高考命题中心计算数学试卷中每个题目的难度
  D.检测某学校全体高二学生的身高和体重的情况
 

2 (★) 在以下调查中哪个不适合抽样调查(  )
  A.调查班级学生每周的锻炼时间 \(\qquad \qquad \qquad \qquad\) B.调查地区新冠的发病率
  C.调查一批地雷的杀伤半径 \(\qquad \qquad \qquad \qquad\) D.调查湖中所有鱼中草鱼的比例
 

3 (★) 从某年级\(500\)名学生中抽取\(60\)名学生进行体重的统计分析,就这个问题来说,下列说法正确的是(  )
  A.\(500\)名学生是总体 \(\qquad \qquad \qquad \qquad \qquad \qquad\) B.每个被抽取的学生是个体
  C.抽取的\(60\)名学生的体重是一个样本 \(\qquad \qquad \qquad\) D.抽取的\(60\)名学生的体重是样本容量
 

参考答案

  1. 【答案】 \(D\)
    【解析】 抽样是为了用总体中的部分个体(即样本)来估计总体的情况,选项\(A\)\(B\)\(C\)都是从总体中抽取部分个体进行检验.选项\(D\)是检测全体学生的身体状况,所以,要对全体学生的身体都进行检验,而不能采取抽样的方法.
    故选:\(D\)
  2. 【答案】 \(B\)
    【解析】 对于\(A\),调查班级学生每周的锻炼时间,总体信息量较大,应适合抽样调查;
    对于\(B\),调查地区新冠的发病率,因病人传染性强,不能漏掉一个发病者,应适用普查,不能用抽样调查;
    对于\(C\),调查一批地雷的杀伤半径,具有破坏性,应适合抽样调查;
    对于\(D\),调查湖中所有鱼中草鱼的比例,总体数量大,应适合抽样调查.
    故选:\(B\)
  3. 【答案】 \(C\)
    【解析】 从某年级\(500\)名学生中抽取\(60\)名学生进行体重的统计分析,
    \(A\)中,\(500\)名学生的体重是总体,故\(A\)错误;
    \(B\)中,每个被抽查的学生的体重是个体,故\(B\)错误;
    \(C\)中,抽查的\(60\)名学生的体重是一个样本,故\(C\)正确;
    \(D\)中,\(60\)是样本容量,故\(D\)错误.
    故选:\(C\)
     

【题型二】简单随机抽样

【典题1】 用简单随机抽样的方法从含有\(10\)个个体的总体中,抽取一个容量为\(3\)的样本,其中某一个体\(a\)“第一次被抽到”的可能性,“第二次被抽到”的可能性分别是\(\underline{\quad \quad}\) .
【解析】 在抽样过程中,个体\(a\)每一次被抽中的概率是相等的,
\(\because\)总体容量为\(10\)
故个体\(a\)“第一次被抽到”的可能性,“第二次被抽到”的可能性均为\(\dfrac{1}{10}\).
【点拨】 抽样的核心问题是样本的代表性,故要求保证对样本抽取的概率均相等.这好比你去买彩票,不可能说先让别人去买,我接着买中奖的概率大些,常识告诉你是不可能的!

【典题2】 因乙肝疫苗事件,需要对某种疫苗进行检测,现从\(800\)支中抽取\(60\)支进行检验,利用随机数表抽取样本时,先将\(800\)支按\(000\)\(001\),…,\(799\)进行编号,如果从随机数表第\(7\)行第\(10\)列的数开始向右读,则得到的第\(4\)个样本个体的编号是\(\underline{\quad \quad}\) (下面摘取了随机数表第\(7\)行至第\(9\)行)
image.png
【解析】 找到第\(7\)行第\(10\)列的数开始向右读,第一个符合条件的是\(157\),第二个数\(245\),第三个数\(506\),第四个数\(887\)不合题意舍去,第五个数\(704\)符合题意.
∴第\(4\)个样本个体的编号是\(704\)
故答案为\(704\)
【点拨】 编号是三位数字,故读数的时候是三个数字连着读下去的.
 

【题型三】 分层随机抽样

【典题1】 下列问题中,最适合用分层抽样方法抽样的是(  )
  A.某电影院有\(32\)排座位,每排有\(40\)个座位,座位号是\(1~40\),有一次报告会坐满了听众,报告会结束以后为听取意见,要留下\(32\)名听众进行座谈
  B.从\(10\)台冰箱中抽出\(3\)台进行质量检查
  C.某乡农田有山地\(8000\)亩,丘陵\(12000\)亩,平地\(24000\)亩,洼地\(4000\)亩,现抽取农田\(480\)亩估计全乡农田平均产量
  D.从\(50\)个零件中抽取\(5\)个做质量检验
【解析】 \(A\).总体容量较多,差异不明显,不适合分层抽样,
\(B\).总体容量比较少,使用简单抽样即可,
\(C\).总体容量较多,样本差异比较明显,使用分层抽样,
\(D\).总体容量比较少,使用简单抽样即可,
故选:\(C\)
【点拨】 用分层抽样还是简单随机抽样,看总体中样本之间差异是否明显,这是对调查目的而言,本质是要保证抽样具有代表性!
 

【典题2】 交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为\(N\),其中甲社区有驾驶员\(96\)人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为\(8\)\(23\)\(27\)\(43\),则这四个社区驾驶员的总人数\(N\)\(\underline{\quad \quad}\).
【解析】 \(\because\)甲社区有驾驶员\(96\)人,在甲社区中抽取驾驶员的人数为\(8\)
\(\therefore\)每个个体被抽到的概率为\(\dfrac{8}{96}=\dfrac{1}{12}\),样本容量为\(8+23+27+43=101\)
\(\therefore\)这四个社区驾驶员的总人数\(N\)\(101 \div \dfrac{1}{12}=1212\)
【点拨】 分层抽样是每层按比例进行抽样的.
 

【典题3】 某单位有老年人\(27\)人,中年人\(55\)人,青年人\(81\)人.为了调查他们的身体状况,需从他们中抽取一个容量为\(36\)的样本,你觉得最适合抽取样本的方法是\(\underline{\quad \quad}\),抽取的老年人有\(\underline{\quad \quad}\)人,中年人有\(\underline{\quad \quad}\)人,青年人有\(\underline{\quad \quad}\)人.
【解析】 由于调查目的是单位人员的身体状况,明显比例以人员年纪进行分层抽样.
若直接计算抽取老年人\(36 \times \dfrac{27}{27+55+81} \approx 5.96\),结果不是整数,
故这样直接分层抽样不可取,(也不能说四舍五入的)
通过观察数值,可先从中年人中剔除一人,然后再分层,
此时总体人数是\(27+54+81=162\),每个个体被抽到的概率等于 \(\dfrac{36}{162}=\dfrac{2}{9}\)
所以老年人抽取\(27 \times \dfrac{2}{9}=6\)人,中年人\(54 \times \dfrac{2}{9}=12\)人,青年人 \(81 \times \dfrac{2}{9}=18\)
故答案是:先从中年人中剔除一人再分层抽样,\(6\)\(12\)\(18\).
 

巩固练习

1.(★) 下列问题中,最适合用简单随机方法抽样的是(  )
  A.某学校有学生\(1320\)人,为了了解学生身体发育情况,准备从中抽取一个容量为\(300\)的样本
  B.从全班\(30\)名学生中,任意选取\(5\)名进行家访
  C.为了准备省政协会议,某政协委员计划从\(1135\)个村庄中抽取\(50\)个进行收入调查
  D.为了解某地区癌症的发病情况,从该地区的\(5000\)人中抽取\(200\)人进行统计
 

2.(★) 某高中为了了解本校学生考入大学一年后的学习情况,对本校上一年考入大学的同学进行了调查,根据学生所属的专业类型,制成如饼图,现从这些同学中抽出\(200\)人进行进一步调查,已知张三为理学专业,李四为工学专业,则下列说法不正确的是(  )
image.png
  A.采用分层随机抽样比简单随机抽样更合理
  B.若按专业类型进行分层随机抽样,则理学专业和工学专业应抽取\(60\)人和\(40\)
  C.若按专业类型进行分层随机抽样,则张三被抽到的可能性比李四大
  D.该问题中的样本容量为\(200\)
 

3.(★) 从一个容量为\(m(m≥3,m\in N)\)的总体中抽取一个容量为\(3\)的样本,当选取简单随机抽样方法抽取样本时,总体中每个个体被抽中的可能性是\(\dfrac{1}{3}\),则选取分层随机抽样方法抽取样本时,总体中每个个体被抽中的可能性是\(\underline{\quad \quad}\).
 

4.(★) 从某高中\(2021\)名学生中选取\(50\)名学生参加数学竞赛,若采用以下方法选取:先用简单随机抽样方法从\(2021\)名学生中剔除\(21\)名,再从余下的\(2000\)名学生中随机抽取\(50\)名.则其中学生丙被选取和被剔除的概率分别是\(\underline{\quad \quad}\) .
 

5.(★) 某班对一模考试数学成绩进行分析,利用随机数表法抽取样本时,先将\(70\)个同学按\(00\)\(01\)\(02\),…,\(69\)进行编号,然后从随机数表第\(9\)行第\(9\)列的数开始向右读,则选出的第\(10\)个样本中第\(8\)个样本的编号是\(\underline{\quad \quad}\) (注:如表为随机数表的第\(8\)行和第\(9\)行)
63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79
33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54.
 

6.(★) 假设要考察某公司生产的\(500\)克袋装牛奶的三聚氰胺是否超标,现从\(800\)袋牛奶中抽取\(60\)袋进行检验,利用随机数表抽取样本时,先将\(800\)袋牛奶按\(000\)\(001\),…,\(799\)进行编号,如果从随机数表第\(7\)行第\(8\)列的数开始向右读,请你依次写出最先检测的\(5\)袋牛奶的编号\(\underline{\quad \quad}\) (下面摘取了随机数表第\(7\)行至第\(9\)行)
84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76
63 01 63 78 59 16 95 56 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79
33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54.
 

7.(★) 某校高中生共有\(900\)人,其中高一年级\(300\)人,高二年级\(200\)人,高三年级\(400\)人,先采用分层抽取容量为\(45\)人的样本,那么高一、高二、高三年级抽取的人数分别为\(\underline{\quad \quad}\) .
 

8.(★★) 某单位有职工\(750\)人,其中青年职工\(350\)人,中年职工\(250\)人,老年职工\(150\)人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本,若样本中的青年职工为\(7\)人,则样本容量为 \(\underline{\quad \quad}\)
 

9.(★★) 某校高一年级有学生\(400\)人,高二年级有学生\(360\)人,现采用分层抽样的方法从全校学生中抽出\(55\)人,其中从高一年级学生中抽出\(20\)人,则从高三年级学生中抽取的人数为 \(\underline{\quad \quad}\)
 

10.(★★) 某工厂生产\(A\)\(B\)\(C\)三种不同型号的产品,某月生产产品数量之比依次为\(m:3:2\),现用分层抽样方法抽取一个容量为\(120\)的样本,已知\(A\)种型号产品抽取了\(45\)件,则\(C\)种型号产品抽取的件数为 \(\underline{\quad \quad}\) .
 

11.(★★) 某高中共有学生\(1000\)名,其中高一年级共有学生\(380\)人,高二年级男生有\(180\)人.如果在全校学生中抽取\(1\)名学生,抽到高二年级女生的概率为\(0.19\),现采用分层抽样(按年级分层)在全校抽取\(100\)人,则应在高三年级中抽取的人数等于\(\underline{\quad \quad}\)
 
 

 
参考答案

  1. 【答案】 \(B\)
    【解析】 \(B\)中,调查数量较少,适合运用简单随机抽样.故选\(B\).
  2. 【答案】 \(C\)
    【解析】 对于\(A\)\(\because\)饼图中学生专业类型鲜明,\(∴\)采用分层随机抽样比简单随机抽样更合理,故\(A\)正确;
    对于\(B\),理学专业应抽取的人数为 \(200 \times \dfrac{30}{100}=60\)
    工学专业应抽取的人数为\(200 \times \dfrac{20}{100}=40\),故\(B\)正确;
    对于\(C\),张三与李四被抽到的可能性相等,故\(C\)错误;
    对于\(D\),该问题中的样本容量为\(200\),故\(D\)正确.
    故选:\(C\)
  3. 【答案】 \(\dfrac{1}{3}\)\(\dfrac{1}{3}\)
    【解析】 \(\because\)随机抽样每个个体被抽到的概率相等,
    \(∴\)选取分层抽样抽取样本时总体中每个个体被抽中的概率仍为\(\dfrac{1}{3}\).
  4. 【答案】 \(\dfrac{21}{2021}\)\(\dfrac{50}{2021}\)
    【解析】 用简单随机抽样从\(2021\)名学生中剔除\(21\)名,
    则学生甲被剔除的概率 \(P=\dfrac{21}{2021}\),被选取的概率是 \(P=\dfrac{50}{2021}\).
  5. 【答案】 \(38\)
    【解析】 \(70\)个同学按\(00\)\(01\)\(02\),…,\(69\)进行编号,从随机数表第\(9\)行第\(9\)列的数开始向右读,选出的第\(10\)个样本数分别是\(29\),(\(78\)舍去),\(64\)\(56\)\(07\),(\(82\)舍去),\(52\)\(42\),(\(07\)舍去),\(44\)\(38\)\(15\)\(51\);第\(8\)个样本的编号是\(38\)
  6. 【答案】 \(331\)\(572\)\(455\)\(068\)\(047\)
    【解析】 找到第\(7\)行第\(8\)列的数开始向右读,第一个符合条件的是\(331\)
    第二个数是\(572\),第三个数是\(455\),第四个数是\(068\)
    第五个数是\(877\)它大于\(799\)故舍去,第五个数是\(047\)
    故答案为:\(331\)\(572\)\(455\)\(068\)\(047\)
  7. 【答案】 \(15\)\(10\)\(20\)
    【解析】 根据题意得,用分层抽样在各层中的抽样比为 \(\dfrac{45}{900}=\dfrac{1}{20}\)
    则在高一年级抽取的人数是\(300 \times \dfrac{1}{20}=15\)人,高二年级抽取的人数是 \(200 \times \dfrac{1}{20}=10\)人,
    高三年级抽取的人数是 \(400 \times \dfrac{1}{20}=20\)人,
    故答案为\(15\)\(10\)\(20\)
  8. 【答案】 \(15\)
    【解析】 根据分层抽样的定义和方法,每个个体被抽到的概率等于 \(\dfrac{7}{150}=\dfrac{1}{50}\)
    设样本容量等于\(n\),则有\(\dfrac{n}{750}=\dfrac{1}{50}\),解得\(n=15\)
    故答案为\(15\)
  9. 【答案】 \(17\)
    【解析】 设从高一年级学生中抽出\(x\)人,由题意得 \(\dfrac{x}{360}=\dfrac{20}{400}\),解得\(x=18\)
    则从高三年级学生中抽取的人数为\(55-20-18=17\)人,
    故答案为:\(17\)
  10. 【答案】 \(30\)
    【解析】 \(\because\)分层抽样方法抽取一个容量为\(120\)的样本,\(A\)种型号产品抽取了\(45\)件,
    \(\therefore B\)\(C\)两种型号的产品共抽取:\(120-45=75\)
    \(\because\)某工厂生产\(A\)\(B\)\(C\)三种不同型号的产品,某月生产产品数量之比依次为\(m:3:2\)
    \(\therefore C\)种型号产品抽取的件数为: \(75 \times \dfrac{2}{3+2}=30\)
  11. 【答案】 \(25\)
    【解析】 \(\because\)高中共有学生\(1000\)名,在全校学生中抽取\(1\)名学生,抽到高二年级女生的概率为\(0.19\)
    \(\therefore\)高二女生共有\(1000×0.19=190\)人,则高二共有学生\(180+190=370\)人,
    则高三人数为人,
    则采用分层抽样(按年级分层)在全校抽取\(100\)人,
    则应在高三年级中抽取的人数等于 \(\dfrac{250}{1000} \times 100=25\)人,
    故答案为:\(25\)
posted @ 2023-05-10 18:43  贵哥讲数学  阅读(158)  评论(0编辑  收藏  举报
//更改网页ico // 实现数学符号与汉字间有间隙 //文章页加大页面,隐藏侧边栏