Typesetting math: 47%

7.5 正态分布

【高分突破系列】 高二数学下学期同步知识点剖析精品讲义
soeasysoeasy

选择性必修第三册同步提高,难度 3 颗星!

模块导图

知识剖析

正态分布的概念

若连续型随机变量 ξξ 的概率密度函数为 f(x)=1σ2πe(xμ)22σ2,x(,+)f(x)=1σ2πe(xμ)22σ2,x(,+),
其中 σσ,μμ 为常数,且 σ>0σ>0,则称 xx 服从正态分布,简记为 xN(μ,σ2)xN(μ,σ2).
f(x)f(x) 的图象称为正态曲线.
 

正态分布的期望与方差

ξN(μ,σ2)ξN(μ,σ2),则 E(ξ)=μE(ξ)=μ,D(ξ)=σ2D(ξ)=σ2;
 

正态曲线的性质

① 曲线在 xx 轴的上方,与 xx 轴不相交;
② 曲线关于直线 x=μx=μ 对称;
③ 曲线在 x=μx=μ 时达到峰值 1σ2π1σ2π
④ 曲线与 xx 轴之间的面积为 11
⑤ 当 x<μx<μ 时,曲线上升;当 x>μx>μ 时,曲线下降.并且当曲线向左、右两边无限延伸时,以 xx 轴为渐进线,向它无限靠近;
⑥ 曲线的形状由 σσ 确定,
σσ 越大,峰值 1σ2π1σ2π 越小,曲线越 “矮胖”,表示总体的分布越分散;
σσ 越小,峰值 1σ2π1σ2π 越大,曲线越 “瘦高”,表示总体的分布越集中.
 

概率

XN(μ,σ2)XN(μ,σ2)XX 取值不超过 xx 的概率 P(Xx)P(Xx) 为区域 AA 的面积,而 P(aXb)P(aXb) 为区域 BB 的面积.

 

3σ原则

假设 X N(μ,σ2)X N(μ,σ2),对于给到的 kNkN,P(μkσ<xμ+kσ)P(μkσ<xμ+kσ) 是一个只与 kk 有关的定值,特别地,
P(μσ<xμ+σ)=0.6827P(μσ<xμ+σ)=0.6827
P(μ2σ<xμ+2σ)=0.9545P(μ2σ<xμ+2σ)=0.9545
P(μ3σ<xμ+3σ)=0.9973P(μ3σ<xμ+3σ)=0.9973

在实际应用中,通常认为服从于正态分布N(μ,σ2)N(μ,σ2)的随机变量只取(μ3σ,μ+3σ)(μ3σ,μ+3σ)之间的值,并简称之为3σ3σ原则.  

标准正态分布

① 在标准正态分布表中相应于 x0x0 的值 Φ(x0)Φ(x0) 是指总体取值小于 x0x0 的概率,
Φ(x0)=P(x<x0)Φ(x0)=P(x<x0).

x00x00 时,则 Φ(x0)Φ(x0) 的值可在标准正态分布表中查到;
x0<0x0<0 时,可利用其图象的对称性获得 Φ(x0)=1Φ(x0)Φ(x0)=1Φ(x0) 来求出,
P(x1<ξ<x2)=P(ξ<x2)P(ξ<x1)=Φ(x2)Φ(x1)P(x1<ξ<x2)=P(ξ<x2)P(ξ<x1)=Φ(x2)Φ(x1)

N(μ,σ2)N(μ,σ2) N(0,1)N(0,1) 的关系:
(i)(i) ξN(μ,σ2)ξN(μ,σ2),则 η=ξμσN(0,1)η=ξμσN(0,1),有 P(ξ<x0)=F(x0)=Φ(x0μσ)P(ξ<x0)=F(x0)=Φ(x0μσ)
(ii)(ii) ξN(μ,σ2)ξN(μ,σ2),则 P(x1<x<x2)=Φ(x2μσ)Φ(x1μσ)P(x1<x<x2)=Φ(x2μσ)Φ(x1μσ).
 

经典例题

【题型一】正态分布的概念与性质

【典题 1】已知三个正态分布密度函数 Pi(x)=12πσie(xμi)22σ2iPi(x)=12πσie(xμi)22σ2i(xR,i=1,2,3)(xR,i=1,2,3) 的图象如图所示,则下列结论正确的是 (  )
image.png
A.σ1=σ2=σ3σ1=σ2=σ3 B.σ1=σ2<σ3σ1=σ2<σ3 C.μ1=μ2>μ3μ1=μ2>μ3 D.μ1<μ2=μ3μ1<μ2=μ3
【解析】因为 x=μx=μ 是对称轴,观察图象可知:μ1<μ2=μ3μ1<μ2=μ3
y=φ1(x)y=φ1(x) y=φ2(x)y=φ2(x) 的图象可以相互平移得到,且 y=φ3(x)y=φ3(x) 的图象显得更 “矮胖”,故 σ1=σ2<σ3σ1=σ2<σ3
故选:BDBD
【点拨】在正态分布的密度函数曲线 f(x)=1σ2πe(xμ)22σ2f(x)=1σ2πe(xμ)22σ2,其中直线 x=μx=μ 是其对称轴,σσ 确定曲线形状,σσ 越大曲线越 “矮胖”,σσ 越小,曲线越 “瘦高”.
 

【典题 2】已知连续型随机变量 XiN(ui,σ2i)(i=1,2,3)XiN(ui,σ2i)(i=1,2,3),其正态曲线如图所示,则下列结论正确的是 (  )

A. P(X1μ2)<P(X2μ1)P(X1μ2)<P(X2μ1)
B. P(X2μ2)>P(X3μ3)P(X2μ2)>P(X3μ3)
C. P(X1μ2)<P(X2μ3)P(X1μ2)<P(X2μ3)
D. P(μi2σiXiμi+2σi)=P(μi+12σi+1Xi+1μi+1+2σi+1)(i=1,2)P(μi2σiXiμi+2σi)=P(μi+12σi+1Xi+1μi+1+2σi+1)(i=1,2)
【解析】对于 AAP(X1μ2)P(X1μ2) 是正态分布密度函数 y=f1(x)y=f1(x) 在第二条虚线左侧与 xx 轴围成的部分,显然大于 0.50.5P(X2μ1)P(X2μ1) 是正态分布密度函数 y=f2(x)y=f2(x) 在第一条虚线左侧与 xx 轴围成的部分,显然小于 0.50.5,故 P(X1μ2)>P(X2μ1)P(X1μ2)>P(X2μ1),故 AA 错误;
对于 B:P(X2μ2)=12B:P(X2μ2)=12P(X3μ3)=12P(X3μ3)=12,则 P(X2μ2)=P(X3μ3)P(X2μ2)=P(X3μ3),故 BB 错误;
对于 CP(X1μ2)>0.5=P(X2μ3)CP(X1μ2)>0.5=P(X2μ3),故 CC 错误;
对于 D:P(μi2σiXiμi+2σi)D:P(μi2σiXiμi+2σi)=P(μi+12σi+1Xi+1μi+1+2σi+1)(i=1,2)=P(μi+12σi+1Xi+1μi+1+2σi+1)(i=1,2) 成立,故 DD 正确.
故选:DD
【点拨】
① 在正态分布中,概率 P(X<x)P(X<x) 相当于看对应的 “面积”;
② 若 X N(μ,σ2)X N(μ,σ2),对于给到的 kNkN,P(μkσ<xμ+kσ)P(μkσ<xμ+kσ) 是一个只与 kk 有关的定值,与正态分布密度函数无关,故 DD 正确.
 

巩固练习

1(★)【多选题】已知 XN(μ,σ2)XN(μ,σ2)f(x)=12πσe(xμ)22σ2f(x)=12πσe(xμ)22σ2xRxR,则 (  )
A.曲线 y=f(x)y=f(x) xx 轴围成的几何图形的面积小于 11
B.函数 f(x)f(x) 图象关于直线 x=μx=μ 对称
C.P(X>μσ)=2P(μ<X<μ+σ)+P(Xμ+σ)P(X>μσ)=2P(μ<X<μ+σ)+P(Xμ+σ)
D.函数 F(x)=P(X>x)F(x)=P(X>x) RR 上单调递增
 

2(★)【多选题】已知三个正态分布密度函数 φi(x)=12πσe(xμi)22σ2iφi(x)=12πσe(xμi)22σ2i(xR,I=1,2,3)(xR,I=1,2,3) 的图象如图所示,则下列结论正确的是 (  )
image.png
A. σ1=σ2σ1=σ2 B. μ1>μ3μ1>μ3 C. μ1=μ2μ1=μ2 D. σ2<σ3σ2<σ3
 

3(★) 设随机变量 XN(μ,7)XN(μ,7),若 P(X<2)=P(X>4)P(X<2)=P(X>4),则 (  )
A. μ=3μ=3, DX=7DX=7 B. μ=6μ=6, DX=7DX=7 C.μ=3μ=3, DX=7DX=7 D. μ=6μ=6, DX=7DX=7
 

4(★★) XN(μ1,σ21)XN(μ1,σ21) ,YN(μ2,σ22)YN(μ2,σ22),这两个正态曲线如图所示,下列说法正确的是 (  )
image.png
A.P(Yμ1)P(Yμ2)P(Yμ1)P(Yμ2)
B.P(Xσ1)P(Xσ2)P(Xσ1)P(Xσ2)
C.若 t<0t<0,则 P(Xt)P(Yt)P(Xt)P(Yt)
D.若 t<0t<0,则 P(Xt)P(Yt)P(Xt)P(Yt)
 

参考答案

  1. 【答案】BCBC
    【解析】AA.曲线 y=f(x)y=f(x) xx 轴围成的几何图形的面积等于 11,因此 AA 不正确;
    BB.函数 f(x)f(x) 图象关于直线 x=μx=μ 对称,可得 BB 正确;
    CCP(μ>X>μσ)=P(μ<X<μ+σ)P(μ>X>μσ)=P(μ<X<μ+σ)P(X>μσ)=2P(μ<X<μ+σ)+P(Xμ+σ)P(X>μσ)=2P(μ<X<μ+σ)+P(Xμ+σ),因此 CC 正确;
    DD.函数 F(x)=P(X>x)F(x)=P(X>x) RR 上单调递减,可得 DD 不正确.
    故选:BCBC
  2. 【答案】ADAD
    【解析】根据正态曲线关于 x=μx=μ 对称,且 μμ 越大图象越靠近右边,
    所以 μ1<μ2=μ3μ1<μ2=μ3BCBC 错误;
    σσ 越小数据越集中,图象越瘦长,
    所以 σ1=σ2<σ3σ1=σ2<σ3ADAD 正确.
    故选:ADAD
  3. 【答案】AA
    【解析】 随机变量 XN(μ7)XN(μ7),若 P(X<2)=P(X>4)P(X<2)=P(X>4)
    μ=3μ=3DX=7DX=7
    故选:AA
    4【答案】DD
    【解析】 正态分布密度曲线图象关于 x=μx=μ 对称,
    μ1<μ2μ1<μ2
    由图象形状可得 σ1>σ2σ1>σ2
    由正态分布曲线的对称性可得:若 t<0t<0,则 P(Xt)P(Yt)P(Xt)P(Yt)
    故选:DD

     

【题型二】 正态分布的计算问题

【典题 1】已知随机变量 ξξ 服从正态分布 N(1,σ2)N(1,σ2),若 P(ξ2)=aP(ξ2)=aP(0<ξ1)=13aP(0<ξ1)=13a,则 P(ξ0)=P(ξ0)=(  )
A. 1414 B. 1313 C. 1212 D. 3434
【解析】随机变量 ξξ 服从正态分布 N(1,σ2)N(1,σ2)P(ξ2)=aP(ξ2)=aP(0<ξ1)=13aP(0<ξ1)=13a
P(ξ0)=P(ξ2)=aP(ξ0)=P(ξ2)=aa+13a=12a+13a=12,解得 a=14a=14
P(ξ0)=14P(ξ0)=14
故选:AA
【点拨】① 在求解正态分布的概率时,要注意其曲线对称轴 x=μx=μ,利用对称性进行求解,若对题目中数值不是很敏感,建议画图进行思考,其关系容易获得;
② 正态曲线与 xx 轴之间的面积,即概率总和为 11,则概率 P(xμ)=P(xμ)=12P(xμ)=P(xμ)=12.
 

【典题 2】随机变量 XX 服从正态分布 XN(10,σ2)XN(10,σ2)P(X>12)=mP(X>12)=mP(8X10)=nP(8X10)=n,则 2m+1n2m+1n 的最小值为 _–––
【解析】 随机变量 XX 服从正态分布 XN(10,σ2)XN(10,σ2)P(X10)=12P(X10)=12
P(8X10)=nP(8X10)=n,得 P(10X12)=nP(10X12)=n
(812μ=10)(812μ=10)
P(X>12)=mP(X>12)=m
m+n=12m+n=12,且 m>0m>0n>0n>0
2m+1n=(2m+1n)(2m+2n)2m+1n=(2m+1n)(2m+2n)=6+4nm2mn6+2=6+42=6+4nm2mn6+2=6+42
当且仅当 4nm=2mn4nm=2mn,即 m=222,n=212m=222,n=212 时等号成立.
2m+1n2m+1n 的最小值为 6+426+42
故答案为:6+426+42
【点拨】
① 本题为正态分布与基本不等式的结合题,要对题中的数值 8810101212 有所注意;
② 利用基本不等式 “若 a>0a>0,b>0b>0,则 a+b2aba+b2ab” 时要注意是否满足 “正、定、等” 三字.
 

巩固练习

1(★★) 若随机变量 XX 服从分布 XN(2,σ2)XN(2,σ2),且 2P(X3)=P(1X2)2P(X3)=P(1X2),则 P(X<3)=P(X<3)=(  )
A. 1313 B. 5656 C. 1616 D. 2323
 

2(★★) 若随机变量 XB(3,p)XB(3,p) ,YN(2,σ2)YN(2,σ2),若 P(X1)=0.657P(X1)=0.657,P(0<Y<2)=pP(0<Y<2)=p,则 P(Y>4)=P(Y>4)=(  )
A.0.20.2 B.0.30.3 C.0.70.7 D.0.80.8
 

3(★★)2012 年国家开始实行法定节假日高速公路免费通行政策,某收费站在统计了 2019 年清明节前后车辆通行数量,发现该站近几天每天通行车辆的数量 ξξ 服从正态分布 ξN(1000,σ2)ξN(1000,σ2),若 P(ξ>1200)=aP(ξ>1200)=a ,P(800<ξ<1200)=bP(800<ξ<1200)=b,则 1a+2b1a+2b 的最小值为 _–––
 

参考答案

  1. 【答案】BB
    【解析】 P(X3)=xP(X3)=x,则 P(1X2)=2xP(1X2)=2x
    根据对称性,P(2X3)=2xP(2X3)=2x
    P(X2)=3x=12P(X2)=3x=12P(X3)=x=16P(X3)=x=16
    P(X3)=16P(X3)=16P(X<3)=56P(X<3)=56
    故选:BB
  2. 【答案】AA
    【解析】P(X1)=0.657P(X1)=0.6571(1p)3=0.6571(1p)3=0.657,即 (1p)3=0.343(1p)3=0.343,解得 p=0.3p=0.3
    P(0<Y<2)=p=0.3P(0<Y<2)=p=0.3
    P(Y>4)=12P(0<Y<2)2=12×0.32=0.2P(Y>4)=12P(0<Y<2)2=12×0.32=0.2
    故选:AA
  3. 【答案】88
    【解析】 ξN(1000,σ2)ξN(1000,σ2),且 P(ξ>1200)=aP(ξ>1200)=a,所以 P(ξ<800)=P(ξ>1200)=aP(ξ<800)=P(ξ>1200)=a
    所以 P(800<ξ<1200)=12a=bP(800<ξ<1200)=12a=b,所以 2a+b=12a+b=1a>0a>0b>0b>0
    所以 1a+2b=(1a+2b)(2a+b)=4+ba+4ab4+2ba4ab=81a+2b=(1a+2b)(2a+b)=4+ba+4ab4+2ba4ab=8b=2ab=2a 时取 “=”,
    1a+2b1a+2b 的最小值为 88
    故答案为:88
     

【题型三】 正态分布的实际应用

【典题 1】为了研究新冠疫情期间学生上网课的学习效果,学生返校复课后,某市对高三年级组织了一次调研考试,考试后统计的数学成绩服从正态分布,其密度曲线函数为 f(x)=192πe(x85)2162f(x)=192πe(x85)2162x(,+)x(,+),则下列说法正确的是 (  )
A.本次调研考试的平均分为 8585
B.本次调研考试的方差为 8181
C.随机抽查一名学生,其成绩在 125125 分以上的概率比成绩在 4545 分以下的概率大
D.本次调研考试,其成绩在 (7585)(7585) 和在 (8595)(8595) 的人数大致一样多
【解析】由正态分布密度曲线函数为 f(x)=192πe(x85)2162f(x)=192πe(x85)2162x(,+)x(,+)
所以平均数 μ=85μ=85,方差 σ2=81σ2=81,所以选项 AABB 正确;
P(x>125)=P(x<45)P(x>125)=P(x<45),所以成绩在 125125 分以上的概率等于成绩在 4545 分以下的概率,选项 CC 错误;
根据正态分布的对称性知,成绩在 (7585)(7585) 和在 (8595)(8595) 的人数大致一样多,选项 DD 正确.
故选:ABDABD
【点拨】
① 对正态分布的密度函数解析式 f(x)=1σ2πe(xμ)22σ2f(x)=1σ2πe(xμ)22σ2 有些了解,才确定 2σ2=1622σ2=162;其中期望为 μμ,可理解为数据中的平均数,而 σσ 是标准差,σ2σ2 才是方差,看数据的稳定性就看它了;
② 比较两个区间成绩的概率或人数,看在正态分布中对应的概率便可.
 

【典题 2】甲、乙两类水果的质量 (单位:kg) 分别服从正态分布 N(μ1,δ21)N(μ1,δ21),N(μ2,δ22)N(μ2,δ22),其正态分布的密度曲线如图所示,则下列说法错误的是 (  )
image.png
A.甲类水果的平均质量 μ1=0.4kgμ1=0.4kg
B.甲类水果的质量比乙类水果的质量更集中于平均值左右
C.甲类水果的平均质量比乙类水果的平均质量小
D.乙类水果的质量服从的正态分布的参数 δ2=1.99δ2=1.99
【解析】由图象可知甲图象关于直线 x=0.4x=0.4 对称,乙图象关于直线 x=0.8x=0.8 对称,
μ1=0.4μ1=0.4μ2=0.8μ2=0.8(μ)(μ)
AA 正确,CC 正确,
甲图象比乙图象更 “高瘦”,
甲类水果的质量比乙类水果的质量更集中于平均值左右,故 BB 正确;
(δi)(δi)
乙图象的最大值为 1.991.99,即 12πδ2=1.9912πδ2=1.99
δ21.99δ21.99,故 DD 错误.
(12πδ2δ2)(12πδ2δ2)
故选:D
【点拨】
在正态分布的应用中,对每个数据对应的实际意义有所理解;数据的平均值看期望 μ,数据稳定性看标准差 σ,数据的集中程度看标准差 σ.
 

【典题 3】2020 年某市教育主管部门为了解近期举行的数学竞赛的情况,随机抽取 500 名参赛考生的数学竞赛成绩进行分析,并制成如下的频率分布直方图:
image.png
(1) 求这 500 名考生的本次数学竞赛的平均成绩 ˉx(精确到整数);
(2) 由频率分布直方图可认为:这次竞赛成绩 X 服从正态分布 N(μ,σ2),其中 μ 近似等于样本的平均数 ˉxσ 近似等于样本的标准差 s,并已求得 s18.用该样本的频率估计总体的概率,现从该市所有考生中随机抽取 10 名学生,记这次数学竞赛成绩在 (86140] 之外的人数为 Y,求 P(Y=2) 的值 (精确到 0.001).
附:(1) 当 XN(μ,σ2) 时,P(μσ<Xμ+σ)=0.6827P(μ2σ<Xμ+2σ)=0.9545;(2)0.81868×0.181420.0066
【解析】(1)ˉx=10(65×0.0028+75×0.01+85×0.01+95×0.018+105×0.02+115×0.018+125×0.012+135×0.008+145×0.0012)=10×10.416=104.16104
(2) 由题意知 XN(μ,σ2),且 μ=104σ=18
86=10418=μσ140=104+18×2=μ+2σ
P(86<X140)=P(μσ<Xμ+2σ)=0.6827+0.95452=0.8186
P(XμσX>μ+2σ)=10.8186=0.1814
可得 YB(10,0.1814)
P(Y=2)=C210×0.18142×0.8186845×0.006630.298
【点拨】
① 在直方图中,若第 i 组的组中值为 xi,概率为 pi,则平均值 ˉx=ni=1xipi
② 确定正态分布的 μ=104σ=18 后,要留心区间 (86140] 86140 μσ 的数值关系 (86=μσ140=μ+2σ),从而求出区间 (86140] 内的概率.
 

【典题 4】“公平正义” 是社会主义和谐社会的重要特征,是社会主义法治理念的价值追求.“考试” 作为一种公平公正选拔人才的有效途径,正被广泛采用.每次考试过后,考生最关心的问题是:自己的考试名次是多少?自己能否被录取?能获得什么样的职位?某单位准备通过考试 (按照高分优先录取的原则) 录用 300 名,其中 275 个高薪职位和 25 个普薪职位.实际报名人数为 2000 名,考试满分为 400 分.(一般地,对于一次成功的考试来说,考试成绩应服从正态分布) 考试后考试成绩的部分统计结果如下:
考试平均成绩是 180 分,360 分及其以上的高分考生 30 名.
(1) 最低录取分数是多少?(结果保留为整数)
(2) 考生甲的成绩为 286 分,若甲被录取,能否获得高薪职位?若不能被录取,请说明理由.
参考资料:(1) 当 XN(μ,σ2) 时,令 Y=Xμσ,则 YN(0,1)
(2) 当 YN(0,1) 时,P(Y2.17)0.985P(Y1.28)0.900
P(Y1.09)0.863P(Y1.04)0.85
(3) P(X>x1)=P(Y>x1uσ)
【解析】(1) 设考生的成绩为 X
则由题意可得 X 应服从正态分布,即 XN(180,σ2)
Y=X180σ,则 YN(0,1)
()
360 分及以上高分考生 30 名可得 P(X360)=302000,即 P(X<360)=1302000=0.985
即有 P(Y<360180σ)=0.985,则 360180σ2.17,可得 σ83
可得 XN(180,832)
(XN(μ,σ2)YN(0,1)P(X>x1)=P(Y>x1uσ))
设最低录取分数线为 x0,则 P(Xx0)=P(Yx018083)=3002000
即有 P(Y<x018083)=13002000=0.85,即有 x018083=1.04
可得 x0=266.32,即最低录取分数线为 266
(2) 考生甲的成绩 286>267,所以能被录取,
P(X<286)=P(Y<28618083)=P(Y<1.28)0.90,表明不低于考生甲的成绩的人数大约为总人数的 10.90=0.102000×0.10=200
即考生甲大约排在第 200 名,排在前 275 名之前,所以能被录取为高薪职位.
(275)
设前 275 名最低录取分数为 x1,则 P(X<x1)=12752000=0.8615
P(Y1.09)0.863P(x270)0.863
P(X<x1)<P(x270)270>x1
286>270,所以能被录取为高薪职位.
(275x1P(X>286)P(X>x1))
【点拨】
① 本题要先理解非标准正态分布与标准正态分布之间的转化方法;
② 要找到给出的数据之间的关系,大胆求值 (比如本题中把涉及到 Y 的概率都转化为 X 的概率,分数 360286 对应的概率等),遇到值相等或近似时,可意识到它们存在某些关系,再结合正态分布的图象进行思考,确定它们的关系!
 

【典题 5】2019 年 4 月,河北、辽宁、江苏、福建、湖北、湖南、广东、重庆等 8 省市发布高考综合改革实施方案,决定从 2018 年秋季入学的高中一年级学生开始实施 “3+1+2” 高考模式.所谓 “3+1+2”,即 “3” 是指考生必选语文、数学、外语这三科;“1” 是指考生在物理、历史两科中任选一科;“2” 是指考生在生物、化学、思想政治、地理四科中任选两科.
(1) 若某考生按照 “3+1+2” 模式随机选科,求选出的六科中含有 “语文,数学,外语,物理,化学” 的概率.
(2) 新冠疫情期间,为积极应对 “3+1+2” 新高考改革,某地高一年级积极开展线上教学活动.教育部门为了解线上教学效果,从当地不同层次的学校中抽取高一学生 2500 名参加语数外的网络测试,并给前 400 名颁发荣誉证书,假设该次网络测试成绩服从正态分布,且满分为 450 分.
①考生甲得知他的成绩为 270 分,考试后不久了解到如下情况:“此次测试平均成绩为 171 分,351 分以上共有 57 人”,请用你所学的统计知识估计甲能否获得荣誉证书,并说明理由;
②考生丙得知他的实际成绩为 430 分,而考生乙告诉考生丙:“这次测试平均成绩为 201 分,351 分以上共有 57 人”,请结合统计学知识帮助丙同学辨别乙同学信息的真伪,并说明理由.
附:P(μσXμ+σ)=0.6828P(μ2σXμ+2σ)=0.9544
P(μ3σXμ+3σ)=0.9974
【解析】(1) 设事件 A:选出的六科中含有 “语文,数学,外语,物理,化学”,则 P(A)=C13C12C24=14
(2) 设此次网络测试的成绩记为 X,则 XN(μ,σ2)
①平均成绩为 171,即 μ=171(μ)
351 分以上共有 57 人,P(x351)=572500=0.0228
P(xμ+2σ)=1P(μ2σXμ+2σ)2=10.95442=0.0228
μ+2σ=351σ=351μ2=3511712=90
(3σσP(x351)=0.02283σ)
设获得荣誉证书最低分为 x0,则 P(Xx0)=4002500=0.16
P(Xμ+σ)=1P(μσXμ+σ)2=10.68282=0.1587<0.16=P(Xx0)
获得荣誉证书的最低分 x0<μ+σ=261
270>261 甲同学能获得荣誉证书;
(P(X270)<P(Xx0)).
而由 3σ 原则给出的概率确定 P(X261)<P(Xx0),显然能获得证书.
②假设乙所说的为真,则 μ=201
P(Xμ+2σ)=1P(μ2σXμ+2σ)2=10.95442=0.0228
351 分以上共有 57 人,P(x351)=572500=0.0228
μ+2σ=351σ=3512012=75
(XN(201,752))
从而 μ+3σ=201+3×75=426<430
P(Xμ+3σ)=1P(μ3σXμ+3σ)2=10.99742=0.0013
()
第一种结论:可以认为乙同学信息为假,理由如下:
事件 “Xμ+3σ” 为小概率事件,即 “丙同学的成绩为 430 分” 是小概率事件,可认为其不可能发生,但却又发生了,所以可认为乙同学信息为假;
第二种结论:无法辨别乙同学信息真假,理由如下:
事件 “Xμ+3σ” 即 “丙同学的成绩为 430 分” 发生的概率虽然很小,一般不容易发生,但是还是有可能发生的,所以无法辨别乙同学信息真假.
【点拨】
① 落在 (μ3σ,μ+3σ) 以外的概率小于千分之三,在实际问题中常认为相应的事件不会发生;
② 判断信息真假,可用 “假设法”,先确定信息是真的,再看在此基础上得到哪些结论,它们是否符合常理或说存在谬论;分析结论时,有时候答应也不一定是唯一的,只要能够 “自圆其说” 就行,现在题目会越来越灵活.
 

巩固练习

1(★)【多选题】甲、乙两名高中同学历次数学测试成绩 (百分制) 分别服从正态分布 N(μ1,σ21) ,N(μ2,σ22),其正态分布的密度曲线如图所示,则下列说法中正确的是 (  )
附:若随机变量 X 服从正态分布 N(μ,σ2),则 P(μσ<X<μ+σ)0.6826
image.png
A.乙同学的平均成绩优于甲同学的平均成绩
B.甲同学的平均成绩优于乙同学的平均成绩
C.甲同学的成绩比乙同学成绩更集中于平均值附近
D.若 σ1=5,则甲同学成绩高于 80 分的概率约为 0.1587
 

2(★) 为了研究不同性别在处理多任务时的表现差异,召集了男女志愿者各 300 名,让他们同时完成多个任务.以下 4 个结论中,对志愿者完成任务所需时间分布图表理解正确的是 (  )
①总体看女性处理多任务平均用时更短;
②所有女性处理多任务的能力都要优于男性;
③男性的时间分布更接近正态分布;
④女性处理多任务的用时为正数,男性处理多任务的用时为负数,且男性处理多任务的用时绝对值大.
image.png
A. (1)(4) B. (2)(3) C. (1)(3) D. (2)(4)
 

3(★★) 某批零件的尺寸 X 服从正态分布 N(10,σ2),且满足 P(X<9)=18,零件的尺寸与 10 的误差不超过 1 即合格,从这批产品中抽取 n 件,若要保证抽取的合格零件不少于 2 件的概率不低于 0.9,则 n 的最小值为 (  )
A.7 B.6 C.5 D.4
 

4(★★) 近几年,中国进入一个鲜花消费的增长期,某农户利用精准扶贫政策,贷款承包了一个新型温室鲜花大棚,种植和销售红玫瑰和白玫瑰.该农户从去年的销售数据中随机抽取了红玫瑰 10 天的销量数据如下 (单位:枝):
615575625590600600570615580630
(Ⅰ) 求这 10 天红玫瑰销量的平均数 ˉx 和方差 s2
(Ⅱ) 若这个大棚红玫瑰的日销量 X 服从正态分布 N(μ,σ2),其中 μ ,σ2 可分别用 (Ⅰ) 中的 ˉx s2 代替,白玫瑰的日销量 Y 服从正态分布 N(280,402),又已知红玫瑰的售价为 2 元 / 枝,白玫瑰的售价为 4 元 / 枝,预计今年哪种玫瑰的日销售额超过 1280 元的天数更多.
 
 
 

5(★★★)2019 年 2 月 13 日《烟台市全民阅读促进条例》全文发布,旨在保障全民阅读权利,培养全民阅读习惯,提高全民阅读能力,推动文明城市和文化强市建设.某高校为了解条例发布以来全校学生的阅读情况,随机调查了 200 名学生每周阅读时间 X(单位:小时) 并绘制如图所示的频率分布直方图.
(1) 求这 200 名学生每周阅读时间的样本平均数 ˉx 和样本方差 s2(同一组中的数据用该组区间的中间值代表);
(2) 由直方图可以认为,目前该校学生每周的阅读时间 X 服从正态分布 N(μ,σ2),其中 μ 近似为样本平均数 ˉxσ2 近似为样本方差 s2
(i) 一般正态分布的概率都可以转化为标准正态分布的概率进行计算:若 XN(μ,σ2),令 Y=Xμσ,则 YN(0,1),且 P(Xa)=P(Yaμσ)
利用直方图得到的正态分布,求 P(X10)
(ii) 从该高校的学生中随机抽取 20 名,记 Z 表示这 20 名学生中每周阅读时间超过 10 小时的人数,求 P(Z2)(结果精确到 0.0001) 以及 Z 的数学期望.
参考数据:178403 ,0.7734190.0076.若 YN(0,1),则 P(Y0.75)=0.7734
image.png
 
 
 

6(★★★) 新型冠状病毒最近在全国蔓延,具有很强的人与人之间的传染性,该病毒在进入人体后一般有 14 天的潜伏期,在这 14 天的潜伏期内患者无任何症状,为病毒传播的最佳时间.假设每位病毒携带者在潜伏期内每天有 n 位密切接触者,接触病毒携带者后被感染的概率为 p,每位密切接触者不用再接触其他病毒携带者.
(1) 求一位病毒携带者一天内感染的人数 X 的均值;
(2) 若 n=3p=13 时,从被感染的第一天算起,试计算某一位病毒携带者在 14 天潜伏期内,被他平均累计感染的人数 (用数字作答);
(3) 3 月 16 日 20 时 18 分,由我国军事科学院军事科学研究院陈薇院士领衔的科学团队,研制重组新型冠状病毒疫苗获批进入临床状态,新疫苗的使用,可以极大减少感染新型冠状病毒的人数,为保证安全性和有效性,某科研团队抽取 500 支新冠疫苗,观测其中某项质量指标值,得到如图频率分布直方图:
image.png
①求这 500 支该项质量指标值得样本平均值 ˉx(同一组的数据用该组区代表间的中点值);
②由直方图可以认为,新冠疫苗的该项质量指标值 Z 服从正态分布 N(μ,σ2),其中 μ 近似为样本平均数 ˉxσ2 近似为样本方差 s2,经计算可得这 500 支新冠疫苗该项指标值的样本方差 s2=150.现有 5 名志愿者参与临床试验,观测得出该项指标值分别为:206178195160229 试问新冠疫苗的该项指标值是否正常,为什么?
参考数据:150=12.2,若 ZN(μ,σ2),则 P(μσ<Z<μ+σ)=0.6827P(μ2σ<Z<μ+2σ)=0.9545P(μ3σ<Z<μ+3σ)=0.9973
 
 
 

7(★★★★)2019 年 7 月 1 日至 3 日,世界新能源汽车大会在海南博鳖召开,以 “新时代、新变革、新产业” 为主题,突出电动化、智能化、共享化融合发展特色.某汽车公司顺应时代潮流,新研发了一款新能源汽车,并在出厂前对 100 辆汽车进行了单次最大续航里程 (理论上是指新能源汽车所装载的燃料或电池所能够提供给车行驶的最远里程) 的测试.现对测试数据进行分析,得到如图所示的频率分布直方图.
(1) 估计这 100 辆汽车的单次最大续航里程的平均值 x(同一组中的数据用该组区间的中点值代表);
(2) 根据大量的汽车测试数据,可以认为这款汽车的单次最大续航里程 X 近似地服从正态分布 N(μ,σ2),用样本平均数 x 作为 μ 的近似值,用样本标准差 s 作为 σ 的估计值,经计算样本标准差 s 的近似值为 50,现任取一辆汽车,求它的单次最大续航里程恰在 250 千米到 400 千米之间的概率.
参考数据:若随机变量 ξ 服从正态分布 N(μ,σ2),则 P(μσ<ξμ+σ)0.6827
P(μ2σ<ξμ+2σ)0.9545P(μ3σ<ξμ+3σ)0.9973
(3) 某汽车销售公司为推广此款新能源汽车,现面向意向客户推出 “玩游戏,送大奖” 活动,客户可根据抛掷硬币的结果,操控微型遥控车在方格图上行进,若遥控车最终停在 “胜利大本营”,则可获得购车优惠券.已知硬币出现正反面的概率都是 12,方格图上标有第 0 格、第 1 格、第 2 格、…、第 50 格.遥控车开始在第 0 格,客户每掷一次硬币,遥控车向前移动一次,若掷出正面,遥控车向前移动一格 (从 k k+1),若掷出反面,遥控车向前移动两格 (从 k k+2),直到遥控车移到第 49 格 (胜利大本营) 或第 50 格 (失败大本营) 时,游戏结束.设遥控车移到第 n 格的概率为 Pn,试说明 {PnPn1} 是等比数列,并解释此方案能否成功吸引顾客购买该款新能源汽车.
image.png
 
 
 

参考答案

  1. 【答案】ACD
    【解析】由图象可知甲图象关于直线 x=75 对称,乙图象关于直线 x=85 对称,
    μ1=75,μ2=85
    A 正确,B 错误,
    甲图象比乙图象更 “高瘦”,
    甲的成绩比乙的成绩更集中于平均值左右,故 C 正确;
    σ1=5,则甲同学成绩高于 80 分的概率约为:10.68262=0.1587,故 D 正确.
    故选:ACD
  2. 【答案】C
    【解析】①女性处理多任务平均用时集中在 23 分钟,男性的集中在 34.5 分钟,即①正确;
    ②从图中可以看到男性与女性处理任务所需的时间有交叉,所以并不是 “所有女性都优于男性”,即②错误;
    ③根据正态分布的性质可知③正确;
    ④女性和男性处理多任务的用时均为正数,即④错误.
    故选:C
  3. 【答案】D
    【解析】X 服从正态分布 N(10,σ2),且 P(X<9)=18
    P(9<X<11)=34,即每个零件合格的概率为 34
    合格零件不少于 2 件的对立事件是合格零件个数为零个或一个.
    合格零件个数为零个或一个的概率为 C0n(14)n+C1n34(14)n1
    C0n(14)n+C1n34(14)n1<0.1
    (3n+1)(14)n<0.1
    f(n)=(3n+1)(14)n(nN)
    f(n+1)f(n)=3n+412n+4<1f(n) 单调递减,
    f(4)<0.1f(3)>0.1
    不等式 (3n+1)(14)n<0.1 的解集为 {nn4}
    n 的最小值为 4
    故选:D
  4. 【答案】1400 2 预计今年白玫瑰的日销售额超过 1280 元的天数更多
    【解析】(Ⅰ) 由条件可知,
    ˉx=110(615+575+625+590+600+600+570+615+580+630)=600
    s2=110(152+252+252+102+0+0+302+152+202+302)=400
    (Ⅱ) 由 (Ⅰ) 可知 XN(600,202)
    若红玫瑰的日销售额超过 1280 元,则需 X>640=600+2×20
    若白玫瑰的日销售额超过 1280 元,则需 Y>320=280+1×40
    根据正态分布的特征可知 P(X>640)<P(Y>320)
    即白玫瑰的日销售额超过 1280 元的概率更大,故预计今年白玫瑰的日销售额超过 1280 元的天数更多.
  5. 【答案】(1)1.78(2)(i)0.7734(ii)4.532
    【解析】(1)ˉx=6×0.03+7×0.1+8×0.2+9×0.35+10×0.19+11×0.09+12×0.04=9
    s2=(69)2×0.03+(79)2×0.1+(89)2×0.2+(99)2×0.35+(109)2×0.19+(119)2×0.09+(129)2×0.04=1.78
    (2)(i) 由题知 μ=9σ2=1.78XN(91.78)σ=1.78=1781043
    P(X10)=P(Y10943)=P(Y0.75)=0.7734
    (ⅱ) 由 (i) 知 P(X>10)=1P(X10)=0.2266
    可得 ZB(20,0.2266)
    P(Z2)=1P(Z=0)P(Z=1)
    =10.773420C120×0.2266×0.773419
    =1(0.7734+20×0.2266)×0.0076
    0.9597
    Z 的数学期望 E(Z)=20×0.2266=4.532
  6. 【答案】(1)np  (2) 8192 (3)200 ② 新冠肺炎的该项指标值不正常
    【解析】(1) 依题意可知 XB(np),则 E(X)=np
    故一天内被感染人数 X 的均值为 np
    (2) 不妨记前 m 天平均累计感染的人数为 am
    a1=1,a2=1+np,a3=(1+np)2,,am=(1+np)m1
    n=3p=13 时,一位病毒携带者在 14 天潜伏期内,被他平均累计感染的人数为:a14=(1+3×13)13=213=8192
    (3)①由频率分布直方图得,这 500 支该项指标值的样本平均值为:ˉx=170×0.02+180×0.09+190×0.22+200×0.33+210×0.24+220×0.08+230×0.02=200
    ②新冠肺炎该项指标值不正常,理由如下:
    由题意知 ZN(200150)P(μ3σ<Z<μ+3σ)=P(163.4<Z<236.6)=0.9973
    即该项指标落在 (163.4236.6) 之外的概率为 0.0027,是小概率事件.
    160(163.4236.6),根据 3σ 原则,新冠肺炎的该项指标值不正常.
  7. 【答案】1300 20.8186 3 见解析
    【解析】(1)ˉx=0.002×50×205+0.004×50×255+0.009×50×305+0.004×50×355+0.001×50×405=300(千米).
    (2) 由 XN(300502)
    P(250<X400)=0.95450.95450.68272=0.8186
    (3) 遥控车开始在第 0 格为必然事件,P0=1.第一次掷硬币出现正面,遥控车移到第一格,其概率为 12,即 P1=12
    遥控车移到第 n(2n49) 格的情况是下面两种,而且只有两种:
    ①遥控车先到第 n2 格,又掷出反面,其概率为 12Pn2
    ②遥控车先到第 n1 格,又掷出正面,其概率为 12Pn1
    Pn=12Pn2+12Pn1
    PnPn1=12(Pn1Pn2)
    1n49 时,数列 {PnPn1} 是等比数列,首项为 P1P0=12,公比为 12 的等比数列.
    P11=12,P2P1=(12)2,P3P2=(12)3,,PnPn1=(12)n
    Pn=(PnPn1)+(Pn1Pn2)++(P1P0)+P0
    =(12)n+(12)n1+12+1
    =1(12)n+11(12)=23[1(12)n+1](n=0149)
    遥控车停在 “胜利大本营” 的概率 P49=23[1(12)50]
    遥控车停在 “失败大本营” 的概率 P50=12P48=12×23[1(12)49]=13[1+(12)49]
    P49P50=23[1(12)50]13[1+(12)49]=13[1(12)48]>0
    遥控车停在 “胜利大本营” 的概率大.
    此方案能成功吸引顾客购买该款新能源汽车.
posted @   贵哥讲数学  阅读(1428)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 无需6万激活码!GitHub神秘组织3小时极速复刻Manus,手把手教你使用OpenManus搭建本
· Manus爆火,是硬核还是营销?
· 终于写完轮子一部分:tcp代理 了,记录一下
· 别再用vector<bool>了!Google高级工程师:这可能是STL最大的设计失误
· 单元测试从入门到精通
//更改网页ico // 实现数学符号与汉字间有间隙 //文章页加大页面,隐藏侧边栏
点击右上角即可分享
微信分享提示