8.3 列联表与独立性检验

\(\mathbf{{\large {\color{Red} {欢迎到学科网下载资料学习}} } }\)【高分突破系列】 高二数学下学期同步知识点剖析精品讲义
\(\mathbf{{\large {{\color{Red} {跟贵哥学数学,so \quad easy!}} }}}\)

选择性必修第三册同步提高,难度2颗星!

模块导图

知识剖析

\(2×2\)列联表

\(A ,B\)为两个变量,每一个变量各有两种等级\(A_1\)\(A_2\)\(B_1\)\(B_2\),将同时符合\((A_1,B_1)\),\((A_2,B_1)\),\((A_1,B_2)\),\((A_2,B_2)\)的个体数量排列成一个表格,这是列联表,如下表.
\(\begin{array}{|c|c|c|c|} \hline \text { 分类变量 } & A_1 & A_2 & \text { 合计 } \\ \hline B_1 & a & b & a+b \\ \hline B_2 & c & d & c+d \\ \hline \text { 合计 } & a+c & b+d & n=a+b+c+d \\ \hline \end{array}\)
 

独立性检验

根据\(2×2\)列联表中的数据判断两个变量\(A ,B\)是否独立的问题叫\(2×2\)列联表的独立性检验.

 

\(χ^2\)的计算公式

\[\chi^{2}=\dfrac{n(a d-b c)^{2}}{(a+b)(c+d)(a+c)(b+d)} \]

若要推断的论述为“\(A\)\(B\)有关系”,则\(χ^2\)的值越大,说明“\(A\)\(B\)有关系”成立的可能性越大.
如下表,
\(\begin{array}{|c|c|c|c|c|c|} \hline p\left(\chi^{2} \geq x_{\alpha}\right) & 0.1 & 0.05 & 0.010 & 0.005 & 0.001 \\ \hline x_{\alpha} & 2.706 & 3.841 & 6.635 & 7.879 & 10.828 \\ \hline \end{array}\)
\(\chi^{2}=8\)时,
因为\(8>7.879\),所以有\(1-0.005=99.5\%\)的把握认为\(A\)\(B\)之间有关;
\(8<10.828\),所以没有\(1-0.001=99.9\%\)的把握认为\(A\)\(B\)之间有关.

 

实际应用

应用独立性检验解决实际问题大致应包括以下几个主要环节
\((1)\)提出零假设\(H_{0}: X\)\(Y\)相互独立,并给出在问题中的解释;
\((2)\)根据抽样数据整理出\(2×2\)列联表,计算\(χ^2\)的值,并与临界值\(x_{\alpha}\)比较;
\((3)\)根据检验规则得出推断结论;
\((4)\)\(X\)\(Y\)不独立的情况下,根据需要,通过比较相应的频率,分析\(X\)\(Y\)间的影响规律.
 

经典例题

【典题1】 为了考察某种病毒疫苗的效果,现随机抽取\(100\)只小白鼠进行试验,得到如下\(2×2\)列联表:
\(\begin{array}{|c|c|c|c|} \hline & \text { 感染 } & \text { 末感染 } & \text { 总计 } \\ \hline \text { 服用 } & 10 & 40 & 50 \\ \hline \text { 末服用 } & 20 & 30 & 50 \\ \hline \text { 总计 } & 30 & 70 & 100 \\ \hline \end{array}\)
附:\(K^{2}=\dfrac{n(a d-b c)^{2}}{(a+b)(c+d)(a+c)(b+d)}\),其中\(n=a+b+c+d\)
\(\begin{array}{|c|c|c|c|c|c|c|} \hline P\left(K^{2} \geq k_{0}\right) & 0.10 & 0.05 & 0.025 & 0.010 & 0.005 & 0.001 \\ \hline k_{0} & 2.706 & 3.841 & 5.024 & 6.635 & 7.879 & 10.828 \\ \hline \end{array}\)
根据以上数据,得到的结论正确的是(  )
A.在犯错误的概率不超过\(2.5\%\)的前提下,认为“小白鼠是否被感染与有没有服用疫苗有关”
B.在犯错误的概率不超过\(2.5\%\)的前提下,认为“小白鼠是否被感染与有没有服用疫苗无关”
C.有\(95\%\)的把握认为“小白鼠是否被感染与有没有服用疫苗有关”
D.有\(95\%\)的把握认为“小白鼠是否被感染与有没有服用疫苗无关”
【解析】 由列联表中数据,计算\(K^{2}=\dfrac{100 \times(10 \times 30-20 \times 40)^{2}}{30 \times 70 \times 50 \times 50}=\dfrac{100}{21} \approx 4.762\),且\(3.841<4.762<5.024\)
所以有\(95\%\)的把握认为“小白鼠是否被感染与有没有服用疫苗有关”.
故选:\(C\)
 

【典题2】 近年来我国电子商务行业迎来篷布发张的新机遇,\(2015\)年双\(11\)期间,某购物平台的销售业绩高达\(918\)亿人民币,与此同时,相关管理部门推出了针对电商的商品和服务的评价体系,现从评价系统中选出200次成功交易,并对其评价进行统计,对商品的好评率为\(0.6\),对服务的好评率为\(0.75\),其中对商品和服务都做出好评的交易为\(80\)次.
(Ⅰ)完成商品和服务评价的\(2×2\)列联表,并说明是否可以在犯错误概率不超过\(0.1\%\)的前提下,认为商品好评与服务好评有关?
(Ⅱ)若将频率视为概率,某人在该购物平台上进行的5次购物中,设对商品和服务全好评的次数为随机变量.
①求对商品和服务全好评的次数的分布列(概率用组合数算式表示);
②求的数学期望和方差.
参考数据及公式如下:
\(\begin{array}{|c|c|c|c|c|c|c|c|} \hline P\left(K^{2} \geq k\right) & 0.15 & 0.10 & 0.05 & 0.025 & 0.010 & 0.005 & 0.001 \\ \hline k & 2.072 & 2.706 & 3.841 & 5.024 & 6.635 & 7.879 & 10.828 \\ \hline \end{array}\)
(\(K^{2}=\dfrac{n(a d-b c)^{2}}{(a+b)(c+d)(a+c)(b+d)}\),其中\(n=a+b+c+d\))
【解析】 (Ⅰ)由题意可得关于商品和服务评价的\(2×2\)列联表:
\(\begin{array}{|c|c|c|c|} \hline & \text { 对服务好评 } & \text { 对服务不满意 } & \text { 合计 } \\ \hline \text { 对商品好评 } & 80 & 40 & 120 \\ \hline \text { 对商品不满意 } & 70 & 10 & 80 \\ \hline \text { 合计 } & 150 & 50 & 200 \\ \hline \end{array}\)
\(K^{2}=\dfrac{200 \times(80 \times 10-40 \times 70)^{2}}{150 \times 50 \times 120 \times 80} \approx 11.111>10.828\)
可以在犯错误概率不超过\(0.1\%\)的前提下,认为商品好评与服务好评有关;
①每次购物时,对商品和服务全好评的概率为\(0.4\)
\(X\)的取值可以是\(0,1,2,3,4,5\)\(X~B(5,0.4)\)
\(P(X=0)=0.6^{5}\)\(P(X=1)=C_{5}^{1} \cdot 0.4 \cdot 0.6^{4}\)\(P(X=2)=C_{5}^{2} \cdot 0.4^{2} \cdot 0.6^{3}\)\(P(X=3)=C_{5}^{3} \cdot 0.4^{3} \cdot 0.6^{2}\)\(P(X=4)=C_{5}^{4} \cdot 0.4^{4} \cdot 0.6\)\(P(X=5)=0.4^{5}\)
\(X\)的分布列
\(\begin{array}{|c|c|c|c|c|c|c|} \hline X & 0 & 1 & 2 & 3 & 4 & 5 \\ \hline P & 0.6^{5} & C_{5} 1 \cdot 0.4 \cdot 0.6^{4} & C_{5}^{2} \cdot 0.4^{2} \cdot 0.6^{3} & C_{5}^{3} \cdot 0.4^{3} \cdot 0.6^{2} & C_{5}^{4} \cdot 0.4^{4} \cdot 0.6 & 0.4^{5} \\ \hline \end{array}\)
\(E X=5 \times 0.4=2, \quad D X=5 \times 0.4 \times 0.6=1.2\)
 

【典题3】近期,湖北省武汉市等多个地区发生新型冠状病毒感染的肺炎疫情.为了尽快遏制住疫情,我国科研工作者坚守在科研一线,加班加点、争分夺秒与病毒抗争,夜以继日地进行研究.新型冠状病毒的潜伏期检测是疫情控制的关键环节之一.在传染病学中,通常把从致病刺激物侵入机体或对机体发生作用起,到机体出现反应或开始呈现该疾病对应的相关症状时止的这一阶段称为潜伏期.钟南山院士带领的研究团队统计了武汉市某地区\(10000\)名医学观察者的相关信息,并通过咽拭子核酸检测得到1000名确诊患者的信息如表格:
\(\begin{array}{|c|c|c|c|c|} \hline \text { 潜伏期(单位:天) } & {[0,7]} & (7,14] & (14,21] & (21,28] \\ \hline \text { 人数 } & 800 & 190 & 8 & 2 \\ \hline \end{array}\)
(1)求这\(1000\)名确诊患者的潜伏期样本数据的平均数\(\bar{x}\)(同一组数据用该组数据区间的中点值代表).
(2)新型冠状病毒的潜伏期受诸多因素影响,为了研究潜伏期与患者性别的关系,以潜伏期是否超过天为标准进行分层抽样,从上述\(1000\)名患者中抽取\(100\)名,得到如下列联表.请将列联表补充完整,并根据列联表判断是否有\(90\%\)的把握认为潜伏期与患者性别有关.
\(\begin{array}{|c|c|c|c|} \hline & \text { 潜伏期} \leq 7\text { 天 } & \text { 潜伏期 }>7 \text { 天 } & \text { 总计 } \\ \hline \text { 男性患者 } & & 12 & \\ \hline \text { 务性患者 } & & & 50 \\ \hline \text { 总计 } & & & 100 \\ \hline \end{array}\)
(3)由于采样不当、标本保存不当、采用不同类型的标本以及使用不同厂家试剂都可能造成核酸检测结果“假阴性”而出现漏诊.当核酸检测呈阴性时,需要进一步进行血清学\(IgM/IgG\)抗体检测,以弥补核酸检测漏诊的缺点.现对\(10\)名核酸检测结果呈阴性的人员逐一地进行血清检测,记每个人检测出\(IgM\)(\(IgM\)是近期感染的标志)呈阳性的概率为\(p(0<p<1)\)且相互独立,设至少检测了\(9\)个人才检测出\(IgM\)呈阳性的概率为\(f(p)\),求\(f(p)\)取得最大值时相应的概率\(p\)
附:\(K^{2}=\dfrac{n(a d-b c)^{2}}{(a+b)(c+d)(a+c)(b+d)}\),其中\(n=a+b+c+d\)
\(\begin{array}{|c|c|c|c|c|c|c|} \hline P\left(K^{2} \geq k_{0}\right) & 0.100 & 0.050 & 0.025 & 0.010 & 0.005 & 0.001 \\ \hline k_{0} & 2.706 & 3.841 & 5.024 & 6.635 & 7.879 & 10.828 \\ \hline \end{array}\)
【解析】 (1) \(\bar{x}=3.5 \times \dfrac{800}{1000}+10.5 \times \dfrac{190}{1000}+17.5 \times \dfrac{8}{1000}+24.5 \times \dfrac{2}{1000}=4.984\)
\({\color{Red}{(相当于求频率直方图中的平均数,其等于每组组中值每组概率) }}\)
(2)补充完整的\(2×2\)列联表如下所示,
\(\begin{array}{|c|c|c|c|} \hline & \text { 潜伏期 }\leq 7 \text { 天 } & \text { 潜伏期 }>7 \text { 天 } & \text { 总计 } \\ \hline \text { 男性患者 } & 38 & 12 & 50 \\ \hline \text { 务性患者 } & 42 & 8 & 50 \\ \hline \text { 总计 } & 80 & 20 & 100 \\ \hline \end{array}\)
\(\therefore K^{2}=\dfrac{100 \times(38 \times 8-12 \times 42)^{2}}{50 \times 50 \times 80 \times 20}=1<2.706\)
\(∴\)不能有\(90\%\)的把握认为潜伏期与患者性别有关.
\({\color{Red}{(套用公式求出值,再查表确认分类变量是否有关) }}\)
(3)由\(f(p)=p(1-p)^{8}+p(1-p)^{9}\),化简得\(f(p)=p(1-p)^{8}(2-p)\)
\(1-p=x \in(0,1)\),则\(p=1-x\)\(f(p)=(1-x) x^{8}(1+x)=\left(1-x^{2}\right) x^{8}\)
\(g(x)=\left(1-x^{2}\right) x^{8}\)\(x∈(0 ,1)\),则\(g^{\prime}(x)=2 x^{7}\left(4-5 x^{2}\right)\)
\(g^{\prime}(x)>0\),则\(0<x<\dfrac{2 \sqrt{5}}{5}\);令\(g^{\prime}(x)<0\),则\(\dfrac{2 \sqrt{5}}{5}<x<1\)
\(\therefore g(x)\)\(\left(0, \dfrac{2 \sqrt{5}}{5}\right)\)上单调递增,在\(\left(\dfrac{2 \sqrt{5}}{5}, 1\right)\)上单调递减,
\(∴g(x)\)有唯一的极大值为\(g\left(\dfrac{2 \sqrt{5}}{5}\right)\),也是最大值.
\(∴\)\(x=\dfrac{2 \sqrt{5}}{5}\),即\(p=1-\dfrac{2 \sqrt{5}}{5}\)时,\(f(p)\)取得最大值.
【点拨】注意理解\(K^{2}=\dfrac{n(a d-b c)^{2}}{(a+b)(c+d)(a+c)(b+d)}\)值与小概率值和对应临界值的表格之间的关系.
 

巩固练习

1(★) 在研究肥胖与高血压的关系时,通过收集数据、整理分析数据得到“高血压与肥胖有关”的结论,并且在犯错误的概率不超过\(0.01\)的前提下认为这个结论是成立的,下列说法中正确的是(  )
A.在\(100\)个肥胖的人中至少有\(99\)人患有高血压
B.肥胖的人至少有\(99\%\)的概率患有高血压
C.在\(100\)个高血压患者中一定有肥胖的人
D.在\(100\)个高血压患者中可能没有肥胖的人
 

2(★) 某校为了解学生“玩手机游戏”和“学习成绩”是否有关,随机抽取了\(100\)名学生,运用\(2×2\)列联表进行独立性检验,经计算得到\(K^{2}=3.936\),所以判定玩手机游戏与学习成绩有关系,那么这种判断出错的可能性为(  )
\(\begin{array}{|c|c|c|c|c|c|c|c|c|c|c|} \hline P\left(K^{2} \geq k_{0}\right) & 0.50 & 0.40 & 0.25 & 0.15 & 0.10 & 0.05 & 0.025 & 0.01 & 0.005 & 0.001 \\ \hline k_{0} & 0.455 & 0.708 & 1.323 & 2.072 & 2.706 & 3.841 & 5.024 & 6.635 & 7.879 & 10.83 \\ \hline \end{array}\)
A. \(1 \%\) \(\qquad \qquad \qquad \qquad\)B. \(5 \%\) \(\qquad \qquad \qquad \qquad\)C. \(95 \%\) \(\qquad \qquad \qquad \qquad\)D. \(99 \%\)
 

3(★) 为了研究高中学生对乡村音乐的态度(喜欢和不喜欢两种态度)与性别的关系,运用列联表进行独立性检验,经计算\(K^{2}=8.01\),附表如表:
\(\begin{array}{|c|c|c|c|c|c|} \hline P\left(K^{2} \geq k_{0}\right) & 0.100 & 0.050 & 0.025 & 0.010 & 0.001 \\ \hline k_{0} & 2.706 & 3.841 & 5.024 & 6.635 & 10.828 \\ \hline \end{array}\)
参照附表,得到的正确的结论是(  )
A.有\(99\%\)以上的把握认为“喜欢乡村音乐与性别有关”
B.有\(99\%\)以上的把握认为“喜欢乡村音乐与性别无关”
C.在犯错误的概率不超过\(0.1\%\)的前提下,认为“喜欢乡村音乐与性别有关”
D.在犯错误的概率不超过\(0.1\%\)的前提下,认为“喜欢乡村音乐与性别无关”
 

4(★) 【多选题】“一粥一饭,当思来之不易”,道理虽简单,但每年我国还是有2000多亿元的餐桌浪费,被倒掉的食物相当于2亿多人一年的口粮.为营造“节约光荣,浪费可耻”的氛围,某市发起了“光盘行动”.某机构为调研民众对“光盘行动”的认可情况,在某大型餐厅中随机调查了90位来店就餐的客人,制成如表所示的列联表,通过计算得到\(K^2\)的观测值为\(9\).已知\(P\left(K^{2} \geq 6.635\right)=0.010\)\(P\left(K^{2} \geq 10.828\right)=0.001\),则下列判断正确的是(  )
\(\begin{array}{|c|c|c|} \hline & \text { 认可 } & \text { 不认可 } \\ \hline 40 \text { 岁以下 } & 20 & 20 \\ \hline 40 \text { 岁以上(含40岁) } & 40 & 10 \\ \hline \end{array}\)
A.在该餐厅用餐的客人中大约有\(66.7\%\)的客人认可“光盘行动”
B.在该餐厅用餐的客人中大约有\(99\%\)的客人认可“光盘行动”
C.有\(99\%\)的把握认为“光盘行动”的认可情况与年龄有关
D.在犯错误的概率不超过\(0.001\)的前提下,认为“光盘行动”的认可情况与年龄有关
 

5(★) 某网络平台从购买该平台某课程的客户中,随机抽取了\(100\)位客户的数据,并将这\(100\)个数据按学时数,客户性别等进行统计,整理得到如表;
\(\begin{array}{|c|c|c|c|c|c|c|c|} \hline \text { 学时数 } & {[5,10)} & {[10,15)} & {[15,20)} & {[20,25)} & {[25,30)} & {[30,35)} & {[35,40)} \\ \hline \text { 男性 } & 18 & 12 & 9 & 9 & 6 & 4 & 2 \\ \hline \text { 女性 } & 2 & 4 & 8 & 2 & 7 & 13 & 4 \\ \hline \end{array}\)
(1)根据上表估计男性客户购买该课程学时数的平均值(同一组中的数据用该组区间的中点值作代表,结果保留小数点后两位);
(2)从这\(100\)位客户中,对购买该课程学时数在以下的女性客户按照分层抽样的方式随机抽取\(7\)人,再从这\(7\)人中随机抽取\(2\)人,求这\(2\)人购买的学时数都不低于\(15\)的概率.
(3)将购买该课程达到\(25\)学时及以上者视为“十分爱好该课程者”,\(25\)学时以下者视,为“非十分爱好该课程者”.请根据已知条件完成以下\(2×2\)列联表,并判断是否有\(99.9\%\)的把握认为“十分爱好该课程者”与性别有关?
\(\begin{array}{|c|l|l|l|} \hline & \text { 非十分爱好该课程者 } & \text { 十分爱好该课程者 } & \text { 合计 } \\ \hline \text { 男性 } & & & \\ \hline \text { 女性 } & & & \\ \hline \text { 合计 } & & & 100 \\ \hline \end{array}\)
附:\(K^{2}=\dfrac{n(a d-b c)^{2}}{(a+b)(c+d)(a+c)(b+d)}\),其中\(n=a+b+c+d\)
\(\begin{array}{|c|c|c|c|c|c|} \hline P\left(K^{2} \geq k_{0}\right) & 0.100 & 0.050 & 0.025 & 0.010 & 0.001 \\ \hline k 0 & 2.706 & 3.841 & 5.024 & 6.635 & 10.828 \\ \hline \end{array}\)
 
 
 

6(★★) “低碳出行”,一种降低“碳”的出行,以低能耗、低污染为基础,是环保的深层次体现,在众多发达国家被广大民众接受并执行,\(S\)市即将投放一批公共自行车以方便市民出行,减少污染,缓解交通拥堵,现先对\(100\)人做了是否会考虑选择自行车出行的调查,结果如表.
(1)如果把45周岁以下人群定义为“青年”,完成下列\(2×2\)列联表,并问你有多少把握认为该地区市民是否考虑单车与他(她)是不是“青年人”有关?
\(\begin{array}{|c|c|c|} \hline \text { 年龄 } & \text { 考虑骑车 } & \text { 不考虑骑车 } \\ \hline 15 \text { 以下 } & 6 & 3 \\ \hline[15,30) & 16 & 6 \\ \hline[30,45) & 13 & 6 \\ \hline[45,60) & 14 & 16 \\ \hline[60,75) & 5 & 9 \\ \hline 75 \text { 以上 } & 1 & 5 \\ \hline \text { 合计 } & 55 & 45 \\ \hline \end{array}\)
\(\begin{array}{|c|c|c|c|} \hline & \text { 骑车 } & \text { 不骑车 } & \text { 合计 } \\ \hline 45 \text { 岁以下 } & & & \\ \hline 45 \text { 岁以上 } & & & 100 \\ \hline \text { 合计 } & & & \\ \hline \end{array}\)
\(\begin{array}{|c|c|c|c|c|c|c|c|} \hline p\left(K^{2} \geq k\right) & 0.15 & 0.10 & 0.05 & 0.025 & 0.010 & 0.005 & 0.001 \\ \hline k & 2.07 & 2.70 & 3.84 & 5.02 & 6.63 & 7.87 & 10.82 \\ \hline \end{array}\)
参考:\(K^{2}=\dfrac{n(a d-b c)^{2}}{(a+b)(c+d)(a+c)(b+d)}\),其中\(n=a+b+c+d\)
(2)\(S\)市为了鼓励大家骑自行车上班,为此还专门在几条平时比较拥堵的城市主道建有无障碍自行车道,该市市民小明家离上班地点\(10km\),现有两种.上班方案给他选择;
方案一:选择自行车,走无障碍自行车道以\(19km/h\)的速度直达上班地点.
方案二:开车以\(30km/h\)的速度上班,但要经过\(A、B、C\)三个易堵路段,三个路段堵车的概率分别是\(\dfrac{1}{2}\)\(\dfrac{1}{2}\)\(\dfrac{1}{3}\),且是相互独立的,并且每次堵车的时间都是\(10\)分钟(假设除了堵车时间其他时间都是匀速行驶)
若仅从时间的角度考虑,请你给小明作一个选择,并说明理由.
 
 
 

7(★★) 2020年初,新型冠状病毒\((2019-nCoV)\)肆虐,全民开启防疫防控.新型冠状病毒的传染主要是人与人之间进行传播,感染人群年龄大多数是\(40\)岁以上人群.该病毒进入人体后有潜伏期,潜伏期是指病原体侵入人体至最早出现临床症状的这段时间.潜伏期越长,感染到他人的可能性越高,现对\(200\)个病例的潜伏期(单位:天)进行调查,统计发现潜伏期平均数为\(7.1\),方差为\(2.25^2\).如果认为超过8天的潜伏期属于“长潜伏期”,按照年龄统计样本,得到下面的列联表:
\(\begin{array}{|c|c|c|} \hline \text { 年龄/人数 } & \text { 长期潜伏 } & \text { 非长期潜伏 } \\ \hline 40 \text { 岁以上 } & 30 & 110 \\ \hline 40 \text { 岁及40岁以下 } & 20 & 40 \\ \hline \end{array}\)
(1)是否有\(95\%\)的把握认为“长期潜伏”与年龄有关;
(2)假设潜伏期\(X\)服从正态分布\(N\left(\mu, \sigma^{2}\right)\),其中\(μ\)近似为样本平均数\(\bar{x}\)\(\sigma^{2}\)近似为样本方差\(S^{2}\)
\((i)\)现在很多省份对入境旅客一律要求隔离天,请用概率的知识解释其合理性;
\((ii)\)以题目中的样本频率估计概率,设\(1000\)个病例中恰有\(k(k∈N^*)\)个属于“长期潜伏”的概率是\(g(k)\),当\(k\)为何值时,\(g(k)\)取得最大值.
附:\(K^{2}=\dfrac{n(a d-b c)^{2}}{(a+b)(c+d)(a+c)(b+d)}\),其中\(n=a+b+c+d\)
\(\begin{array}{|c|c|c|c|} \hline P\left(X^{2} \geq x_{0}\right) & 0.1 & 0.05 & 0.010 \\ \hline x_{0} & 2.706 & 3.841 & 6.635 \\ \hline \end{array}\)
\(\xi \sim N\left(\mu, \sigma^{2}\right)\),则\(P(μ-σ<ξ<μ+σ)=0.6862\)\(P(μ-2σ<ξ<μ+2σ)=0.9544\)\(P(μ-3σ<ξ<μ+3σ)=0.9974\)
 
 
 

参考答案

  1. 【答案】 \(D\)
    【解析】 “高血压与肥胖有关”,并且在犯错误的概率不超过\(0.01\)的前提下认为这个结论是成立的,
    表示有\(99\%\)的把握认为这个结论成立,与多少个人患高血压没有关系,
    也不是说“肥胖的人就是至少有\(99\%\)的概率患有高血压”,
    只有选项\(D\)正确.
    故选:\(D\)
  2. 【答案】 \(B\)
    【解析】 根据题意知,\(K^{2}=3.936>3.841\)
    所以判定玩手机游戏与学习成绩有关系,这种判断出错的可能性为\(5\%\)
    故选:\(B\)
  3. 【答案】 \(A\)
    【解析】 \(\because K^{2}=8.01>6.635\)
    \(∴\)在犯错误概率不超过\(0.01\)的前提下认为“喜欢乡村音乐与性别有关”,
    即有\(99\%\)以上的把握认为“喜欢乡村音乐与性别有关”.
    故选:\(A\)
  4. 【答案】 \(AC\)
    【解析】 \(\because K^{2}\)的观测值为\(9\),且\(P\left(K^{2} \geq 6.635\right)=0.010\)\(P\left(K^{2} \geq 10.828\right)=0.001\)
    \(∵9>6.635\),但\(9<10.828\)
    \(∴\)\(99\%\)的把握认为“光盘行动”的认可情况与年龄有关,
    或者说,在犯错误的概率不超过\(0.010\)的前提下,认为“光盘行动”的认可情况与年龄有关,
    所以选项\(C\)正确,选项\(D\)错误,
    由表可知认可“光盘行动”的人数为\(60\)人,
    所以在该餐厅用餐的客人中认可“光盘行动”的比例为\(\dfrac{60}{90} \times 100 \% \approx 66.7 \%\)
    故选项\(A\)正确,选项\(B\)错误,
    故选:\(AC\)
  5. 【答案】 \((1)16.92 \quad (2) \dfrac{2}{7} \quad(3)有99.9\%\)的把握认为“十分爱好该课程者”与性别有关
    【解析】 (1)由题意知,在\(100\)位购买该课程的客户中,男性客户购买该课程学时数的平均值为\(\bar{x}=\dfrac{1}{60}(7.5 \times 18+12.5 \times 12+17.5 \times 9+\)\(22.5 \times 9+27.5 \times 6+32.5 \times 4+37.5 \times 2) \approx 16.92\)
    所以估计男性客户购买该课程学时数的平均值为\(16.92\)
    ( 2)设“所抽取的\(2\)人购买的学时数都不低于\(15\)为事件\(A\)
    依题意按照分层抽样的方式分别在学时数为\([5,10)\)\([10,15)\)\([15,20)\)的女性客户中抽取\(1\)人(设为\(a\)),\(2\)人(设为\(A\)\(B\)),\(4\)人(设为\(C_{1}, C_{2}, C_{3}, C_{4}\)),从7人中随机抽取\(2\)人所包含的基木事件为:
    \(a A, a B, a c_{1}, a c_{2}, a c_{3}, a c_{4}, A B, A c_{1}, A c_{2}, A c_{3}, A c_{4}, B c_{1}, B c_{2},\)\(B c_{3}, B c_{4}, c_{1} c_{2}, c_{1} c_{3}, c_{1} c_{4}, c_{2} c_{3}, c_{2} c_{4},c_{3} c_{4}\)\(21\)种,其中事件\(A\)所包含的基本事件为:\(c_{1} c_{2}, c_{1} c_{3}, c_{1} c_{4}, c_{2} c_{3}, c_{2} c_{4}, c_{3} c_{4}\),共\(6\)个,
    则事件\(A\)发生的概率\(P=\dfrac{6}{21}=\dfrac{2}{7}\)
    (3)依题意得\(2×2\)列联表如下
    \(\begin{array}{|c|c|c|c|} \hline & \text { 非十分爱好该课程者 } & \text { 十分爱好该课程者 } & \text { 合计 } \\ \hline \text { 男性 } & 48 & 12 & 60 \\ \hline \text { 女性 } & 16 & 24 & 40 \\ \hline \text { 合计 } & 64 & 36 & 100 \\ \hline \end{array}\)
    \(16.667>10.828\)
    故有\(99.9\%\)的把握认为“十分爱好该课程者”与性别有关.
  6. 【答案】 (1)\(99.5\%\)把握认为该地区市民是否考虑单车与他(她)是不是“青年人”有关(2)方案二
    【解析】 (1)根据题目所给的数据填写\(2×2\)列联表如下:
    \(\begin{array}{|c|c|c|c|} \hline & \text { 骑车 } & \text { 不骑车 } & \text { 合计 } \\ \hline 45 \text { 岁以下 } & 35 & 15 & 50 \\ \hline 45 \text { 岁以上 } & 20 & 30 & 50 \\ \hline \text { 合计 } & 55 & 45 & 100 \\ \hline \end{array}\)
    \(K^{2}=\dfrac{n(a d-b c)^{2}}{(a+b)(a+c)(c+d)(b+d)}=\dfrac{100 \times(35 \times 30-15 \times 20)^{2}}{55 \times 45 \times 50 \times 50} \approx9.09>7.87\)
    故有\(99.5\%\)把握认为该地区市民是否考虑单车与他(她)是不是“青年人”有关;
    (2)方案一:选择自行车,走无障碍自行车道以\(19km/h\)的速度直达上班地点.
    则所需时间为:\(t_{1}=\dfrac{10}{19} h\)
    方案二:开车以\(30km/h\)的速度上班,但要经过\(A、B、C\)三个易堵路段,分别令三个路段堵车的事件为\(A、B、C\)
    因为三个路段堵车的概率分别是\(\dfrac{1}{2}\)\(\dfrac{1}{2}\)\(\dfrac{1}{3}\),且是相互独立的,并且每次堵车的时间都是\(10\)分钟(假设除了堵车时间其他时间都是匀速行驶)
    则在路上遇上堵车的概率为:
    \(P=1-P(\bar{A} \cdot \bar{B} \cdot \bar{B})=1-P(\bar{A}) \cdot P(\bar{B})\cdot P( \bar{B}))\)\(=1-[1-P(A)][1-P(B)][1-P(C)]=1-\dfrac{1}{2} \times \dfrac{1}{2} \times \dfrac{2}{3}=\dfrac{5}{6}\)
    故选择方案二上班所需时间为\(t_{2}=\dfrac{10}{30}+\dfrac{5}{6} \times \dfrac{1}{6}=\dfrac{17}{36} h\)
    因为\(t_{1}>t_{2}\)
    若仅从时间的角度考虑,应选方案二省时间.
  7. 【答案】 \((1)\)没有的把握认为“长期潜伏”与年龄有关 \((2)250\)
    【解析】 (1)\(X^{2}=\dfrac{200 \times(30 \times 40-110 \times 20)^{2}}{50 \times 150 \times 140 \times 60}=\dfrac{200}{63} \approx 3.175<3.841\)
    故没有\(95\%\)的把握认为“长期潜伏”与年龄有关.
    (2)由题可知,潜伏期\(X \sim N\left(7.1,2.25^{2}\right)\)
    \(P(X \geq 13.85)=\dfrac{1-0.9974}{2}=0.0013\)
    由于\(P\)的值很小,故对入境旅客要求隔离\(14\)天合理.
    以样本频率估计概率,则任意抽取一个病例,属于“长期潜伏”的概率为\(\dfrac{50}{200}=\dfrac{1}{4}\)\(g(k)=C_{1000}^{k} \cdot\left(\dfrac{1}{4}\right)^{k} \cdot\left(\dfrac{3}{4}\right)^{1000-k}\)
    \(g(k)\)最大,则\(\left\{\begin{array}{l} g(k) \geq g(k-1) \\ g(k) \geq g(k+1) \end{array}\right.\),即\(\left\{\begin{array}{l} C_{1000}^{k} \cdot\left(\dfrac{1}{4}\right)^{k} \cdot\left(\dfrac{3}{4}\right)^{1000-k} \geq C_{1000}^{k-1} \cdot\left(\dfrac{1}{4}\right)^{k-1} \cdot\left(\dfrac{3}{4}\right)^{1001-k} \\ C_{1000}^{k} \cdot\left(\dfrac{1}{4}\right)^{k} \cdot\left(\dfrac{3}{4}\right)^{1000-k} \geq C_{1000}^{k+1} \cdot\left(\dfrac{1}{4}\right)^{k+1} \cdot\left(\dfrac{3}{4}\right)^{999-k} \end{array}\right.\)
    解得\(\dfrac{997}{4} \leq k \leq \dfrac{1001}{4}\)
    因为\(k∈N^*\),所以\(k=250\)
    故当\(k=250\)时,\(g(k)\)取得最大值.
posted @ 2022-03-04 18:43  贵哥讲数学  阅读(3399)  评论(3编辑  收藏  举报
//更改网页ico // 实现数学符号与汉字间有间隙 //文章页加大页面,隐藏侧边栏