9.2.3 总体集中趋势的估计
\({\color{Red}{欢迎到学科网下载资料学习 }}\)
[ 【基础过关系列】高一数学同步精品讲义与分层练习(人教A版2019)]
(https://www.zxxk.com/docpack/2921718.html)
\({\color{Red}{ 跟贵哥学数学,so \quad easy!}}\)
必修第二册同步巩固,难度2颗星!
基础知识
众数、平均数、中位数
对于一组数据\(x_1\),\(x_2\),…,\(x_n\),出现次数最多的是众数、平均数 \(\bar{x}=\dfrac{x_1+x_2+\cdots+x_n}{n}\),中位数就是\(50%\)分位数.
【例】 一组数据\(1\),\(2\),\(3\),\(3\),\(4\),\(5\)的众数、平均数、中位数.
解 众数是\(3\),平均数\(\bar{x}=\dfrac{1+2+3+3+4+5}{6}=3\),中位数是 \(\dfrac{3+3}{2}=3\).
总体集中趋势的估计
(1)众数、平均数、中位数从不同角度刻画了一组数据的集中趋势.
(2)一般来说,对一个单峰的频率分布直方图来说,如果直方图的形状是对称的,那么平均数和中位数应该大体上差不多;如果直方图在右边“拖尾”,那么平均数大于中位数;如果直方图在左边“拖尾”,那么平均数小于中位数.
(3)众数只告诉我们它出现次数最多,但并不清楚它比其他数值多的程度,它对极端值不敏感.
(4)一般地,对数值型数据(如用水量,身高,收入,产量等)集中趋势的描述,可以用平均数、中位数;而对分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用众数.
基本方法
【题型1】 众数、平均数、中位数的概念
【典题1】 某学校要订制高一年级的校服,学生根据厂家提供的参考身高选择校服规格.据统计,高一年级男生需要不同规格校服的频数如表所示:
校服规格 | \(155\) | \(160\) | \(165\) | \(170\) | \(175\) | 合计 |
---|---|---|---|---|---|---|
频数 | \(40\) | \(65\) | \(168\) | \(90\) | \(26\) | \(389\) |
如果用一个量来代表该校高一年级男生所需校服的规格,那么在平均数、中位数、众数、第\(25\)百分位数中,哪个量比较合适?( )
A.平均数 \(\qquad \qquad \qquad \qquad\) B.中位数 \(\qquad \qquad \qquad \qquad\) C.众数 \(\qquad \qquad \qquad \qquad\) D.第\(25\)百分位数
解析 平均数为\(164.96\),中位数为\(165\),众数为\(165\),第\(25\)百分位数为\(160\);
显然,第\(25\)百分位数160不能代表该校高一年级男生所需校服的规格;
中位数不能描述数据的集中趋势,若选为数据的代表可靠性比较差;
平均数可以用来描述一组数据的整体平均情况,但是容易受到极端数据的影响.
在本题的数据中,“\(165\)”的男生的频数最高,且明显高于其他规格,所以用众数\(165\)作为该校高一年级男生校服的规格比较合适.
故选:\(C\).
【典题2】为了更好了解高中学生的身高发情况,现抽取某中学高一年级的学生作为样本,其中某班的\(24\)位男生身高由低到高排序情况如下:
163.0,165.0,165.0,166.0,167.0,168.0,168.0,169.0,170.0,170.0,171.0,171.0,
172.0,172.0,172.0,173.0,173.0,174.0,174.0,175.0,175.0,176.0,177.0,178.0
(单位:\(cm\))
则这\(24\)个数据的中位数、众数,中位数之和为\(\underline{\quad \quad}\) .
解析 这\(24\)个数据的中位数为 \(\dfrac{171+172}{2}=171.5\),众数为\(172\),
平均数 \(\bar{x}=\)\(170+\dfrac{-7-5-5-4-3-2-2-1+1+1+2+2+2+3+3+4+4+5+5+6+7+8}{24}\)\(=171\).
则中位数、众数,中位数之和为\(171.5+172+171=514.5\).
点拨 本题中数值较大,求平均值\(\bar{x}\)时,可估计其值为\(a=170\),再求各数值与估值\(a\)之差的平均值 \(b=\)\(\dfrac{-7-5-5-4-3-2-2-1+1+1+2+2+2+3+3+4+4+5+5+6+7+8}{24}=1\),则 \(\bar{x}=a+b=171\),这样可减低计算量.
【典题3】由\(8\)个整数形成的样本数据中,至少有六个互不相同的整数,若平均数、中位数、唯一的众数和极差都是\(8\),则可能成为样本数据中的最大整数是\(\underline{\quad \quad}\).
解析 依题意,平均数\(=\)中位数\(=\)众数\(=8\),
因为存在众数且众数唯一,所以可设这\(8\)个整数为\(x_1\),\(x_2\),\(x_3\),\(8\),\(8\),\(x_4\),\(x_5\),\(x_6\),
且\(x_1<x_2<x_3<8=8<x_4<x_5<x_6\),
因为极差为\(8\),所以\(x_6-x_1=8\),
因为平均数为\(8\),所以\(x_1+x_2+x_3+x_4+x_5+x_6=48\),
\(x_3\)最大值为\(7\),则\(x_1\)的最大值为\(5\);\(x_4\)的最小值为\(9\),则\(x_6\)的最小值为\(11\);
当\(x_1=5\)时,\(x_6=13\),\(x_2=6\),\(x_3=7\),\(x_4+x_5=17\),\(x_4\),\(x_5\)没有满足题意的数值,故不成立;
当\(x_1=4\)时,\(x_6=12\),\(x_2+x_3+x_4+x_5=32\),则\(x_2=6\),\(x_3=7\),\(x_4=9\),\(x_5=10\)满足题意,故\(x_6=12\);
当\(x_1=3\)时,\(x_6=11\),则\(x_4=9\),\(x_5=10\),\(x_2+x_3=15\),\(x_2\),\(x_3\)没有满足题意的数值,故不成立;
当\(x_1=2\)时,\(x_6=10<11\),故不成立;
故答案为:\(12\).
【巩固练习】
1.某校“校园歌手”比赛中,某选手获得的原始评分为\(x_1\),\(x_2\),\(x_3\),\(x_4\),\(x_5\),\(x_6\),\(x_7\),去掉一个最高分和一个最低分后得到有效评分,则有效评分与原始评分相比较,一定不变的特征数是( )
A.众数 \(\qquad \qquad \qquad \qquad\) B.平均数 \(\qquad \qquad \qquad \qquad\) C.中位数 \(\qquad \qquad \qquad \qquad\) D.方差
2.长春地铁\(1\)号线的开通运营,极大方便了市民的出行.某时刻从卫星广场站驶往宽平大路站的过程中,\(10\)个车站上车的人数统计如下:\(70\),\(60\),\(60\),\(60\),\(50\),\(40\),\(40\),\(30\),\(30\),\(10\).
这组数据的平均数,众数,\(80\%\)分位数的和为( )
A.\(125\) \(\qquad \qquad \qquad \qquad\) B.\(135\) \(\qquad \qquad \qquad \qquad\) C.\(165\) \(\qquad \qquad \qquad \qquad\) D.\(170\)
3.已知一组数据\(5\),\(2\),\(x\),\(5\),\(8\),\(9\),且\(5<x<8\).若该组数据的众数是中位数的 \(\dfrac{5}{6}\)倍,则该组数据的平均数为( )
A.\(6\) \(\qquad \qquad \qquad \qquad\) B.\(6.5\) \(\qquad \qquad \qquad \qquad\) C.\(7\) \(\qquad \qquad \qquad \qquad\) D.\(7.5\)
4.为了普及环保知识,某学校随机抽取了\(30\)名学生参加环保知识测试,得分(十分制,单位:分)的统计数据如表:
得分 | \(3\) | \(4\) | \(5\) | \(6\) | \(7\) | \(8\) | \(9\) | \(10\) |
---|---|---|---|---|---|---|---|---|
频数 | \(2\) | \(3\) | \(10\) | \(6\) | \(3\) | \(2\) | \(2\) | \(2\) |
设这\(30\)名学生得分的中位数为\(m\),众数为\(n\),平均数为\(\bar{x}\),则下列选项正确的为( )
A.\(m=n=\bar{x}\) \(\qquad \qquad\) B.\(m=n<\bar{x}\) \(\qquad \qquad\) C.\(m<n<\bar{x}\) \(\qquad \qquad\) D.\(n<m<\bar{x}\)
5.对于数据\(2\),\(6\),\(8\),\(3\),\(3\),\(4\),\(6\),\(8\),四位同学得出了下列结论,正确的个数为( )
甲:平均数为\(5\);乙:没有众数;丙:中位数是\(3\);丁:\(75\)百分位数是\(7\).
A.\(1\) \(\qquad \qquad \qquad \qquad\) B.\(2\) \(\qquad \qquad \qquad \qquad\) C.\(3\) \(\qquad \qquad \qquad \qquad\) D.\(4\)
6.用脚步丈量青春,用热血铸就梦想,为庆祝中国共青团成立\(100\)周年,漳州某校高中部举行“青春接力,团歌传唱”比赛,已知\(5\)位评委老师按百分制(只打整数分)分别给出某参赛班级评分,可以判断出一定有评委打满分的是( )
A.平均数为\(98\).中位数为\(97\) \(\qquad \qquad \qquad \qquad\) B.平均数为\(99\),中位数为\(99\)
C.中位数为\(95\).众数为\(98\) \(\qquad \qquad \qquad \qquad\) D.中位数为\(96\),极差为\(8\)
7.已知一组数据为\(2\),\(3\),\(6\),\(7\),\(8\),\(10\),\(11\),\(13\),若在这组数据中插入一个自然数\(a\)使得这组新数据满足中位数是\(7\)且平均数大于\(7\),则\(a\)可以是\(\underline{\quad \quad}\).(写出符合条件的一个值)
参考答案
- 答案 \(C\)
解析 根据题意,将\(7\)个数据从小到大排列,去掉一个最高分和最低分,得到\(5\)个有效评分,原始数据和有效评分相比,最中间的数没有发生改变,所以中位数不改变.故选:\(C\). - 答案 \(C\)
解析 计算该组数据的平均数为
\(\bar{x}=\dfrac{1}{10} \times(70+60+60+60+50+40+40+30+30+10)=45\),众数是\(60\),
因为\(10×80\%=8\),所以数据的\(80\%\)分位数是\(60\),
所以平均数、众数和\(80\%\)分位数的和为\(45+60+60=165\).
故选:\(C\). - 答案\(C\)
解析 由题意知,该组数据从小到大排序如下,\(2\),\(5\),\(5\),\(x\),\(8\),\(9\);
故该组数据的众数是\(5\),中位数是 \(\dfrac{5+x}{2}\),
故\(5=\dfrac{5+x}{2} \times \dfrac{5}{6}\),故\(x=7\),
故选:\(C\). - 答案 \(D\)
解析 这\(30\)名学生得分的中位数为 \(m=\dfrac{5+6}{2}=5.5\),众数为\(n=5\),
平均数 \(\bar{x}=\dfrac{1}{30} \times(3 \times 2+4 \times 3+5 \times 10+6 \times 6+7 \times 3+8 \times 2+9 \times 2+10 \times 2)=5.96\),
故\(n<m<\bar{x}\).
故选:\(D\). - 答案 \(B\)
解析 将数据从小到大排列为:\(2\),\(3\),\(3\),\(4\),\(6\),\(6\),\(8\),\(8\),
平均数为:\(\dfrac{2+3+3+4+6+6+8+8}{8}=5\),故甲对;
该组数据的众数为\(3\),\(6\),\(8\),故乙错;
该组数据的中位数为 \(\dfrac{4+6}{2}=5\),故丙错;
\(\because 8×0.75=6\),\(\therefore\)故该组数据的\(75\)百分数是\(\dfrac{6+8}{2}=7\),故丁对.
故选:\(B\). - 答案 \(A\)
解析 对于\(A\),若没有评委打满分,则总成绩\(sum≤99+99+97+97+97=489\),
平均数\(\bar{x}=\dfrac{489}{5}=97.8\),与选项不符,
\(\therefore\)平均数为\(98\),中位数为\(97\)时,一定有评委打满分,故\(A\)正确;
对于\(B\),当打分结果为\(99\),\(99\),\(99\),\(99\),\(99\)时,满足平均数为\(99\),中位数为\(99\),故\(B\)错误;
对于\(C\),当打分结果为\(98\),\(98\),\(95\),\(94\),\(93\)时,满足中位数为\(95\),众数为\(98\),故\(C\)错误;
对于\(D\),当打分结果为\(98\),\(97\),\(96\),\(95\),\(90\)时,满足中位数为\(96\),极差为\(8\),故\(D\)错误.
故选:\(A\). - 答案 \(5\)
解析 要使得中位数是\(7\),
则\(a\)必须插在\(7\)的前面,即\(a≤7\),
平均数为 \(\dfrac{1}{9}(2+3+6+a+7+8+10+11+13)>7\),解得\(a>3\),
\(\because a\in N\),\(\therefore\)可以选\(a=5\).
故答案为:\(5\).
【题型2】 频率直方图中求众数、平均数、中位数
【典题1】 某大学共有\(15000\)名学生,为了了解学生课外图书阅读量情况,该校随机地从全校学生中抽取\(1000\)名,统计他们每年阅读的书籍数量,由此来估计全体学生当年的阅读书籍数量的情况,下列估计中正确的是( )(注:同一组数据用该组区间的中点值作为代表)
A.众数为\(10\)
B.平均数为\(6.88\)
C.中位数为\(6\)
D.该校读书不低于\(8\)本的人数约为\(3600\)人
解析 \(A\):由图知:众数在\([4,8]\),故众数为\(6\),\(A\)错误;
\(B\):平均数为\(2×4×0.06+6×4×0.1+10×4×0.07+14×4×0.15+184×4×0.005
=6.88\),\(B\)正确;
\(C\):由图知:中位数\(x\)在\([4,8]\),所以\(0.6×4+0.1(x-4)=0.5\),解得\(x=6.6\),\(C\)错误;
\(D\):由图知:该校读书不低于\(8\)本的频率之和为\(1-0.16×4=0.36\),所以该校读书不低于\(8\)本的人数约为\(0.36×15000=5400\)人,\(D\)错误.
故选:\(B\).
点拨 在频率直方图中,众数为最高组的组中值,中位数为\(50\%\)分位数(求法参考求百分位数);平均数等于每组的频率乘以该组组中值之和 \(\sum_{i=1}^n f_i \cdot x_i\)(其中第\(i\)组的频率为\(f_i\),组中值为\(x_i\)),为什么呢?跟样本量无关么?频率直方图中数据具体分布不清楚,假设是均匀分布的,以每组组中值为该组的平均数较为合理,设总量为\(n\),则每组的数据之和为\(n \cdot f_i \cdot x_i\),样本数据之和为 \(\sum_{i=1}^n n \cdot f_i \cdot x_i=n \sum_{i=1}^n f_i \cdot x_i\),则平均数 \(\bar{x}=\dfrac{n \sum_{i=1}^n f_i \cdot x_i}{n}=\sum_{i=1}^n f_i \cdot x_i\),它只是个估计值.
【典题2】某地区\(100\)位居民的人均月用水量(单位:\(t\))的分组及各组的频数如下:
\([0,0.5)\),\(4\);\([0.5,1)\),\(8\);\([1,1.5)\),\(15\);\([1.5,2)\),\(22\);\([2,2.5)\),\(25\);\([2.5,3)\),\(14\);\([3,3.5)\),\(6\);\([3.5,4)\),\(4\);\([4,4.5)\),\(2\).
(1)列出样本的频率分布表;
(2)画出频率分布直方图,并根据直方图估计这组数据的平均数、中位数、众数;
(3)当地政府制定了人均月用水量为\(3t\)的标准,若超出标准加倍收费,当地政府说,\(85\%\)以上的居民不超过这个标准,这个解释对吗?为什么?
解析 (1)作出频数分布表,如下:
分组 | 频数 | 频率 |
---|---|---|
\([0,0.5)\) | \(4\) | \(0.04\) |
\([0.5,1)\) | \(8\) | \(0.08\) |
\([1,1.5)\) | \(15\) | \(0.15\) |
\([1.5,2)\) | \(22\) | \(0.22\) |
\([2,2.5)\) | \(25\) | \(0.25\) |
\([2.5,3)\) | \(14\) | \(0.14\) |
\([3,3.5)\) | \(6\) | \(0.06\) |
\([3.5,4)\) | \(4\) | \(0.04\) |
\([4,4.5]\) | \(2\) | \(0.02\) |
合计 | \(100\) | \(1.00\) |
(2)由频率分布表画出频率分布直方图,如下:
由频率分布直方图得这组数据的平均数为:
\(\bar{x}=0.25 \times 0.04+0.75 \times 0.08+1.25 \times 0.15+1.75 \times 0.22+2.25 \times 0.25+2.75 \times 0.14\) \(+3.25 \times 0.06+3.75 \times 0.04+4.25 \times 0.02=2.02\).
\(\because [0,2)\)的频率为\(0.04+0.08+0.15+0.22=0.49\),
\([2,2.5)\)的频率为\(0.25\),
\(\therefore\) 中位数为:\(2+\dfrac{0.5-0.49}{0.25} \times 0.5=2.02\),众数为: \(\dfrac{2+2.5}{2}=2.25\).
(3)人均月用水量在\(3t\)以上的居民的比例为\(6\%+4\%+2\%=12\%\),
即大约是有\(12\%\)的居民月均用水量在\(3t\)以上,\(88\%\)的居民月均用水量在\(3t\)以下,因此,政府的解释是正确的.
【巩固练习】
1.某校从参加高三模拟考试的学生中随机抽取\(60\)名学生,将其数学成绩(均为整数)分成六段\([90,100)\),\([100,110)\),…,\([140,150]\)后得到如图所示的频率分布直方图,则估计本次考试的平均分为( )
A.\(121\) \(\qquad \qquad \qquad \qquad\) B.\(119\) \(\qquad \qquad \qquad \qquad\) C.\(118.5\) \(\qquad \qquad \qquad \qquad\) D.\(118\)
2.某市要对辖区内的中学教师的年龄进行调查,现从中随机抽出\(200\)名教师,已知抽到的教师年龄都在\([25,50)\)岁之间,根据调查结果得出教师的年龄情况残缺的频率分布直方图如图所示,利用这个残缺的频率分布直方图估计该市辖区内中学教师的年龄的中位数大约是( )
A.\(37.1\)岁 \(\qquad \qquad \qquad \qquad\) B.\(38.1\)岁 \(\qquad \qquad \qquad \qquad\) C.\(38.7\)岁 \(\qquad \qquad \qquad \qquad\) D.\(43.1\)岁
3.(多选) 为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:
则下列结论正确的是( )
A.估计该地农户家庭年收入不低于\(8.5\)万元的农户比例为\(30\%\)
B.估计该地农户家庭年收入的第三四分位数为\(9\)万元
C.估计该地农户家庭年收入的平均值不超过\(6.5\)万元
D.估计该地农户家庭年收入的中位数为\(8\)万元
4.对某校高三年级学生参加社区服务次数进行统计,随机抽取\(M\)名学生作为样本,得到这\(M\)名学生参加社区服务的次数,根据此数据作出了频数与频率的统计表和频率分布直方图.
分组 | 频数 | 频率 |
---|---|---|
\([10,15)\) | \(10\) | \(0.25\) |
\([15,20)\) | \(24\) | \(n\) |
\([20,25)\) | \(m\) | \(p\) |
\([25,30]\) | \(2\) | \(0.05\) |
合计 | \(M\) | \(1\) |
(1)求出表中\(M\),\(p\)及图中\(a\)的值;
(2)若该校高三学生有\(240\)人,试估计该校高三学生参加社区服务的次数在区间\([10,15)\)内的人数;
(3)估计这次学生参加社区服务人数的众数、中位数以及平均数.
参考答案
-
答案 \(A\)
解析 由频率分布直方图得\([120,130)\)内的频率为:
\(1-(0.010+0.015+0.015+0.025+0.005)×10=0.3\),
\(\therefore\)估计本次考试的平均分为: \(\bar{x}=95 \times 0.010 \times 10+105 \times 0.015 \times 10+115 \times 0.015 \times 10+125 \times 0.3\) \(+135 \times 0.025 \times 10+145 \times 0.005 \times 10=121\).
故选:\(A\). -
答案\(B\)
解析 根据频率和等于\(1\),得;年龄在\([30,35)\)岁之间的频率为
\(1-(0.01+0.08+0.05+0.02)×5=0.2\),
\(\because 0.01×5+0.2=0.25<0.5\),\(0.25+0.08×5=0.65>0.5\),
\(\therefore\)令\(0.25+0.08×x=0.5\),解得\(x=3.125\);
\(\therefore\)该市辖区内中学教师的年龄的中位数大约\(35+3.125≈38.1\)岁.故选:\(B\). -
答案 \(AB\)
解析 对于\(A\),该地农户家庭年收入不低于\(8.5\)万元的农户比例为
\((0.1×2+0.04+0.02×3)×1=0.3=30\%\),故\(A\)正确;
对于\(B\),该地农户家庭年收入的第三四分位数为\(m\)万元,
则\(0.02+0.04+0.1+0.14+0.20×2+0.10×(m-8.5)=0.75\),解得\(m=9.0\),
故\(B\)正确;
对于\(C\),该地农户家庭所收入的平均值为:
\(3×0.02+4×0.04+5×0.10+6×0.14+7×0.2+8×0.2+9×0.1+10×0.1+\)\(11×0.04+12×0.02+13×0.02+14×0.02=7.68\),故\(C\)错误;
对于\(D\),设该地农户家庭年收入的中位数为\(x\)万元,
则\(0.02+0.04+0.10+0.14+0.2=0.5\),即\(x=7.5\),
则中位数为\(7.5\),故\(D\)错误.
故选:\(AB\). -
答案(1) \(0.12\);(2) \(60\);(3) 众数\(17.5\),中位数\(17.1\),平均数为\(17.25\).
解析 (1)由分组\([10,15)\)内的频数是\(10\),频率是\(0.25\),
得 \(\dfrac{10}{M}=0.25\),解得\(M=40\),
\(\therefore 10+24+m+2=40\),解得\(m=4\), \(p=\dfrac{m}{M}=0.1\),
\(\because a\)是对应分组\([15,20)\)的频率与组距的商,
\(\therefore a=\dfrac{24}{40 \times 5}=0.12\).
(2)\(\because\)该校高三学生有\(240\)人,在\([10,15)\)内的频率是\(0.25\),
\(\therefore\)估计该校高三学生参加社区服务的次数在此区间内的人数为:\(240×0.25=60\).
(3)估计这次学生参加社区服务人数的众数是 \(\dfrac{15+20}{2}=17.5\),
\(\because n=\dfrac{24}{40}=0.6\),\(\therefore\)样本中位数是 \(15+\dfrac{0.5-0.25}{a} \approx 17.1\),
估计这次学生参加社区服务人数的中位数是\(17.1\),
样本平均人数是:\(12.5×0.25+17.5×0.6+22.5×0.1+27.5×0.05=17.25\),
估计这次学生参加社区服务人数的平均数为\(17.25\).
分层练习
【A组---基础题】
1.上海市实验学校艺术节举行弹钢琴比赛,现有\(21\)位选手报名参赛,初赛成绩各不相同,取前\(10\)名参加决赛,小明同学已经知道了自己的成绩,为了判断自己是否能进入决赛,他还需要知道\(21\)名同学成绩的( )
A.平均数 \(\qquad \qquad \qquad \qquad\) B.中位数 \(\qquad \qquad \qquad \qquad\) C.众数 \(\qquad \qquad \qquad \qquad\) D.方差
2.某公司为了解用户对其产品的满意度,随机调查了\(10\)个用户,得到用户对产品的满意度评分如下表所示,评分用区间\([0,10]\)内的一个数来表示,该数越接近10表示满意度越高,则下列说法不正确的是( )
\(7\) | \(8\) | \(9\) | \(7\) | \(5\) | \(4\) | \(10\) | \(9\) | \(4\) | \(7\) |
---|
A.这组数据的平均数为\(6\) \(\qquad \qquad \qquad \qquad\) B.这组数据的众数为\(7\)
C.这组数据的极差为\(6\) \(\qquad \qquad \qquad \qquad\) D.这组数据的\(75\%\)分位数为\(9\)
3.已知一组数据为\(20\),\(30\),\(40\),\(50\),\(50\),\(50\),\(70\),\(80\),其平均数、第\(60\)百分位数和众数的大小关系是( )
A.平均数\(=\)第\(60\)百分位数\(>\)众数 \(\qquad \qquad \qquad \qquad\) B.平均数\(<\)第\(60\)百分位数\(=\)众数
C.第\(60\)百分位数\(=\)众数\(<\)平均数 \(\qquad \qquad \qquad \qquad\) D.平均数\(=\)第\(60\)百分位数\(=\)众数
4.在一场跳水比赛中,\(7\)位裁判给某选手打分从低到高依次为\(x_1\),\(8.1\),\(8.4\),\(8.5\),\(9.0\),\(9.5\),\(x_7 (x_7⩽10)\),若去掉一个最高分\(x_7\)和一个最低分\(x_1\)后的平均分与不去掉的平均分相同,那么最低分\(x_1\)的值不可能是( )
A.\(7.7\) \(\qquad \qquad \qquad \qquad\) B.\(7.8\) \(\qquad \qquad \qquad \qquad\) C.\(7.9\) \(\qquad \qquad \qquad \qquad\) D.\(8.0\)
5.(多选)坚持健康第一的教育理念,加强学校体育工作,推动青少年文化学习和体育锻炼协调发展.某学校对高一年级学生每周在校体育锻炼时长(单位:小时)进行了统计,得到如下频率分布表:
分组 | \([2,3)\) | \([3,4)\) | \([4,5)\) | \([5,6)\) |
---|---|---|---|---|
频率 | \(0.25\) | \(0.30\) | \(0.20\) | \(0.25\) |
则下列关于高一年级学生每周体育锻炼时长有关的说法正确的有( )
A.众数大约为\(2.5\) \(\qquad\) B.中位数大约为\(4\) \(\qquad\) C.平均数大约为\(3.95\) \(\qquad\) D.第\(80\)百分位数大约为\(5.2\)
6.已知\(2\),\(4\),\(2x\),\(4y\)四个数的平均数是\(5\),而\(5\),\(7\),\(4x\),\(6y\)四个数的平均数是\(9\),则\(xy\)的值是\(\underline{\quad \quad}\).
7.定义一个同学数学成绩优秀的标准为“连续\(5\)次数学考试成绩均不低于\(120\)分(满分\(150\)分)”.现有甲、乙、丙三位同学连续\(5\)次数学考试成绩的数据(数据都是正整数)的描述:
①甲同学的\(5\)个数据的中位数为\(125\),总体均值为\(128\);
②乙同学的\(5\)个数据的中位数为\(127\),众数为\(121\);
③丙同学的\(5\)个数据的众数为\(125\),极差为\(10\),总体均值为\(125\).
则数学成绩一定优秀的同学是\(\underline{\quad \quad}\).
8.已知\(1\),\(1\),\(3\),\(x\),\(5\),\(9\),\(10\)这七个数据的中位数是\(x\),且\(1\),\(2\),\(3\),\(-x\),\(y\)这五个数据的平均数为 \(\dfrac{6}{5}\),则 \(\dfrac{1}{x}+y\)的最小值为\(\underline{\quad \quad}\).
9.某校为了解学生在新冠病毒疫情期间学生自制力,学校随机抽取\(80\)位学生,请他们家长(每位学生请一位家长)对学生打分,满分为\(10\)分.如表是家长所打分数\(X\)的频数统计.
分数\(X\) | \(5\) | \(6\) | \(7\) | \(8\) | \(9\) | \(10\) |
---|---|---|---|---|---|---|
频数 | \(4\) | \(8\) | \(20\) | \(24\) | \(16\) | \(8\) |
(1)求家长所打分数的平均数、中位数和众数;
(2)若原来打\(9\)分的某\(4\)位家长改变主意,将孩子的分数改为了\(6\)分,那么新的平均数、中位数、众数又是什么?
(3)你认为哪个统计量能反映学生在新冠病毒疫情期间学生自制力更多的信息?结合此问题简单谈一下你的看法.
- 在某次综合素质测试中,共设有\(40\)个考室,每个考室\(30\)名考生.在考试结束后,为调查其测试前的培训辅导情况与测试成绩的相关性,抽取每个考室中座位号为\(05\)的考生,统计了他们的成绩,得到如图所示的频率分布直方图.
(1)在这个调查采样中,采用的是什么抽样方法?
(2)估计这次测试中优秀(\(80\)分及以上)的人数;
(3)写出这\(40\)名考生成绩的众数、中位数、平均数的估计值.
参考答案
-
答案 \(B\)
解析 根据题意,\(21\)位选手成绩的中位数是第\(11\)名的成绩,
取前\(10\)名参加决赛,小明同学已经知道了自己的成绩,
为了判断自己是否能进入决赛,他还需要知道\(21\)名同学成绩的中位数.
故选:\(B\). -
答案 \(A\)
解析 这组数从小到大排列为:\(4\),\(4\),\(5\),\(7\),\(7\),\(7\),\(8\),\(9\),\(9\),\(10\),
计算这组数据的平均数为\(\dfrac{1}{10} \times(4+4+5+7+7+7+8+9+9+10)=7\),
故\(A\)错误;
这组数据的众数是\(7\),故\(B\)正确;
这组数据的极差是\(10-4=6\),故\(C\)正确;
因为\(10×75\%=7.5\),且第\(8\)个数是\(9\),
所以这组数据的\(75\%\)分位数为\(9\),故\(D\)正确.
故选:\(A\). -
答案 \(B\)
解析 一组数据为\(20\),\(30\),\(40\),\(50\),\(50\),\(50\),\(70\),\(80\),
其平均数: \(\dfrac{20+30+40+50+50+50+70+80}{8}=\dfrac{390}{8}<50\),
第\(60\)百分位数:\(50\);众数为:\(50\),
所以平均数\(<\)第\(60\)百分位数\(=\)众数 .
故选:\(B\). -
答案 \(D\)
解析 因为去掉最高分与最低分后平均分为 \(\dfrac{8.1+8.4+8.5+9.0+9.5}{5}=8.7\),
所以 $\dfrac{x_1+8.1+8.4+8.5+9.0+9.5+x_7}{7}=8.7 $,解得 \(\dfrac{x_1+x_7}{2}=8.7\),
由于得分按照从低到高的顺序排列的,
故\(x_1≤8.1\),\(9.5≤x_7≤10\),
当\(x_1=7.7\)时,\(x_7=9.7\),满足上述条件,故\(A\)错误;
当\(x_1=7.8\)时,\(x_7=9.6\),满足上述条件,故\(B\)错误;
当\(x_1=7.9\)时,\(x_7=9.5\),满足上述条件,故\(C\)错误;
当\(x_1=8.0\)时,\(x_7=9.4\),不满足上述条件,故\(D\)正确.
故选:\(D\). -
答案 \(CD\)
解析 对\(A\),\(\because\)最大频率的组的中点值为\(3.5\),
\(\therefore\)众数大约为\(3.5\),\(\therefore A\)错误;
对\(B\),由表可知,中位数在第二组中,设其为\(x\),
则 \((x-3) \cdot 0.3=0.25\),\(\therefore x=3.83\),\(\therefore B\)错误;
对\(C\),\(\because\)平均数为\(2.5×0.25+3.5×0.3+4.5×0.2+5.5×0.25=3.95\),
\(\therefore C\)正确;
对\(D\),\(\because\)前三组的频率和为\(0.75\),
\(\therefore\)第\(80\)百分位数位于第\(4\)组,设其为\(a\),
则\((a-5)\cdot 0.25=0.05\),解得\(a=5.2\),\(\therefore D\)正确.
故选:\(CD\). -
答案 \(6\)
解析 因为\(2\),\(4\),\(2x\),\(4y\)四个数的平均数是\(5\),则\(2+4+2x+4y=4×5\),
又由\(5\),\(7\),\(4x\),\(6y\)四个数的平均数是\(9\),则\(5+7+4x+6y=4×9\),
\(x\)与\(y\)满足的关系式为 \(\left\{\begin{array}{l} x+2 y=7 \\ 2 x+3 y=12 \end{array}\right.\),解得 \(\left\{\begin{array}{l} x=3 \\ y=2 \end{array}\right.\),
故答案为 \(6\). -
答案 ②
解析 对于①,若甲同学\(5\)个数据为\(119\),\(124\),\(125\),\(128\),\(144\),满足中位数为\(125\),
总体均值为\(128\),但不满足连续\(5\)次数学考试成绩均不低于\(120\)分,故①错误,
对于②,\(\because\)乙同学的中位数为\(127\),众数为\(121\),
\(\therefore\)两次不高于\(127\)的成绩都为\(121\),另外两次的成绩高于\(127\),符合连续\(5\)次数学考试成绩均不低于\(120\)分,
故乙同学一定优秀,故②正确,
对于③,若丙同学\(5\)个数据为\(119\),\(125\),\(125\),\(127\),\(129\),满足众数为\(125\),极差为\(10\),总体均值为\(125\),但不满足连续\(5\)次数学考试成绩均不低于\(120\)分,故③错误.
故答案为:②. -
答案 \(\dfrac{10}{3}\)
解析 因为\(1\),\(1\),\(3\),\(x\),\(5\),\(9\),\(10\)这七个数据的中位数是\(x\),
所以\(3≤x≤5\),
因为\(1\),\(2\),\(3\),\(-x\),\(y\)这五个数据的平均数为\(\dfrac{6}{5}\),
即 \(1+2+3-x+y=5 \times \dfrac{6}{5}=6\),所以\(y=x\),
所以 \(\dfrac{1}{x}+y=\dfrac{1}{x}+x\),
设 \(f(x)=\dfrac{1}{x}+x\),\(x\in [3,5]\),
则\(f(x)\)在\([3,5]\)上单调递增,
所以\(f(x)\)的最小值为 \(f(3)=\dfrac{1}{3}+3=\dfrac{10}{3}\),
即\(\dfrac{1}{x}+y\)的最小值为\(\dfrac{10}{3}\).
故答案为: \(\dfrac{10}{3}\). -
答案 (1) 平均值为 \(\dfrac{39}{5}\);中位数为\(8\);众数为\(8\);(2) 平均值为 \(\dfrac{153}{20}\),中位数为\(8\);众数为\(8\);(3)略
解析 (1)家长所打分数的平均值为
\(\bar{X}=\dfrac{1}{80} \times(5 \times 4+6 \times 8+7 \times 20+8 \times 24+9 \times 16+10 \times 8)\)\(=\dfrac{39}{5}\);
中位数为将数据从小到大排列后第\(40\)个数为\(8\)和第\(41\)个数为\(8\)的平均值,即中位数为\(8\);
众数为出现次数最多的数,即众数为\(8\).
(2)修改数据后家长所打分数的平均值为:
\(\bar{X}=\dfrac{1}{80} \times(5 \times 4+6 \times 12+7 \times 20+8 \times 24+9 \times 12+10 \times 8)=\dfrac{153}{20}\);
中位数为将数据从小到大排列后第\(40\)个数为\(8\)和第\(41\)个数为\(8\)的平均值,即中位数为\(8\);
众数为出现次数最多的数,即众数为\(8\).
(3)由题意可知平均数更能反映学生在新冠病毒疫情期间学生自制力更多的信息,由上面两小问可以看出当数据发生变化时,平均数发生变化,中位数和众数都没有影响,所以平均数细致的反应数据的集中程度. -
答案 (1) 采用的是系统抽样;(2) \(420\);(3) 众数\(77.5\),中位数\(77.5\),平均数\(77\).
解析 (1)采用的是系统抽样;
(2)由于\(80\)分及以上的频率\(P=(0.05+0.02)×5=0.35\),
因此这次测试中优秀人数约为\(40×30×0.35=420\)(人);
(3)成绩在\([75,80)\)的人数最多,
因此众数的估计值是 \(\dfrac{75+80}{2}=77.5\) (分);
中位数的估计值 \(=75+\dfrac{0.5-0.05-0.1-0.2}{0.060}=77.5\)(分);
平均数的估计值\(=62.5×0.05+67.5×0.1+72.5×0.2+77.5×0.3+82.5×0.25+87.5×0.1=77\)(分).
【B组---提高题】
1.(多选)已知数据\(x_1\),\(x_2\),\(x_3\),⋯,\(x_n\)的众数、平均数、方差、第\(80\)百分位数分别是\(a_1\),\(b_1\),\(c_1\),\(d_1\),数据\(y_1\),\(y_2\),\(y_3\),⋯,\(y_n\)的众数、平均数、方差、第\(80\)百分位数分别是\(a_2\),\(b_2\),\(c_2\),\(d_2\),且满足\(y_i=3x_i-1\)\((i=1,2,3,⋯,n)\),则下列结论正确的是( )
A.\(b_2=3b_1-1\) \(\qquad \qquad\) B.\(a_2=a_1\) \(\qquad \qquad\) C.\(c_2=9c_1\) \(\qquad \qquad\) D.\(d_2=3d_1-1\)
参考答案
- 答案 \(ACD\)
解析 由题意可知,两组数据满足\(y_i=3x_i-1(i=1,2,3,⋯,n)\),
由平均数计算公式得 \(\dfrac{1}{n} \times\left(y_1+y_2+\cdots+y_n\right)\) \(=\dfrac{1}{n} \times\left[\left(3 x_1-1\right)+\left(3 x_2-1\right)+\cdots+\left(3 x_n-1\right)\right]\)\(=3 \times \dfrac{1}{n} \times\left(x_1+x_2+\cdots+x_n\right)-1\),
所以\(b_2=3b_1-1\),故\(A\)正确;
由它们的众数也满足\(y_i=3x_i-1(i=1,2,3,⋯,n)\),
则有\(a_2=3a_1-1\),故\(B\)错误;
由方差的性质得\(c_2=9c_1\),故\(C\)正确;
对于数据\(x_1\),\(x_2\),\(x_3\),⋯,\(x_n\),假设其第\(80\)百分位数为\(d_1\),
当\(0.8n=k\)是整数时, \(d_1=\dfrac{x_k+x_{k+1}}{2}\),
当\(0.8n\)不是整数时,设其整数部分为\(k\),则 \(d_1=x_{k+1}\),
所以对于数据\(3x_1-1\),\(3x_2-1\),\(3x_3-1\),⋯,\(3x_n-1\),假设其第\(80\)百分位数为\(d_2\),
当\(0.8n=k\)是整数时, \(d_2=\dfrac{3 x_k-1+3 x_{k+1}-1}{2}=3 d_1-1\),
当\(0.8n\)不是整数时,设其整数部分为\(k\),则 \(d_2=3 x_{k+1}-1=3 d_1-1\),
所以\(d_2=3d_1-1\),故\(D\)正确.
故选:\(ACD\).