百分位数的估计 | 新高考新增
💎更新于 2024-09-13 17:12 | 发布于 2024-09-11 15:13
约 4708 字 | 阅读估时 16 分钟
前情概要
在以前的高中数学统计章节中我们只涉及学习中位数,现在的新高考中添加了百分位数 [可以将其看成中位数概念的拓展] ,这是个新概念,为便于学习理解,加以整理。
基本内容
引入缘由:假设通过简单随机抽样,获得了 户居民用户的月均用水量数据(单位:),鉴于篇幅,部分数据省略。
更多的时候,我们不仅仅关注中位数,甚至还关注 位置上的数据 [比如,根据市政府的要求确定居民用户月均用水量标准,就是要寻找一个数 ,使全市居民用户月均用水量中不超过 的占 ,大于 的占 。下面我们通过样本数据对 的值进行估计],这就引出了百分位数的概念。具体以上述为例来说,把 个样本数据按从小到大排序, 得到第 个和第 个数据分别为 和 , 可以发现,区间 内的任意一个数,都能把样本数据分成符合要求的两部分。一般地, 我们取这两个数的平均数 , 并称此数为这组数据的第 百分位数(percentile),或 分位数 .
抽象概括:一般地,一组数据的第 百分位数是这样一个值,它使得这组数据中至少有 的数据小于或等于这个值,且至少有 的数据大于或等于这个值。可以通过下面的步骤计算一组 个数据的第 百分位数:
第 1 步,按从小到大排列原始数据;
第 2 步,计算 ;
第 3 步,若 不是整数,而大于 的比邻整数 [相邻而居的整数] 为 ,则第 百分位数为第 项数据;若 是整数,则第 百分位数为第 项与第 项数据的平均数。用下例来帮助理解:
解:把 名女生的样本数据按从小到大排序,可得
由于 [比 、、 大的比邻整数分别为 、 、 ],,,可知样本数据的第 ,, 百分位数为第 ,, 项数据,分别为 ,,,据此可以估计树人中学高一年级女生的第 ,, 百分位数分别约为 , 和 .
引申:如果数据个数为 个,则第 百分位数 [ 或 分位数 ] 应该是从小到大排列的第 位的数据 [具体计算: ]。
我们在初中学过的中位数,相当于是第 百分位数。在实际应用中, 除了中位数外, 常用的分位数还有第 百分位数, 第 百分位数。这三个分位数把一组由小到大排列后的数据分成四等份, 因此称为四分位数。其中第 百分位数也称为第一四分位数或下四分位数等, 第 百分位数也称为第三四分位数或上四分位数等。另外, 像第 百分位数,第 百分位数,第 百分位数和第 百分位数在统计中也经常被使用 .
对于任意一组数据,满足第 百分位数定义的值可能不唯一。计算百分位数的方法有多种,我们取一种计算方法比较简单的。注意不同的读法:第 百分位数 或 分位数;
典例剖析
- 注意本例题的特点是所有原始数据经过加工处理,已经有了数据信息的损失;
(1). 求图中 的值;
分析:简单题,由频率分布直方图可得 ,所以 ,注意和原题目中的近似度要求保持一致,小数点后保留三位有效数字 .
(2). 请通过频率分布直方图估计这 份样本数据的众数、 分位数、平均值(同一组中的数据用该组区间的中点值作代表);
分析:本题目在理解和数据处理上有一定的难度,当我们将一组原始数据制作成频率分布直方图后,原始数据的部分信息会有所损失。比如 之间的 5 个原始数据为 、、、、,如果填充到直方图中,此时从直方图出发来看数据,只能知道这 5 个数据大于等于 ,小于 ,并不能知道数据的具体值为多少,如果此时要我们挑选一个数据来代表这组数据,那么选左端点的值 未免太小,选右端点的值 未免太大,比较理想和中庸的做法是取两个端点数据的平均数来做代表,因此这类题目往往有这样的注释说明(同一组中的数据用该组区间的中点值作代表),即使题目中没有说明,我们也应该这样做。样本特征数字的计算方法的详细解释
解析: 份样本数据的众数为 ,
份样本数据的 分位数求解思路一:方程组法,首先预判 分位数所在的大致区间,
由于前四个小矩形的面积之和 ,
而前五个小矩形的面积之和 ,
故 分位数所在的区间为第五个区间 ,设 分位数为 ,
则 ,解得 ,即 分位数 为 .
分位数求解思路二:比例法,同上先预判 分位数所在的大致区间为 ,再计算累积频率可知,区间分隔线 和 对应的累积频率分别为 和 ,设累积频率 在区间 内对应的宽度为 ,则由对应的累积频率 [即面积] 差之比等于长度之比可知,,即 ,
则 ,故 [换个说法] 第 65 百分位数 为 .
份样本数据的平均值为
(3). 该市决定表彰知识竞赛成绩排名前 的市民,某市民知识竟赛的成绩是 ,请估计该市民能否得到表彰.
解析:成绩低于 分的频率为 ,成绩低于 分的频率为 ,则被表彰的最低成绩为 分位数 []:
又由于 分位数为: ,而被表彰的最低成绩 ,
所以估计该市民能得到表彰 .
作者:陕西凤翔,微信:wh1979448597,邮箱:wanghai0666@126.com,敬请雅正,欢迎联系。
情怀:一直设想如何利用自己浅陋的教学感悟和粗鄙的电脑知识,将数学学习的手段和要素都整合到云端。
出处:https://www.cnblogs.com/wanghai0666/p/18407870
版权:本作品采用「署名-非商业性使用-相同方式共享 4.0 国际」许可协议进行许可。
题记:用数学的眼光观察世界,用数学的思维分析世界,用数学的语言表达世界!
声明:本博客版权归「静雅斋数学」所有。
【推荐】国内首个 AI IDE,深度理解中文开发场景,立即下载体验 Trae
【推荐】编程新体验,更懂你的 AI,立即体验豆包 MarsCode 编程助手
【推荐】抖音旗下 AI 助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗?
· 如何调用 DeepSeek 的自然语言处理 API 接口并集成到在线客服系统
· 【译】Visual Studio 中新的强大生产力特性
· 2025年我用 Compose 写了一个 Todo App
2018-09-11 均值不等式中的经典题目赏析
2018-09-11 不等式习题