【高中·数学】对于统计的一些整理

声明:这里只选取了统计的部分概念知识点,仅供参考使用

〇、写在前面

本来以为,高中数学统计就是用来玩玩就行的,结果....还是权当我没说吧

小丑竟是我自己!

含泪开始整理笔记

一定一定要重视高中知识点的每一个部分!!!


一、用样本估计总体

1.已知局部方差求整体方差

总的来说就是一个知道了样本方差和平均数然后让你求总体方差平均数的东西

【课本例题及解析】

课本原题
解析

然后答案就是51.4862...

说了这么多,写还是不会写......因此......卷起来了!?

【Example】:(一道比较牵强的题目....)

总样本中,已知男生24人,其平均数和方差分别为12、4,女生有16人,其平均数和方差分别为10、6,则总样本的平均数和方差分别是多少?

【Answer】:

根据上面的结论,我们直接...

记男生平均数是x1,方差是s1,女生平均数是x2,方差是s2;总体方差是s,平均数是x

所以 <script type="math/tex;mode=inline">x=\frac {24·x_1+16·x_2}{40}=11.2</script>x=\frac {24·x_1+16·x_2}{40}=11.2

代入课本中最后推出来的结果,得到:s= <script type="math/tex;mode=inline">\frac {1}{40} · \{24[s_1^2+(x_1-x)^2]+16[s_2^2+(x _2-x)^2]\}</script>\frac {1}{40} · \{24[s_1^2+(x_1-x)^2]+16[s_2^2+(x _2-x)^2]\}

所以s=5.76


好像学废了...


2.总体百分位数估计

《玄学东西》

浅浅问一句:求出总体百分位数,一共需要几步?

显然,求样本的第p百分位数,一共分三步走:

第一步:升序排序样本数据

第二步:计算n*p%=?(其中n表示样本数据数)

第三步:看看算出来结果(暂且记为 i )i是不是整数,如果是,那么第p百分位数就是样本排序后第 i 和第(i+1)个数的平均数;如果不是,那么就是比 i 大的比邻整数


听起来好像挺简单的...

但是我会忘记

【Example】

给你一堆数据,分别是2,3,5,7,8,9,9,11,那该组数据的第40百分位数是多少?

【Answer】

样本总数很显然是...8

因为8*40%=3.2,不是整数

所以这堆数据的第40百分位数就是...7 !



二、成对数据的分析和统计

1.样本相关系数

就是用来衡量样本中变量之间的线性相关程度的一个东西,介于-1和1之间,且绝对值越接近1,线性相关都越高(说白了就是越来越接近一条确定的直线)

将样本相关系数记为r,那么r>0时,表明成对样本数据正相关;r<0时,表明成对样本数据负相关

【计算公式】:

<script type="math/tex;mode=inline">r=\frac{\sum_1^n(x_i-\bar x)(y_i-\bar y)}{\sqrt{\sum_1^n(x_i-\bar x)^2}\sqrt{\sum_1^n(y_i-\bar y)^2}}</script>r=\frac{\sum_1^n(x_i-\bar x)(y_i-\bar y)}{\sqrt{\sum_1^n(x_i-\bar x)^2}\sqrt{\sum_1^n(y_i-\bar y)^2}} 或者 <script type="math/tex;mode=inline">r=\frac{\sum_1^n x_iy_i-n\bar x\bar y}{\sqrt{\sum_1^n x_i^2-n\bar x^2}\sqrt{\sum_1^n y_i^2-n \bar y^2}}</script>r=\frac{\sum_1^n x_iy_i-n\bar x\bar y}{\sqrt{\sum_1^n x_i^2-n\bar x^2}\sqrt{\sum_1^n y_i^2-n \bar y^2}}


end




2.用最小二乘法拟合曲线

第一次接触到这个东西的时候是参加信息学竞赛的时候...当时这玩意用高斯-约旦消元法解的。。。

在课本上看到这玩意的时候我内心一阵窃喜,结果就成了如今这个....xiaochou QAQ

为啥整了个这么复杂的公式?!

<script type="math/tex;mode=inline">\hat y=\hat b·x +\hat a</script>\hat y=\hat b·x +\hat a

<script type="math/tex;mode=inline">f(x)={b^=1n(xix¯)(yiy¯)1n(xix¯)2a^=y¯b^·x¯</script>f(x)=\begin{cases} \hat b = \frac{\sum_1^n(x_i - \bar x)(y_i - \bar y)}{\sum_1^n(x_i-\bar x)^2}\\ \hat a=\bar y -\hat b·\bar x \end{cases} 和上面一样,其中 <script type="math/tex;mode=inline">\hat b </script>\hat b 可以简化成: <script type="math/tex;mode=inline">\hat b = \frac{\sum_1^n x_iy_i-n \bar x \bar y}{\sum_1^n x_i^2-n \bar x^2}</script>\hat b = \frac{\sum_1^n x_iy_i-n \bar x \bar y}{\sum_1^n x_i^2-n \bar x^2}


算就完事了





3.决定系数

用来衡量线性回归的拟合效果,记为 <script type="math/tex;mode=inline">R^2</script>R^2

【计算公式】: <script type="math/tex;mode=inline">R^2=1-\frac{\sum_1^n(y_i-\hat y)^2}{\sum_1^n(y_i-\bar y)^2}</script>R^2=1-\frac{\sum_1^n(y_i-\hat y)^2}{\sum_1^n(y_i-\bar y)^2}

依旧可以用上面的方法进行简化。

决定系数后那一坨东西(是指 <script type="math/tex;mode=inline">\frac{\sum_1^n(y_i-\hat y)^2}{\sum_1^n(y_i-\bar y)^2}</script>\frac{\sum_1^n(y_i-\hat y)^2}{\sum_1^n(y_i-\bar y)^2} )的含义是残差,残差这种东西当然是越小的话拟合效果越好,而且Ta还大于零

所以我们只用记住:决定系数越接近1,拟合效果越好


<script type="math/tex;mode=inline">\huge \mathscr{END.}</script>\huge \mathscr{END.}



AT LAST

感谢您能看到这里,文章中如有谬误请多指教!

文章图片来源于网络,如有侵权请告知删除!


加油趴童鞋们!

浅浅地点个赞吧QAQ

posted @   ZeroHzzzz  阅读(22)  评论(0编辑  收藏  举报  
相关博文:
阅读排行:
· winform 绘制太阳,地球,月球 运作规律
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· AI与.NET技术实操系列(五):向量存储与相似性搜索在 .NET 中的实现
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
点击右上角即可分享
微信分享提示