帮助

[AI 助力设计] 静雅斋指南

1、在静雅斋 [目录] 中搜索某一个章节;
2、在侧边栏的 [找找看] 里输入关键词可以搜索某一个博文或者某个特定的习题;

3、在侧边栏的 [我的标签] 里面选择您准备学习的专题;
4、博主推荐思维导图和 AI 辅助教学类博文

5、您当然可以逐篇看一看,有问题微信联系:wh1979448597。

线性回归和独立性检验难点解析

💎更新于 2023-03-16 15:06 | 发布于 2018-08-06 11:20
约 4983 字 | 阅读估时 17 分钟

公式定理💯随心记

【向量垂直条件】文字语言:两个非零向量互相垂直的充要条件。符号语言:abab=0x1x2+y1y2=0


推导难点

线性回归方程的推导难点:

给定一组数据 (x1y1)(x2y2)(xnyn),则该组数据的样本中心为 (x¯y¯),其中 x¯=1ni=1nxiy¯=1ni=1nyi

可知,线性回归直线方程为 [具体计算公式,题目中往往直接给定]:y^=b^x+a^

其中回归系数 b^ 的部分推导过程如下:

b^=i=1n(xix¯)(yiy¯)i=1n(xix¯)2=i=1nxiyinx¯y¯i=1nxi2nx¯2

回归系数 a^ 的计算公式:

a^=y¯b^x¯

  • 上述公式中的部分难点变形说明如下:

i=1n(xix¯)(yiy¯)=i=1n(xiyixiy¯x¯yi+x¯y¯)=i=1nxiyiy¯i=1nxix¯i=1nyi+x¯y¯i=1n1=i=1nxiyinx¯y¯nx¯y¯+nx¯y¯=i=1nxiyinx¯y¯

仿照这个推导思路,你能推导 i=1n(xix¯)2=i=1nxi2nx¯2 吗?

提示:从 2016 和 2022 高考试题解答来看,以下公式是需要记忆的:

i=1n(xix¯)(yiy¯)=i=1nxiyinx¯y¯i=1n(xix¯)2=i=1nxi2nx¯2

计算难点

【案例】某题目给定 i=18xi=480i=18yi=480i=18x1yi=22500i=18xi2=30400

可以计算 x¯=60y¯=45,代入 b^=i=1nxiyinx¯y¯i=1nxi2nx¯2 来计算

计算细节:b^=i=18xiyi8x¯y¯i=18xi28x¯2

=225008×60×45304008×60×60=2258×6×4.53048×6×6

=22536×63048×6×6=225216304288=916

表格解读

  • 独立性检验中的表格的解读:
P(χ2k0) 0.500 0.400 0.250 0.150 0.100 0.050 0.025 0.010 0.005 0.001
k0 0.455 0.708 1.323 2.072 2.706 3.841 5.084 6.635 7.897 10.828
  • 独立性检验的数学原理:

H0 先假设两个变量 AB 是无相关关系的,χ2 的观测值 k0 越大,则与之对应的假设事件 H0 成立的概率越小,那么 H0 不成立的概率越大,即两个变量相关的概率越大。

  • 使用实例:比如计算得到 χ2=8,则有 8>7.897,而 7.897 对应概率值为 0.005,故有 10.005=99.5% 以上的把握认为 “两个变量有关”,但还是有低于 0.5% 的判断出错可能性,并不是百分之百。

案例分析

涉及线性回归计算中的几点技巧 [实验验证] 数学实验验证

【案例】某公司第二、第三季度的用电量与月份线性相关,数据统计如下:

月份 x 4 5 6 7 8 9
用电量 y 6 16 27 55 46 56

[备注说明] 此题目在计算之前,需要先剔除其中的无效数据 (755)

依照以下的几个层次的问题,逐步理解:

①能不能直接利用数据进行计算?

②能不能对数据先做预处理,即每一组数据都减去 (627)

③能不能对数据先做预处理,即每一组数据都减去 (616)

④能不能对数据先做预处理,即每一组数据都减去 (x¯y¯)

典例剖析

【对统计大数据的预处理】【2019 高三理科数学第二次月考第 18 题】

某地随着经济发展,居民收入逐年增长,下表是该地一建设银行连续五年的储蓄存款 (年底余额),如下表 1:

年份 x 2011 2012 2013 2014 2015
储蓄存款 y(千亿元) 5 6 7 8 10

为便于计算,将上表做以处理,令 t=x2010z=y5,得到下表 2:

时间代号 t 1 2 3 4 5
z 0 1 2 3 5

附可能用到的公式:线性回归直线为 y^=b^x+a^

b^=i=1n(xix¯)(yiy¯)i=1n(xix¯)2=i=1nxiyinx¯y¯i=1nxi2nx¯2

a^=y¯b^x¯.

(1) 求 z 关于 t 的线性回归方程。

分析:需要先注意 zytx,然后将所给的公式翻译为关于 z t 的公式,这涉及到数学素养,公式的正向迁移。

由表格可知,t¯=3z¯=2.2i=15tizi=45i=15ti2=55

b^=i=1ntizint¯z¯i=1nti2nt¯2

=455×3×2.2555×9=1.2

a^=z¯b^t¯=2.23×1.2=1.4

z^=1.2t1.4

(2) 通过 (1) 中的方程,求出 y 关于 x 的线性回归方程。

分析:将 t=x2010z=y5 代入 z^=1.2t1.4

得到 y5=1.2×(x2010)1.4

y^=1.2x2408.4

(3) 用所求的线性回归方程预测,到 2020 年底,该地的储蓄存款余额可达到多少?

分析:当 x=2020 时,代入 y^=1.2x2408.4

得到 y^=1.2×20202408.4=15.6(亿)

【2017-18 高三理科高考冲刺模拟试题 9 第 15 题】已知由样本数据点集合 {(xiyi)i=12n} 求得的回归直线方程为 y^=1.5x+0.5,且 x¯=3,现发现两个数据点 (1.12.1) (4.97.9) 误差较大,去除后重新求得的回归直线 l 的斜率为 1.2,那么,当 x=2 时,y 的估计值是______。

分析:由于样本中心点 (x¯y¯) 必在回归直线上,先代入计算得到 y¯=5

即原数据的样本中心点为 (35),故 i=1nxi=3ni=1nyi=5n

由于 1.1+4.9=62.1+7.9=10,去除两个样本点后,

新的样本中心点的坐标 x¯=3n6n2=3y¯=5n10n2=5

故新的样本中心点 (35) 必在回归直线 y^=1.2x+b 上,

则有 5=1.2×3+b,则 b=1.4

即重新求得的回归直线 l y^=1.2x+1.4

x=2 时,代入计算得到 y^=1.2×2+1.4=3.8

法 2:特殊化策略,将样本数据点的个数认定为 5 个,其他的计算仿上完成。

作者:陕西凤翔,微信:wh1979448597,邮箱:wanghai0666@126.com,敬请雅正,欢迎联系。
情怀:一直设想如何利用自己浅陋的教学感悟和粗鄙的电脑知识,将数学学习的手段和要素都整合到云端。

出处:https://www.cnblogs.com/wanghai0666/p/6627265.html

版权:本作品采用「署名-非商业性使用-相同方式共享 4.0 国际」许可协议进行许可。

题记:用数学的眼光观察世界,用数学的思维分析世界,用数学的语言表达世界!
声明:本博客版权归「静雅斋数学」所有。

posted @   静雅斋数学  阅读 (939)  评论 (0编辑  收藏  举报
编辑推荐:
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
阅读排行:
· winform 绘制太阳,地球,月球 运作规律
· AI与.NET技术实操系列(五):向量存储与相似性搜索在 .NET 中的实现
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 上周热点回顾(3.3-3.9)
您已经努力一段时间了
活动活动喝杯咖啡吧
                  ----静雅斋
点击右上角即可分享
微信分享提示
more_horiz
keyboard_arrow_up dark_mode palette
选择主题