YUANya

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5
统计
 

应用统计学-回归分析

 

 

 

 

拟合度使用r^2Se来检验。

 

 

 

 

显著性检验中,对于线性model使用ANOVA,对于单独的回归系数使用t检验。

 

 

 

 

 

 

最小二乘法、贝叶斯和最大似然都可用于求回归参数,最小二乘法是最小化残差平方和。

基于model影响变差的因素有随机误差和自变量x

因为R^2=SST/SSE,所以取值在(0,1)。而Adjusted R^2=MST/MSE,其中SST自由度是n-1SSR自由度是k,则SSE自由度是n-k-1

多重相关系数 (multiple correlation coefficient) 又称复相关系数是因变量与所有自变量之间的关系。而相关关系是两两之间的关系。 

 

因为:T(n)=(f(1,n))^1/2所以

 

 

 多重共线性可能会误导结果,有可能变弱甚至变负。

下面情况暗示存在多重共线性,Model显著但是单独的回归系数却不显著。

 

 

 

容忍度和y无关

 

 

 

变量数目变大,比如加入细节性分类,则误差变小。

 

 

 

 

可以使用如下方法确定变量种类:

 

 向前是加入就不能删去。

向后是删去就不能加入。

逐步回归是向前向后相结合,一进一出。

最佳子集是k种因素可以组成2^k个子集,考虑所有组合方式,得到最佳的方式。

在确定了变量种类之后,可以使用f检验来查看是否显著,

 

 

 

 

对个别值的预测需要还原到原始分布,对平均值的预测不需要,所以范围更小。

 

 

 

 

 

 

 

 

 

 

输入数据要在预测范围内,否则造成误导。

 

残差分析:

 

 

 

2SD范围内为满意模式,但是不能轻易删除outlier,比如下图就是某点影响了总体趋势。

 

 

 

虚拟变量是将类别变量赋值,加入model,使用regression

posted on   YUANya  阅读(2389)  评论(0编辑  收藏  举报
编辑推荐:
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
阅读排行:
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 地球OL攻略 —— 某应届生求职总结
· 提示词工程——AI应用必不可少的技术
· Open-Sora 2.0 重磅开源!
· 周边上新:园子的第一款马克杯温暖上架
 
点击右上角即可分享
微信分享提示