听见涛声_数说张小桃

日拱一卒 | 梳理、沉淀、数据科学家踩坑之路 | 努力成为数据分析领域python最强的人

导航

区别 |相关分析vs回归分析

函数关系

两个变量x和y,当变量x取某个值,y依赖于x确定的关系取相应的确切地值,则称y是x的函数,记为y =f(x)。其中x为自变量,y为因变量。

如:某商品销售与销量的关系y=px

 

 

 

相关关系

当一个或几个关联变量取一定值,与之对应的另一变量的值虽不确定,但仍按照某种规律在一定范围内变化。现象之间存在客观的不严格的数量依存关系。

(1)、变量间的关系不能用函数精确表达

(2)、当变量x取某数值时,变量y取值在一定范围内可能有好几个。

如:商品的销量(y)与物价的关系(x),居民消费(y)与收入的关系(x),粮食亩产(y)与温度(x1)水分(x2)光照(x3)的关系

相关关系的种类

(1)、按照相关形式可分为:线性相关、非线性相关;

(2)、按照相关方向可分类:正相关、负相关;

(3)、按照相关关系程度可分为:完全相关、不完全相关、不相关。

 

 

 

相关关系的定量判断

  关系表

  关系图

  相关系数 :r>0正相关,r<0负相关,0<|r|<1存在线性关系,|r|=1完全线性相关,r=0 不存在线性相关(但有可能存在其他类型关系)

 

 

 

 

 

回归分析

1、相关分析:找出一个指标来表明现象之间相互依存关系的紧密程度。广义的相关分析包括“相关性分析”和“回归分析”。

2、回归分析:

  (1)对具有相关关系的现象,拟合出一个合适的数学模型(即回归方程)来近似地表达变量之间平均关系的统计方法。

  (2)对这些关系式的可信程度进行各种统计检验(相关系数、方差、显著性等),从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著。

  (3)利用关系式预测因变量。并给出或控制预测值的精确度。

二者联系:

1、相关分析是回归分析的前提和基础。当变量之间存在相关性时,用回归分析找回归模型才有意义。

2、回归分析是相关分析的继续和深入。

 

二者区别:

1、相关分析不必明确自变量和因变量。而回归分析需明确自变量和因变量,且只能从自变量去推测因变量。

2、相关分析所涉及的变量一般都是随机变量;而回归分析中因变量是随机的。自变量则作为研究时给定的非随机变量。

 

回归模型类型

  (1)一元回归:一元线性,一元非线性(对数、指数、幂函数、双曲线等)

  (2)多元回归:多元线性,多元非线性

 

回归模型建立方法

  一般用最小二乘法,原理是寻找最优的待估计参数,使得残差(组内平方和)最小。

 

 

 

 

 

 

【参考】

【1】百度文库 时间序列预测与回归分析模型

posted on 2020-01-20 20:56  数说张小桃  阅读(3650)  评论(0编辑  收藏  举报