异方差性 同方差性
case:
1、
异方差性
(1)调查不同规模公司的利润,发现大公司的利润波动幅度比小公司的利润波动幅度大;
(2)分析家庭支出时发现高收入家庭支出变化比低收入家庭支出变化大。在分析家庭支出模型时,我们会发现高收入家庭通常比低收入家庭对某些商品支出有更大的方差;
https://baike.baidu.com/item/同方差性/7762236?fr=ge_ala
https://baike.baidu.com/item/异方差性/3206526?fr=ge_ala
中文名同方差性
外文名Homoscedasticity
别 名最小二乘法
表达式Var(u|x)=σ^2
提出者Achen
提出时间1995年06月01日
适用领域数学统计、经济统计、机器学习算法
应用学科计量统计学
中文名异方差性
外文名heteroscedasticity
相对于方差
类 型一个重要假定
中文名异方差性
外文名heteroscedasticity
相对于方差
类 型一个重要假定
异方差性是计量经济学术语。指回归模型中扰动项的方差不全相等。假设线性回归模型
中,扰动项 ε 的分量
是均值为零,彼此独立的,但
不全相等,在这种情况下。OLS 估计虽然具有无偏性和一致性,却不是最优线性无偏估计。因此在预测时
波动较大。为此,在应用 OLS 方法之前要对模型的异方差性进行检验,并设法消除异方差性。 [1]
对存在异方差性的模型可以采用加权最小二乘法进行估计。
异方差性的检测——White test
在此检测中,原假设为:回归方程的随机误差满足同方差性。对立假设为:回归方程的随机误差满足异方差性。判断原则为:如果nR2>chi2 (k),则原假设就要被否定,即回归方程满足异方差性。
在以上的判断式中,n代表样本数量,自由度为k(解释变量的个数)。chi2(卡方统计)值可查表所得。
含义
回归模型的随机扰动项ui在不同的观测值中的方差不等于一个常数,Var(ui)
常数(i=1,2,…,n),或者Var(ui)
Var(uj)(i,j=1,2,…,n),这时我们就称随机扰动项ui具有异方差性(Heteroskedasticity)。
在实际经济问题中,随机扰动项ui往往是异方差的,但主要在截面数据分析中出现。
例如:
(1)调查不同规模公司的利润,发现大公司的利润波动幅度比小公司的利润波动幅度大;
(2)分析家庭支出时发现高收入家庭支出变化比低收入家庭支出变化大。在分析家庭支出模型时,我们会发现高收入家庭通常比低收入家庭对某些商品支出有更大的方差;
1.模型中缺少某些解释变量,从而随机扰动项产生系统模式
由于随机扰动项ui包含了所有无法用解释变量表示的各种因素对被解释变量的影响,即模型中略去的经济变量对被解释变量的影响。如果其中被略去的某一因素或某些因素随着解释变量观测值的不同而对被解释变量产生不同的影响,就会使ui产生异方差性。
例如,以某一时间截面上不同收入家庭的数据为样本,研究家庭对某一消费品(如服装、食品等)的需求,设其模型为:
,其中Qi表示对某一消费品的需求量,Ii为家庭收入,ui为随机扰动项。ui包括除家庭收入外其他因素对Qi的影响。如:消费习惯、偏好、季节、气候等因素,ui的方差就表示这些因素的影响可能使得Qi偏离均值的程度。在气候异常时,高收入家庭就会拿出较多的钱来购买衣服,而低收入的家庭购买衣服的支出就很有限,这时对于不同的收入水平Ii,Qi偏离均值的程度是不同的,Var(ui)
常数,于是就存在异方差性了。
异方差性容易出现在截面数据中,这是因为在截面数据中通常涉及某一确定时点上的总体单位。比如个别的消费者及其家庭、不同行业或者农村、城镇等区域的划分,这些单位各自有不同的规模或水平,一般情况下用截面数据作样本时出现异方差性的可能性较大。
2.测量误差
测量误差对异方差性的作用主要表现在两个方面:一方面,测量误差常常在一定时间内逐渐积累,误差趋于增加,如解释变量X越大,测量误差就会趋于增大;另一方面,测量误差可能随时间变化而变化,如抽样技术或收集资料方法的改进就会使测量误差减少。所以测量误差引起的异方差性一般都存在于时间序列中。
例如,研究某人在一定时期内学习打字时打字差错数Yt与练习打字时间Xt之间的关系。显然在打字练习中随时间的增加,打字差错数将减少,即随着Xt的增加Yt将减小。这时Var(ut)将随Xt的增加而减少,于是存在异方差性。
不仅在时间序列上容易出现异方差性,利用平均数作为样本数据也容易出现异方差性。因为许多经济变量之间的关系都服从正态分布,例如不同收入组的人数随收入的增加是正态分布,即收入较高和较低的人是少数的,大部分人的收入居于较高和较低之间,在以不同收入组的人均数据作为样本时,由于每组中的人数不同,观测误差也不同,一般来说,人数多的收入组的人均数据较人数少的收入组的人均数据具有较高的准确性,即Var(Ii呈现先降后升的趋势,这也存在着异方差性。
3.模型函数形式设置不正确
模型函数形式的设定误差。如将指数曲线模型误设成了线性模型,则误差有增大的趋势。
4.异常值的出现
随机因素的影响,如政策变动、自然灾害、金融危机、战争和季节等。
类型
异方差一般可归结为三种类型:
(1)单调递增型:随X的增大而增大,即在X与Y的散点图中,表现为随着X值的增大Y值的波动越来越大
(2)单调递减型:随X的增大而减小,即在X与Y的散点图中,表现为随着X值的增大Y值的波动越来越小
(3)复杂型:与X的变化呈复杂形式,即在X与Y的散点图中,表现为随着X值的增大Y值的波动复杂多变没有系统关系。
检验存在的方法
事实也证明,实际经济问题中经常会出现异方差性,这将影响回归模型的估计、检验和应用。因此在建立计量经济模型时应检验模型是否存在异方差性。关于异方差性检验的方法大致有:图示检验法、Goldfeld - Quandt 检验法、White检验法、Park检验法和Gleiser检验法。
后果
在古典回归模型的假定下,普通最小二乘估计量是线性、无偏、有效估计量,即在所有无偏估量中,最小二乘估计量具有最小方差性——它是有效估计量。如果在其他假定不变的条件下,允许随机扰动项ui存在异方差性,即ui的方差随观测值的变化而变化,这就违背了最小二乘法估计的高斯——马尔柯夫假设,这时如果继续使用最小二乘法对参数进行估计,就会产生以下后果:
2.异方差模型中的方差不再具有最小方差性;
3.t检验失去作用;
4.模型的预测作用遭到破坏。
补救措施:
- 1.
对模型变换,当可以确定异方差 的具体形式时,将模型作适当变换有可能消除或减轻异方差的影响。
- 2.
加权最小二乘法,对原模型变换的方法与加权二乘法实际上是等价的,可以消除异方差。
- 3.
买模型的对数变换,运用对数变换能使测定变量值的尺度缩小。它可以将两个数值之间原来10倍的差异缩小到只有2倍的差异。其次,经过对数变换后的线性模型,其残差e表示相对误差,而相对误差往往比绝对误差有较小的差异。
处理方法
- 1.
假如已知异方差函数具体形式,进行方差齐性变换;
- 2.
假如不知异方差函数的具体形式,拟合条件异方差模型。