计量经济学导论09:协整与误差修正模型
协整与误差修正模型
长期均衡与协整分析
经典回归模型是建立在平稳数据变量基础上的。许多经济变量是非平稳的,使用经典回归模型会出现伪回归等诸多问题。但是如果变量之间有着长期的稳定关系,即它们之间是协整的,则可以使用经典回归模型。
长期均衡意味着经济系统不存在破坏均衡的内在机制,如果变量在某时期受到干扰后偏离其长期均衡点,则均衡机制将会在下一期进行调整以使其重新回到均衡状态。
假设 \(X\) 与 \(Y\) 之间的长期均衡关系由下式描述:
这个式子对均衡关系的解释为:给定 \(X\) 的一个值,\(Y\) 相应的均衡值也随之确定为 \(\alpha_0+\alpha_1X\) 。
这个式子隐含了一个重要的假设:\(\mu_t\) 必须是平稳序列。
如果假设不成立,即 \(\mu_t\) 有上升或下降的随机性趋势。会导致 \(Y\) 对其均衡点的任何偏离被长期累积下来而不能被消除。
在这个假设的基础上,我们称 \(\mu_t\) 为非均衡误差,它是变量 \(X\) 和 \(Y\) 的一个线性组合
如果 \(X\) 与 \(Y\) 之间具有长期均衡关系,则 \(\mu_t\) 应是一零均值平稳时间序列,即零均值 \({\rm I}(0)\) 序列。
另一方面,非平稳的时间序列 \(X\) 和 \(Y\) 的线性组合可能成为平稳时间序列,我们称 \(X\) 和 \(Y\) 是协整的。由此便引出了协整的定义。
协整的定义
如果时间序列 \(Y_{t1},Y_{t2},...,Y_{tk}\) 都是 \(d\) 阶单整的,存在向量 \(\boldsymbol\alpha=(\alpha_1,\alpha_2,...,\alpha_k)\),使得
\[Z_t=\boldsymbol{\alpha}\boldsymbol{Y}^{\rm T}=\alpha_1Y_{t1}+\alpha_2Y_{t2}+...+\alpha_kY_{tk}\sim {\rm I}(d-b) \ , \ \ \ \ d\geq b\geq 0 \ , \]则称序列 \(Y_{t1},Y_{t2},...,Y_{tk}\) 是 \((d,\,b)\) 阶协整,记为 \({\rm CI}(d,\,b)\) 。
如果两个变量都是单整变量,只有当它们的单整阶数相同时,才可能协整;如果它们的单整阶数不相同,就不可能协整。
如果存在三个以上的单整变量且具有不同的单整阶数,有可能经过线性组合构成低阶单整变量。
例如:\(W_t\sim{\rm I}(1)\) ,\(V_t\sim{\rm I}(2)\) ,\(U_t\sim{\rm I}(2)\) ,
若进行以下的线性变换并满足以下条件:
\[P_t=aV_t+bU_t\sim{\rm I}(1) \ , \]\[Q_t=cW_t+dP_t\sim{\rm I}(0) \ , \]则有结论:
\[V_t,\,U_t\sim{\rm CI}(2,\,1) \ , \]\[W_t,\,P_t\sim{\rm CI}(1,\,1) \ . \]
\({\rm CI}(d,\,d)\) 的经济意义:两个变量虽然它们具有各自的长期波动规律,但是如果它们是 \((d,d)\) 阶协整的,则它们之间存在着一个长期稳定的比例关系。即使两个时间序列是非平稳的,也可以用经典的回归分析方法建立回归模型。
协整的检验
两变量 Engle-Granger 检验
检验两个呈现 \({\rm I}(1)\) 的变量 \(y_t,\,x_t\) 是否为协整。
step.1 用 OLS 估计如下方程并计算非均衡误差(该回归又被称为协整回归、静态回归):
得到
step.2 检验 \(e_t\) 的平稳性:
如果 \(e_t\) 是平稳序列 \({\rm I}(0)\) ,则 \(y_t,x_t\sim {\rm CI}(1,1)\), \(x_t\) 与 \(y_t\) 之间存在协整关系;
如果 \(e_t\) 是非平稳的,则 \(x_t\) 与 \(y_t\) 之间不存在协整关系。
检验方法:DF 检验或 ADF 检验
注意:这里的检验对象是协整回归计算出的误差项,并非真正的非均衡误差。而 OLS 法采用了最小残差平方和的原理,因此估计量 \(\delta\) 是向下偏倚的,这将导致拒绝零假设的机会比实际情形大。因此对于 \(e_t\) 的平稳性检验的 DF 与 ADF 临界值比正常的 DF 与 ADF 检验的临界值小。
多变量协整关系检验
扩展的 EG 检验
为什么多变量协整关系的检验比双变量复杂?——协整变量间可能存在多种稳定的线性组合。
例如:假设有4个 \({\rm I}(1)\) 的变量 \(Z,X,Y,W\) ,它们有如下的长期均衡关系:
\[Z_t=\alpha_0+\alpha_1W_t+\alpha_2X_t+\alpha_3Y_t+\mu_t \ , \]得到非均衡误差 \(\mu_t\) 是 \({\rm I}(0)\) 序列
\[\mu_t=Z_t-\alpha_0-\alpha_1W_t-\alpha_2X_t-\alpha_3Y_t\sim{\rm I}(0) \ . \]但存在另一种情况,假设 \(Z\) 与 \(W\) ,\(X\) 与 \(Y\) 之间分别存在长期均衡关系
\[Z_t=\beta_0+\beta_1W_t+u_t \ , \]\[X_t=\gamma_0+\gamma_1Y_t+v_t \ , \]则非均衡误差项 \(u_t\) 和 \(v_t\) 一定是平稳序列 \({\rm I}(0)\) 。于是它们的线性组合也一定是平稳序列,如:
\[w_t=u_t+v_t=Z_t-\beta_0-\gamma_0-\beta_1W_t+X_t-\gamma_1Y_t\sim{\rm I}(0) \ . \]因此存在多组协整向量。
多变量的协整检验步骤:
- 与双变量基本相同,需要检验变量是否具有同阶单整性,以及是否存在稳定的线性组合。
- 在检验是否存在稳定的线性组合时,需要通过设置一个变量为被解释变量,其他变量为解释变量,进行 OLS 估计并检验残差序列是否为平稳序列。如果不平稳则需更换被解释变量,进行同样的 OLS 估计和相应的残差序列的平稳性检验。
- 当所有的变量都被作为被解释变量检验之后,仍不能得到平稳的残差项序列,则认为这些变量间不存在 \((1,\,1)\) 阶协整。
一般差分模型的问题
对于非平稳时间序列,可以通过差分的方法将其化为稳定序列。
但是这种做法会引起两个问题:
- 如果 \(X\) 与 \(Y\) 之间存在长期稳定的均衡关系,且误差项 \(\mu_t\) 不存在序列相关性,则差分式中的 \(v_t\) 是一个一阶移动平均时间序列,因而存在序列相关的问题。
- 如果采用差分形式进行估计,则关于变量水平值的重要信息将被忽略,这时的模型只表达了 \(X\) 和 \(Y\) 之间的短期关系,而没有揭示它们间的长期关系。
例如,当我们使用 \(\Delta Y_t=\alpha_1\Delta X_t+v_t\) 进行回归分析时,容易出现截距项显著不为 \(0\) 的情况,即我们得到的估计方程是
\[\Delta Y_t=\hat\alpha_0+\hat\alpha_1\Delta X_t+\hat{v}_t\ , \ \ \ \ \hat\alpha_0\neq0 \ . \]此时即使保持 \(X\) 不变, \(Y\) 也会出于长期的上升或下降的过程中,这意味着 \(X\) 与 \(Y\) 之间不存在静态均衡,与大多数具有长期均衡的经济理论假说不相符。
误差修正模型
假设 \(X_t\) 与 \(Y_t\) 的长期均衡关系为
由于现实经济中 \(X\) 与 \(Y\) 很少处在均衡点上,因此实际观测到的只是 \(X\) 与 \(Y\) 之间的短期或非均衡的关系。假设 \(X\) 与 \(Y\) 之间的非均衡关系体现为如下 \((1,\,1)\) 阶分布滞后模型的形式:
该模型显示出 \(t\) 期的 \(Y\) 不仅与 \(X\) 的变化有关,而且与 \(t-1\) 期的 \(X\) 与 \(Y\) 的状态值有关。但由于变量可能具有非平稳性,因此不能直接进行 OLS 估计。
差分变形得
将上式中的参数与 \(Y_t=\alpha_0+\alpha_1X_t+u_t\) 中的相应参数视为相等,则上式中参数 \(\lambda\) 之后的项为 \(t-1\) 期的非均衡误差项。这表明 \(Y\) 的短期变化 \(\Delta Y_t\) 不仅受 \(X\) 的短期变化 \(\Delta X_t\) 影响,而且根据前一时期的非均衡程度 \({\rm ecm}_{t-1}\) 进行相应的修正调整。
误差修正项 \({\rm ecm}\) :
一阶误差修正模型
一般情况下 \(|\delta|<1\),有 \(0<\lambda<1\) 。
据此分析 ECM 模型的修正作用:
- 若上期的实际值大于长期均衡值,即 \(Y_{t-1}>\alpha_0+\alpha_1X_{t-1}\),则 \({\rm ecm}\) 为正,当期的短期变动 \(\Delta Y_t\) 减少;
- 若上期的实际值小于长期均衡值,即 \(Y_{t-1}<\alpha_0+\alpha_1X_{t-1}\),则 \({\rm ecm}\) 为负,当期的短期变动 \(\Delta Y_t\) 增大。
参数的经济意义:
- 长期均衡模型 \(Y_t=\alpha_0+\alpha_1X_t+u_t\) 中的 \(\alpha_1\) 可视为 \(Y\) 关于 \(X\) 的长期弹性;
- 短期非均衡模型 \(Y_t=\beta_0+\beta_1X_t+\beta_2X_{t-1}+\delta Y_{t-1}+u_t\) 中的 \(\beta_1\) 可视为 \(Y\) 关于 \(X\) 的短期弹性。
格兰杰表述定理
问题:是否变量间的关系都可以通过 ECM 来表述?
Granger 表述定理:如果变量 \(X\) 与 \(Y\) 是协整的,则它们间的短期非均衡关系总能由一个误差修正模型表述。
其中,\({\rm ecm}\) 是非均衡误差项(长期均衡偏差项),\(\lambda\) 是短期调整参数。该模型没有明确指出 \(Y\) 和 \(X\) 的滞后阶数,可以包含多阶滞后项。由于一阶差分项是 \({\rm I}(0)\) 变量,因此模型中允许采用 \(X\) 的非滞后差分项 \(\Delta X_t\) 。
建立误差修正模型的步骤
首先,对经济系统进行观察和分析,提出长期均衡关系假设。
然后,对变量进行协整分析,以发现变量之间的协整关系,即检验长期均衡关系假设,并以这种关系构成误差修正项。
最后,建立短期模型,将误差修正项看作一个解释变量,连同其他反映短期波动的解释变量一起,建立短期模型,即误差修正模型。
EG 两步法
step.1 利用 OLS 进行协整回归,检验变量间的协整关系,估计协整向量(长期均衡关系参数)
step.2 若协整性存在,则以第一步求得的残差作为非均衡误差项 \({\rm ecm}\) 加入到误差修正模型中,并用 OLS 估计相应参数
在确定 ECM 模型滞后项阶数时,需要先对模型进行回归,之后检验 ECM 模型的残差是否具有自相关性,或者采用 \(Q\) 统计量检验残差是否为白噪声。如果接受了不具有自相关性的零假设,则说明 ECM 模型的滞后阶数选择正确,否则需重新调整参数。
注意:在进行变量间的协整检验时,如有必要可在协整回归式中加入趋势项,这时对残差项的稳定性检验就无须设置趋势项。另外,第二步中变量的差分滞后期数,可以通过残差项序列是否存在自相关性来判断,如果存在自相关,则应加入变量差分后的滞后项。
注意:在实际应用研究中,如果 ECM 中误差修正项参数估计值为正,模型设定肯定是错误的。在实际分析的模型设定中,变量常以对数的形式出现,原因在于变量对数的差分近似地等于该变量的变化率,而经济变量的变化率常常是平稳序列。
直接估计法
打开误差修正模型中非均衡误差项的括号,直接用 OLS 估计模型,以双变量为例
这时可以一并获得短期弹性和长期弹性的参数估计值,但仍然需要事先对变量间的协整关系进行检验。