时间序列专题—平稳时间序列（一）：自相关（时间趋势图、自相关图）、一阶回归方程

“时间序列数据”根据性质又可以划分为“平稳序列”（stationary）与“非平稳序列”（non-stationary）两大类，需使用不同的计量方法。

一、时间序列自相关

时间序列指同一个体在不同时点上的观测数据。

如，1978-2013年期间，中国每年的国内生产总值。

对于离散时间{1,2,...,T}，可将时间序列写为{y₁,y₂,...,y_T}。其中每一个y_t都是随机变量。

时间序列最大的特点是存在自相关，不同期的观测值之间存在相关性。

定义时间序列{y_t}的k阶自协方差（autocovairiance of order k）为

stata中的应用：

（一）时间趋势图

tset varname——建立一个时间变量

tsline y,xline(起始年（时间跨度）终止年）——等价于命令“line 因变量自变量”

但GDP存在指数增长（exponential growth）的趋势。通常的处理方法是，将GDP取对数，把指数趋势变为线性趋势后，生成时间趋势图即：

gen lngdp = log(gdp)

tsline lngdp,xlabel(2000(2)2018)

GDP对数存在线性趋势，但依然不平稳（期望值不断增长）。将GDP对数进行一阶差分，然后画出时间趋势图。

gen dlngdp=d.lngdp——一阶差分

tsline dlngdp,xlabel(2000(2)2018)

之所以考察GDP对数差分，是因为它约等于GDP的增长率。

有时可以直接将Δlny_t视为y_t的增长率，如增长率较高，则误差较大。下面对GDP的增长率（g），并对GDP对数差分进行画图对比。

gen g2=(gdp-l.gdp)/(l.gdp)

tsline dlngdp g2,xlabel(2000(2)2018) lpattern(dash)

其中“l.y”是滞后期的式子。

（二）自相关图：corrgram

其中，LAG表示滞后期系数，AC表示自相关系数，PAC表示偏自相关系数，Q表示Q统计量，Autocorrelation将AC这一列用图示的方式表现出来，

若想看出第几阶的自相关系数是否为0：ac dln因变量,lags(20)

其中，“ac”表示“autocorrelation”；选择项“lags(20)”表示1-20阶的自相关图，若不添加前述选择项，则系统默认按照“min{floor(n/2)-2,40}”计算最高阶数，floor(n/2)表示为不超过n/2的最大整数。

按照图中注释，灰色部分代表95%的置信区间。图中的点如果没有超出灰色区域，则其所代表的阶不显著，反之，超出则代表自相关系数显著不为0。

二、一阶自回归

此前的回顾均强调推断因果关系。

在时间序列中，可用该变量的过去值来预测其未来值（因为时间序列一般存在自相关）。——这种模型称为“单变量时间序列”（umivariate time series）。

此时可不必理会因果关系，只考虑相关关系即可。

在内蒙古阿拉善盟2000~2018年GDP总值数据中，以OLS估计Δlny_t的一阶回归模型，仅使用2010年以前的数据来预测2020年的GDP

由于假设干扰项ε_t无自相关，故使用异方差稳健的标准误即可（,r），不必使用异方差自相关稳健的HAC标准误。

可得下列回归方程：

计算回归方程的拟合值，即上述回归方程的因变量，并记为dlny1。

在stata中，会使用“x[n]”表示“变量x的第n个观测值”，故命令如下：

dis exp( lngdp[15]+ dlngdp1[16])

得出结果：200.53765

其中， lngdp[15]是2015年的GDP值， dlngdp1[16]是2016年GDP的预测值。

根据AR(1)模型，2016年GDP的预测值为200.53765亿元。

对比2013年的实际GDP，并计算预测误差，即（y₂₀₁₃-y₂₀₁₃^）：

预测误差为122.04233亿元，低估了122.04233亿元。

posted on 2020-12-01 16:26 笑渐不闻声渐悄阅读(16128) 评论(0) 编辑收藏举报

刷新页面返回顶部