时间序列分析2.X AR与MA

ARMA与ARIMA模型

对平稳时间序列和非平稳时间序列,分别假定适当的 ARMA 模型和 ARIMA 模型

对非平稳时间序列建立 ARIMA 模型,实际上是通过先用适当的变换将非平稳序列转化为平稳序列,然后再建立 ARMA 模型

差分消除趋势性和季节性

将非平稳序列化为平稳序列的常见变换

  • 趋势差分以消除趋势性
  • 季节差分以消除季节性
  • Box-Cox 变换以使得波动稳定化

趋势差分

\(y_{t}=x_{t}-x_{t-1}=\nabla x_{t}\)

季节差分

\(y_{t}=x_{t}-x_{t-s}=\nabla_{s} x_{t}\)
s 常取12

当序列同时有趋势性与周期性时,先趋势差分,再季节差分 \(z_{t}=\nabla_{12} y_{t}=\nabla_{12} \nabla x_{t}\)

对于波动随时间变化的序列变为平稳序列

  • 先做适当的 Box-Cox 变换,使得其波动稳定化,然后再进行差分运算消除趋势性和季节性
  • 先取对数,再趋势差分,最后季节差分
    \(w_{t}=\nabla_{12} \nabla \ln x_{t}\)

平稳过程

弱平稳过程

定义

满足:

  • \(E\left(X_{t}^{2}\right)<\infty\)
  • \(E\left(X_{t}\right)\) 为常数
  • \(\operatorname{Cov}\left(X_{t}, X_{t-k}\right)\)\(t\) 无关, \(\forall k\)

即称为弱平稳过程

性质

  • \(k=0, Var(X_t)=\sigma^2, \forall t\) (波动不会随时间变化)
  • \(\forall s<t,\operatorname{Cov}(X_t,X_s)=\operatorname{Cov}(X_t,X_{t-(t-s)})\) 只与 \(t-s\) 有关
  • \(\operatorname{Corr}(X_t,X_s)\) 两点相关性只与间隔有关.(由此可以用昨天到今天的规律,根据今天的情况预测明天)

白噪声过程

满足:

  • \(E\left(X_{t}\right)=\mu~, \forall t\)
  • \(\operatorname{Var}\left(X_{t}\right)=\sigma^{2}~, \forall t\)
  • \(\operatorname{Cov}\left(X_{t}, X_{s}\right)=0~, \forall t \neq s\)
  • 不必相互独立

称为白噪声过程, \(Z_{t} \sim W N\left(0, \sigma_{Z}^{2}\right)\)

性质

  • 满足 \(\rho_k=0,~\forall k\geq1\) ,即无序列相关性

随机漫步(RW)

随机漫步

定义

如果 \(X_{t}=X_{t-1}+Z_{t}\)

经过地推可以得到 \(X_{t}=X_{0}+Z_{1}+Z_{2}+\cdots+Z_{t}\)

性质

假设 \(X_0=0\), 对于随机漫步而言,

\[E\left(X_{t}\right)=0 ; \operatorname{Var}\left(X_{t}\right)=t \sigma_{Z}^{2} \]

\(t\) 有关, 故不是平稳过程

带漂移项的随机漫步

定义

如果 \(X_{t}=\mu+X_{t-1}+Z_{t}\)

经过推导可得

\[X_{t}=X_{0}+t \mu+\sum_{i=1}^{t} Z_{i} \]

性质

假设 \(X_0=0\), 对于带漂移项的随机漫步而言,

\[E\left(X_{t}\right)=t\mu ; \operatorname{Var}\left(X_{t}\right)=t \sigma_{Z}^{2} \]

\(t\) 有关, 故不是平稳过程

ACF 及序列相关性的度量

ACF

延迟 k 自协方差函数

\(\gamma_{X}(k)=\operatorname{Cov}\left(X_{t}, X_{t-k}\right)\)

延迟 k 自相关函数

\[\rho(k)=\frac{\gamma_{X}(k)}{\gamma_{X}(0)} \]

\(\rho(k)\) 常记作 \(\rho_k\)

ACF性质

  • \(\rho(0)=1\)
  • \(\rho(-k)=\rho(k)\)
  • \(|\rho(k)|\leq 1\)

样本自相关函数

间隔 k 的相关系数

\[\hat{\rho}_{k}=\frac{\hat{\gamma}_k}{\hat{\gamma}_0}= \frac{\sum_{t=1}^{T-k}\left(x_{t}-\bar{x}\right)\left(x_{t+k}-\bar{x}\right)}{\sum_{t=1}^{T}\left(x_{t}-\bar{x}\right)^{2}} \]

自相关图

以延迟阶数 \(k\) 为横坐标, \(\hat{\rho}_k\) 为纵坐标绘图

AR自回归模型

\(p\) 阶自回归过程 \(AR(p)\)

满足 \(X_{t}=\phi_{1} X_{t-1}+\phi_{2} X_{t-2}+\cdots+\phi_{p} X_{t-p}+Z_{t}\)平稳\(\{X_t\}\) 称为
(中心化的) \(p\) 阶自回归过程, 记为 \(AR(p)\)

一般\(AR(p)\) 可以表示为 \(X_{t}-\mu=\phi_{1}\left(X_{t-1}-\mu\right)+\phi_{2}\left(X_{t-2}-\mu\right)+\cdots+\phi_{p}\left(X_{t-p}-\mu\right)+Z_{t}\)
其可以等价展开成 \(X_{t}=\phi_{0}+\phi_{1} X_{t-1}+\phi_{2} X_{t-2}+\cdots+\phi_{p} X_{t-p}+Z_{t}\) ,
其中 \(\phi_{0}=\mu(1-\phi_1-\cdots-\phi_p)\)

\(AR(1)\)

模型样式

\(X_t=\phi X_{t-1}+Z_t\)

性质

由于 \(\{X_t\}\)\(\{X_t-\mu\}\) 有相同的方差与协方差, 故我们可以令 \(\mu=0\)
容易验证,当 \(\phi<1\) 时,

对模型重复进行迭代, 我们有

\[\begin{aligned} X_{t} &=\phi\left(\phi X_{t-2}+Z_{t-1}\right)+Z_{t}=\phi^{2} X_{t-2}+\phi Z_{t-1}+Z_{t} \\ &=\phi^{2}\left(\phi X_{t-3}+Z_{t-2}\right)+\phi Z_{t-1}+Z_{t}=\phi^{3} X_{t-3}+\phi^{2} Z_{t-2}+\phi Z_{t-1}+Z_{t}\\ &=\cdots \end{aligned} \]

一直进行下去,如果 \(|\phi|<1\) 容易验证其为平稳序列, 且其ACF函数为

\[\gamma_{X}(k)=\sum_{i=0}^{\infty} \phi^{i} \phi^{i+k}= \frac{\phi^{k}}{1-\phi^{2}} \]

Xt 可以表示为当前和过去时刻扰动的收敛线性组合,即 \(MA(\infty)\) 形式,此时称 Xt 是因果过程。我们也可以得出结论: \(AR(1)\) 是因果平稳的充要条件是 \(|\phi|<1\)

期望与ACF

image

\(AR(2)\)

模型表示

\[\begin{array}{c} X_{t}=\phi_{1} X_{t-1}+\phi_{2} X_{t-2}+Z_{t} \\ \left(1-\phi_{1} B-\phi_{2} B^{2}\right) X_{t}=Z_{t} \end{array}\]

因果平稳条件

\[\phi(B)=1-\phi_{1} B-\phi_{2} B^{2}=\left(1-\pi_{1} B\right)\left(1-\pi_{2} B\right) \]

\(\pi_1\) , \(\pi_2\)\(\phi(B)=0\) 的两个根的倒数

\((1-\pi_2B)X_t=Y_t\) , 有 \((1-\pi_1B)Y_t=Z_t\)
\(|\pi_1|<1\) , \(\{Y_t\}\) 为因果平稳过程
\(|\pi_2|<1\) , \(X_t\) 可表示为 $$X_{t}=\sum_{j=0}^{\infty} \pi_{2}^{j} Y_{t-j}$$
也为因果平稳过程

所以, AR(2) 为因果平稳过程的条件是 \(\phi(B)=0\) 的两个根在单位圆外, 即 \(|\pi_1|<1\) , \(|\pi_2|<1\)

ACF

\(X_{t}=\phi_{1} X_{t-1}+\phi_{2} X_{t-2}+Z_{t}\) (为方便研究, 无妨设 \(\mu=0\))

两边同时乘以 \(X_{t-k}\) 并取期望
\(\gamma_{k}=\phi_{1} \gamma_{k-1}+\phi_{2} \gamma_{k-2}\)

再两边同除以 \(\gamma_{0}\) , 可得到
\(\rho_{k}=\phi_{1} \rho_{k-1}+\phi_{2} \rho_{k-2}, \forall k>0\)

\(k=1\), 利用 \(\rho_{-1}=\rho_{1}, \rho_{0}=1\), 有

\[\rho_1=\phi_1\rho_0+\phi_2\rho_1 \Rightarrow \rho_1=\phi_1+\phi_2\rho_1 \Rightarrow \rho_1=\frac{\phi_1}{1-\phi_2} \]

\(\rho_{k}=\phi_{1} \rho_{k-1}+\phi_{2} \rho_{k-2}, \forall k>0\) , 与 \(\rho_1=\frac{\phi_1}{1-\phi_2}~, \rho_{0}=1\) ,可以计算任意阶延迟的ACF

平均周期长度

\(1-\phi_{1} B-\phi_{2} B^{2}=0\) 特征方程为 \(y^{2}-\phi_{1} y-\phi_{2}=0\)
若特征方程的根为共轭复特征根
记为 \(a\pm bi\)

则平均周期长度

\[k=\frac{2 \pi}{\cos ^{-1}[a / \sqrt{a^{2}+b^{2}}]} \]

\(AR(p)\)

AR建模

步骤

  • 确保对象为平稳序列
  • 定阶
  • 估计参数
  • 残差诊断
  • 优化
  • 预测

定阶

PACF定阶

定义

\(PACF=Corr(X_t,X_{t-k}|X_{t-1},X_{t-2},\cdots,X_{t-k+1})\)
通过PACF图在 \(p\) 处截尾, 选取 \(p\)

信息准则定阶

  • 赤池信息准则 (AIC)
  • 贝叶斯信息准则 (BIC)

MA移动平均模型

\(MA(q)\)定义

满足 \(X_{t}=\mu+Z_{t}+\theta_{1} Z_{t-1}+\theta_{2} Z_{t-2}+\cdots+\theta_{q} Z_{t-q}\) 的平稳过程

性质

平稳性

不需要系数满足额外的限制条件,\(MA\) 模型总是因果平稳的

\(E\left(X_{t}\right)=\mu ; \quad \operatorname{Var}\left(X_{t}\right)=\sigma_{Z}^{2}\left(1+\theta_{1}^{2}+\cdots+\theta_{q}^{2}\right)\)

以及 \(\operatorname{Cov}\left(X_{t}, X_{t-k}\right)\) 均与 \(t\) 无关;

ACF

\[\operatorname{Cov}(X_{t}, X_{t-k})=\left\{\begin{array}{lr} (1+\theta_{1}^{2}+\cdots+\theta_{q}^{2}) \sigma_{Z}^{2} & k=0 \\ (\sum_{i=0}^{q-k} \theta_{i} \theta_{i+k}) \sigma_{Z}^{2} & 1 \leq k \leq q \\ 0 & k>q \end{array}\right\}\]

这里记 \(\theta_{0}=1\)

于是, \(M A(q)\) 过程的 \(ACF\)

\[\rho_{k}=\frac{\gamma_{k}}{\gamma_{0}}=\left\{\begin{array}{lc} 1 & k=0 \\ \frac{\sum_{i=0}^{q-k} \theta_{i} \theta_{i+k}}{1+\theta_{1}^{2}+\cdots+\theta_{q}^{2}} & 1 \leq k \leq q \\ 0 & k>q \end{array}\right.\]

可逆性

定义

如果 \(t\) 时刻的随机扰动可以表示为当前值历史值的一个收敛和的形式,即
\(Z_{t}=\sum_{j=0}^{\infty} \pi_{j} X_{t-j}\)

其中, \(\pi_{0}=1, \sum\left|\pi_{j}\right|<\infty\) .

形式

\[\begin{array}{c} X_{t}=\theta(B) Z_{t} \stackrel{可逆}{==} Z_{t}=X_{t}+\pi X_{t+1}=\pi(B) X_{t} \\ \theta(B) \pi(B)=1 \end{array}\]

MA建模

定阶

通过ACF图在 \(q\) 处截尾, 选取 \(q\)

posted @ 2022-11-06 21:57  WilliamHuang2022  阅读(258)  评论(0编辑  收藏  举报