平稳性
2021-10-5
| 2023-8-6
0  |  阅读时长 0 分钟
type
status
date
slug
summary
tags
category
icon
password
Property
 
判断一个序列是不是平稳序列有三个评判标准:
  1. 均值 ,是与时间无关的常数。下图(左)满足平稳序列的条件,下图(右)很明显具有时间依赖。
    1. notion image
  1. 方差 ,是与时间无关的常数。这个特性叫做方差齐性。下图显示了什么是方差对齐,什么不是方差对齐。(注意右手边途中的不同分布。)
    1. notion image
  1. 协方差 ,只与时期间隔有关,与时间无关的常数。如下图(右),可以注意到随着时间的增加,曲线变得越来越近。因此红色序列的协方差并不是恒定的。
    1. notion image
 

为什么要关心平稳时间序列呢?

除非时间序列是平稳的,否则不能建立一个时间序列模型。在很多案例中时间平稳条件常常是不满足的,所以首先要做的就是让时间序列变得平稳,然后尝试使用随机模型预测这个时间序列。有很多方法来平稳数据,比如消除长期趋势,差分化。

随机游走

这是时间序列最基本的概念 例子:想想一个女孩随机的在想象一个女孩在一个巨型棋盘上面随意移动。这里,下一个位置只取决于上一个位置。
notion image
现在想象一下,你在一个封闭的房间里,不能看见这个女孩。但是你想要预测不同时刻这个女孩的位置。怎么才能预测的准一点?当然随着时间的推移你预测的越来越不准。在t=0时刻,你肯定知道这个女孩在哪里。下一个时刻女孩移动到附件8块方格中的一块,这个时候,你预测到的可能性已经降为1/8。继续往下继续预测,现在将这个序列公式化:
这里的代表这这个时间点误差项。这个就是女孩在每一个时间点带来的随机性。
现在我们递归所有时间点,最后我们将得到下面的等式:
 
现在,验证一下随机游走的平稳性假设:
1. 均值是常数吗?
由于随机过程的随机干扰项的期望值都为0,因此:E[X(t)] = E[X(0)] = 常数
2. 方差是常数吗?
=时间相关
因此,我们推断,随机游走不是一个平稳的过程,因为它有一个时变方差。此外,如果我们检查的协方差,会发现协方差也依赖于时间。
 
我们已经知道一个随机游走是一个非平稳的过程。让我们在方程中引入一个新的系数,看看我们是否能使公式平稳。
引入Rho系数
X(t) = Rho * X(t-1) + Er(t)
现在,我们将改变Rho看看我们可不可以让这个序列变的平稳。这里我们只是看,并不进行平稳性检验。
让我们从一个Rho=0的完全平稳序列开始。这里是时间序列的图:
notion image
将Rho的值增加到0.5,我们将会得到如下图:
notion image
你可能会注意到,我们的周期变长了,但基本上似乎没有一个严重的违反平稳性假设。现在让我们采取更极端的情况下Rho= 0.9
notion image
我们仍然看到,在一定的时间间隔后,从极端值返回到零。这一系列也不违反非平稳性明显。现在,让我们用Rho= 1随机游走看看
notion image
这显然是违反固定条件。是什么使Rho= 1变得这么特殊的呢?这种情况并不满足平稳性测试?我们来找找这个数学的原因
公式X(t) = Rho * X(t-1) + Er(t)的期望为:E[X(t)] = Rho *E[ X(t-1)]
这个公式很有意义。下一个X(或者时间点t)被拉到Rho*X的最后一个值。
例如,如果X(t–1)=1,E[X(T)] = 0.5(对于Rho= 0.5)。现在,如果X从零向任何方向移动移动,则在下一步中将其拉回零。唯一可以进一步推动它的组件是误差项。误差项在任一方向上的可能性都相同。当Rho变成1时会发生什么?下一步中,没有任何力量可以将X拉下。

Dickey Fuller 平稳性检验

上面的内容正式称为Dickey Fuller 测试。这是一个小调整,用于将我们的方程转换为Dickey Fuller检验:
在统计学里,Dickey-Fuller检验是测试一个自回归模型是否存在单位根。 我们必须测试Rho–1是否与零显著不同。如果零假设不成立,我们将得到一个平稳时间序列。 平稳性测试和将一个序列转换为平稳性序列是时间序列模型中最重要的部分。
 
 

严平稳过程

定义: 是一个严格随机过程,如果

宽平稳过程

指的是的期望、方差、协方差不随时间推移而变化
定义: 是一个随机过程,如果
那么 是一个 宽平稳随机过程

自相关系数性质

  • 规范性,
  • 对称性,
  • 非负定性,自相关矩阵非负定
  • 非唯一性,平稳序列对应唯一的自相关系数,自相关系数对应多个平稳过程这给我们建模有诸多挑战

严平稳与宽平稳的关系

  • 在时间序列中讨论的平稳,通常指弱平稳
  • 如果低阶距存在,那么严平稳过程能推出宽平稳成立
  • 如果服从多元正态分布,那么宽平稳可以推出严平稳
如果低阶距不存在,那么严平稳不能推出宽平稳。例如柯西分布

平稳性的意义

  1. 多个随机变量,但每个随机变量只有1个样本。(需要用观察值序列推断)
  1. 平稳性可以极大减少随机变量的个数,增加待估变量的样本容量。例如,如果序列平稳,那么可以 用全部观察值去估计均值、方差 。
  1. 减少分析难度,提高精度。
伪回归的根本原因在于时间序列的非平稳性。用传统方法对彼此不相关的非平稳变量进行回归,那么t检验和F检验往往倾向于显著
 

平稳性的检验

时序图

画图,图形在某个常数值附近随机波动,波动范围有界、无趋势、无周期,说明序列平稳。

自相关图

自相关系数很快衰减到0,说明序列平稳。如果自相关系数一直很高,或者自相关系数出现周期性,或者自相关系数先递减后递增,说明序列不平稳。
 
除了看图外,statsmodels.tsa.stattools.acf可以方便地给出有关统计量

DF检验

Dickey-Fuller(DF)
DF检验有三种形式:
如果,序列 是平稳的; ,序列非平稳,但一阶差分是平稳的;,序列发散
 
step1: 建立假设 H0: H1:
step2: 进行t检验
 
通常用这样的检验方程:
问题转化为检验

ADF检验

DF检验只适合一阶自相关的情况。也就是假设 没有自相关性,但实际数据大多不满足此假设,所以改进到ADF检验ADF(augmented Dickey-Fuller test,增广的迪基-福勒检验法)检验适合高阶自相关的情况
ADF检验的三种基本模型: 
其中是一个平稳过程,允许存在自相关性,如此ADF检验变为如下形式:
 
 

白噪声过程

满足两个性质:
显然,白噪声过程是平稳过程

白噪声过程的性质

纯随机性
方差齐性
根据马尔科夫定理,只有方差齐性时,用OLS得到的参数估计值才是准确的、有效的。
 

白噪声的检验

检验原理
Barlett定理:如果 是白噪声过程, 是观察期数为n的观察序列, 是观察序列的自相关系数,那么 (近似服从正态分布,是因为期数有限)
推论:
 
假设
序列是白噪声过程, (因为期数有限,所以只计算前m个相关系数)
 
构造统计量
  • Q统计量
  • LB统计量(对于小样本的表现也良好)Ljung-Box q statistic
判别原则
,证明可以拒绝原假设,认为不是白噪声过程
代码实现见于上文acf,只需要设定qstat=True
  • Statsmodels
  • 统计时序ARMA理论
    目录