时间序列分析2.X AR与MA
ARMA与ARIMA模型
对平稳时间序列和非平稳时间序列,分别假定适当的 ARMA 模型和 ARIMA 模型
对非平稳时间序列建立 ARIMA 模型,实际上是通过先用适当的变换将非平稳序列转化为平稳序列,然后再建立 ARMA 模型
差分消除趋势性和季节性
将非平稳序列化为平稳序列的常见变换
- 趋势差分以消除趋势性
- 季节差分以消除季节性
- Box-Cox 变换以使得波动稳定化
趋势差分
\(y_{t}=x_{t}-x_{t-1}=\nabla x_{t}\)
季节差分
\(y_{t}=x_{t}-x_{t-s}=\nabla_{s} x_{t}\)
s 常取12
当序列同时有趋势性与周期性时,先趋势差分,再季节差分 \(z_{t}=\nabla_{12} y_{t}=\nabla_{12} \nabla x_{t}\)
对于波动随时间变化的序列变为平稳序列
- 先做适当的 Box-Cox 变换,使得其波动稳定化,然后再进行差分运算消除趋势性和季节性
- 先取对数,再趋势差分,最后季节差分
\(w_{t}=\nabla_{12} \nabla \ln x_{t}\)
平稳过程
弱平稳过程
定义
满足:
- \(E\left(X_{t}^{2}\right)<\infty\)
- \(E\left(X_{t}\right)\) 为常数
- \(\operatorname{Cov}\left(X_{t}, X_{t-k}\right)\) 与 \(t\) 无关, \(\forall k\)
即称为弱平稳过程
性质
- \(k=0, Var(X_t)=\sigma^2, \forall t\) (波动不会随时间变化)
- \(\forall s<t,\operatorname{Cov}(X_t,X_s)=\operatorname{Cov}(X_t,X_{t-(t-s)})\) 只与 \(t-s\) 有关
- \(\operatorname{Corr}(X_t,X_s)\) 两点相关性只与间隔有关.(由此可以用昨天到今天的规律,根据今天的情况预测明天)
白噪声过程
满足:
- \(E\left(X_{t}\right)=\mu~, \forall t\)
- \(\operatorname{Var}\left(X_{t}\right)=\sigma^{2}~, \forall t\)
- \(\operatorname{Cov}\left(X_{t}, X_{s}\right)=0~, \forall t \neq s\)
- 不必相互独立
称为白噪声过程, \(Z_{t} \sim W N\left(0, \sigma_{Z}^{2}\right)\)
性质
- 满足 \(\rho_k=0,~\forall k\geq1\) ,即无序列相关性
随机漫步(RW)
随机漫步
定义
如果 \(X_{t}=X_{t-1}+Z_{t}\)
经过地推可以得到 \(X_{t}=X_{0}+Z_{1}+Z_{2}+\cdots+Z_{t}\)
性质
假设 \(X_0=0\), 对于随机漫步而言,
\[E\left(X_{t}\right)=0 ; \operatorname{Var}\left(X_{t}\right)=t \sigma_{Z}^{2}
\]与 \(t\) 有关, 故不是平稳过程
带漂移项的随机漫步
定义
如果 \(X_{t}=\mu+X_{t-1}+Z_{t}\)
经过推导可得
\[X_{t}=X_{0}+t \mu+\sum_{i=1}^{t} Z_{i}
\]
性质
假设 \(X_0=0\), 对于带漂移项的随机漫步而言,
\[E\left(X_{t}\right)=t\mu ; \operatorname{Var}\left(X_{t}\right)=t \sigma_{Z}^{2}
\]与 \(t\) 有关, 故不是平稳过程
ACF 及序列相关性的度量
ACF
延迟 k 自协方差函数
\(\gamma_{X}(k)=\operatorname{Cov}\left(X_{t}, X_{t-k}\right)\)
延迟 k 自相关函数
\[\rho(k)=\frac{\gamma_{X}(k)}{\gamma_{X}(0)}
\]\(\rho(k)\) 常记作 \(\rho_k\)
ACF性质
- \(\rho(0)=1\)
- \(\rho(-k)=\rho(k)\)
- \(|\rho(k)|\leq 1\)
样本自相关函数
间隔 k 的相关系数
\[\hat{\rho}_{k}=\frac{\hat{\gamma}_k}{\hat{\gamma}_0}= \frac{\sum_{t=1}^{T-k}\left(x_{t}-\bar{x}\right)\left(x_{t+k}-\bar{x}\right)}{\sum_{t=1}^{T}\left(x_{t}-\bar{x}\right)^{2}}
\]
自相关图
以延迟阶数 \(k\) 为横坐标, \(\hat{\rho}_k\) 为纵坐标绘图
AR自回归模型
\(p\) 阶自回归过程 \(AR(p)\)
满足 \(X_{t}=\phi_{1} X_{t-1}+\phi_{2} X_{t-2}+\cdots+\phi_{p} X_{t-p}+Z_{t}\) 的平稳的 \(\{X_t\}\) 称为
(中心化的) \(p\) 阶自回归过程, 记为 \(AR(p)\)
一般的 \(AR(p)\) 可以表示为 \(X_{t}-\mu=\phi_{1}\left(X_{t-1}-\mu\right)+\phi_{2}\left(X_{t-2}-\mu\right)+\cdots+\phi_{p}\left(X_{t-p}-\mu\right)+Z_{t}\)
其可以等价展开成 \(X_{t}=\phi_{0}+\phi_{1} X_{t-1}+\phi_{2} X_{t-2}+\cdots+\phi_{p} X_{t-p}+Z_{t}\) ,
其中 \(\phi_{0}=\mu(1-\phi_1-\cdots-\phi_p)\)
\(AR(1)\)
模型样式
\(X_t=\phi X_{t-1}+Z_t\)
性质
由于 \(\{X_t\}\) 与 \(\{X_t-\mu\}\) 有相同的方差与协方差, 故我们可以令 \(\mu=0\)
容易验证,当 \(\phi<1\) 时,
对模型重复进行迭代, 我们有
\[\begin{aligned}
X_{t} &=\phi\left(\phi X_{t-2}+Z_{t-1}\right)+Z_{t}=\phi^{2} X_{t-2}+\phi Z_{t-1}+Z_{t} \\
&=\phi^{2}\left(\phi X_{t-3}+Z_{t-2}\right)+\phi Z_{t-1}+Z_{t}=\phi^{3} X_{t-3}+\phi^{2} Z_{t-2}+\phi Z_{t-1}+Z_{t}\\
&=\cdots
\end{aligned}
\]
一直进行下去,如果 \(|\phi|<1\) 容易验证其为平稳序列, 且其ACF函数为
\[\gamma_{X}(k)=\sum_{i=0}^{\infty} \phi^{i} \phi^{i+k}= \frac{\phi^{k}}{1-\phi^{2}}
\]Xt 可以表示为当前和过去时刻扰动的收敛线性组合,即 \(MA(\infty)\) 形式,此时称 Xt 是因果过程。我们也可以得出结论: \(AR(1)\) 是因果平稳的充要条件是 \(|\phi|<1\)
期望与ACF
\(AR(2)\)
模型表示
\[\begin{array}{c}
X_{t}=\phi_{1} X_{t-1}+\phi_{2} X_{t-2}+Z_{t} \\
\left(1-\phi_{1} B-\phi_{2} B^{2}\right) X_{t}=Z_{t}
\end{array}\]
因果平稳条件
\[\phi(B)=1-\phi_{1} B-\phi_{2} B^{2}=\left(1-\pi_{1} B\right)\left(1-\pi_{2} B\right)
\]\(\pi_1\) , \(\pi_2\) 为 \(\phi(B)=0\) 的两个根的倒数
令 \((1-\pi_2B)X_t=Y_t\) , 有 \((1-\pi_1B)Y_t=Z_t\)
当 \(|\pi_1|<1\) , \(\{Y_t\}\) 为因果平稳过程
当 \(|\pi_2|<1\) , \(X_t\) 可表示为 $$X_{t}=\sum_{j=0}^{\infty} \pi_{2}^{j} Y_{t-j}$$
也为因果平稳过程
所以, AR(2) 为因果平稳过程的条件是 \(\phi(B)=0\) 的两个根在单位圆外, 即 \(|\pi_1|<1\) , \(|\pi_2|<1\)
ACF
\(X_{t}=\phi_{1} X_{t-1}+\phi_{2} X_{t-2}+Z_{t}\) (为方便研究, 无妨设 \(\mu=0\))
两边同时乘以 \(X_{t-k}\) 并取期望
有 \(\gamma_{k}=\phi_{1} \gamma_{k-1}+\phi_{2} \gamma_{k-2}\)
再两边同除以 \(\gamma_{0}\) , 可得到
\(\rho_{k}=\phi_{1} \rho_{k-1}+\phi_{2} \rho_{k-2}, \forall k>0\)
令 \(k=1\), 利用 \(\rho_{-1}=\rho_{1}, \rho_{0}=1\), 有
\[\rho_1=\phi_1\rho_0+\phi_2\rho_1 \Rightarrow \rho_1=\phi_1+\phi_2\rho_1 \Rightarrow \rho_1=\frac{\phi_1}{1-\phi_2}
\]
由 \(\rho_{k}=\phi_{1} \rho_{k-1}+\phi_{2} \rho_{k-2}, \forall k>0\) , 与 \(\rho_1=\frac{\phi_1}{1-\phi_2}~, \rho_{0}=1\) ,可以计算任意阶延迟的ACF
平均周期长度
\(1-\phi_{1} B-\phi_{2} B^{2}=0\) 特征方程为 \(y^{2}-\phi_{1} y-\phi_{2}=0\)
若特征方程的根为共轭复特征根
记为 \(a\pm bi\)
则平均周期长度
\[k=\frac{2 \pi}{\cos ^{-1}[a / \sqrt{a^{2}+b^{2}}]}
\]
\(AR(p)\)
AR建模
步骤
- 确保对象为平稳序列
- 定阶
- 估计参数
- 残差诊断
- 优化
- 预测
定阶
PACF定阶
定义
\(PACF=Corr(X_t,X_{t-k}|X_{t-1},X_{t-2},\cdots,X_{t-k+1})\)
通过PACF图在 \(p\) 处截尾, 选取 \(p\)
信息准则定阶
- 赤池信息准则 (AIC)
- 贝叶斯信息准则 (BIC)
MA移动平均模型
\(MA(q)\)定义
满足 \(X_{t}=\mu+Z_{t}+\theta_{1} Z_{t-1}+\theta_{2} Z_{t-2}+\cdots+\theta_{q} Z_{t-q}\) 的平稳过程
性质
平稳性
不需要系数满足额外的限制条件,\(MA\) 模型总是因果平稳的
\(E\left(X_{t}\right)=\mu ; \quad \operatorname{Var}\left(X_{t}\right)=\sigma_{Z}^{2}\left(1+\theta_{1}^{2}+\cdots+\theta_{q}^{2}\right)\)
以及 \(\operatorname{Cov}\left(X_{t}, X_{t-k}\right)\) 均与 \(t\) 无关;
ACF
\[\operatorname{Cov}(X_{t}, X_{t-k})=\left\{\begin{array}{lr}
(1+\theta_{1}^{2}+\cdots+\theta_{q}^{2}) \sigma_{Z}^{2} & k=0 \\
(\sum_{i=0}^{q-k} \theta_{i} \theta_{i+k}) \sigma_{Z}^{2} & 1 \leq k \leq q \\
0 & k>q
\end{array}\right\}\]这里记 \(\theta_{0}=1\) 。
于是, \(M A(q)\) 过程的 \(ACF\) 为
\[\rho_{k}=\frac{\gamma_{k}}{\gamma_{0}}=\left\{\begin{array}{lc}
1 & k=0 \\
\frac{\sum_{i=0}^{q-k} \theta_{i} \theta_{i+k}}{1+\theta_{1}^{2}+\cdots+\theta_{q}^{2}} & 1 \leq k \leq q \\
0 & k>q
\end{array}\right.\]
可逆性
定义
如果 \(t\) 时刻的随机扰动可以表示为当前值和历史值的一个收敛和的形式,即
\(Z_{t}=\sum_{j=0}^{\infty} \pi_{j} X_{t-j}\)
其中, \(\pi_{0}=1, \sum\left|\pi_{j}\right|<\infty\) .
形式
\[\begin{array}{c}
X_{t}=\theta(B) Z_{t} \stackrel{可逆}{==} Z_{t}=X_{t}+\pi X_{t+1}=\pi(B) X_{t} \\
\theta(B) \pi(B)=1
\end{array}\]
MA建模
定阶
通过ACF图在 \(q\) 处截尾, 选取 \(q\)
时间序列分析2.X AR与MA的更多相关文章
- SPSS时间序列分析
时间序列分析必须建立在预处理的基础上…… 今天看了一条新闻体会到了网络日志的重要性…… 指数平滑法(Exponential Smoothing,ES)是布朗(Robert G..Brown)所提出,布 ...
- 时间序列分析算法【R详解】
简介 在商业应用中,时间是最重要的因素,能够提升成功率.然而绝大多数公司很难跟上时间的脚步.但是随着技术的发展,出现了很多有效的方法,能够让我们预测未来.不要担心,本文并不会讨论时间机器,讨论的都是很 ...
- python时间序列分析
题记:毕业一年多天天coding,好久没写paper了.在这动荡的日子里,也希望写点东西让自己静一静.恰好前段时间用python做了一点时间序列方面的东西,有一丁点心得体会想和大家 ...
- 《时间序列分析——基于R》王燕,读书笔记
笔记: 一.检验: 1.平稳性检验: 图检验方法: 时序图检验:该序列有明显的趋势性或周期性,则不是平稳序列 自相关图检验:(acf函数)平稳序列具有短期相关性,即随着延迟期数k的增加 ...
- 【转】时间序列分析——基于R,王燕
<时间序列分析——基于R>王燕,读书笔记 笔记: 一.检验: 1.平稳性检验: 图检验方法: 时序图检验:该序列有明显的趋势性或周期性,则不是平稳序列 自相关图检验:(ac ...
- R时间序列分析实例
一.作业要求 自选时间序列完成时间序列的建模过程,要求序列的长度>=100. 报告要求以下几部分内容: 数据的描述:数据来源.期间.数据的定义.数据长度. 作时间序列图并进行简单评价. 进行时间 ...
- ARIMA模型---时间序列分析---温度预测
(图片来自百度) 数据 分析数据第一步还是套路------画图 数据看上去比较平整,但是由于数据太对看不出具体情况,于是将只取前300个数据再此画图 这数据看上去很不错,感觉有隐藏周期的意思 代码 # ...
- pandas小记:pandas时间序列分析和处理Timeseries
http://blog.csdn.net/pipisorry/article/details/52209377 其它时间序列处理相关的包 [P4J 0.6: Periodic light curve ...
- 基于 Keras 的 LSTM 时间序列分析——以苹果股价预测为例
简介 时间序列简单的说就是各时间点上形成的数值序列,时间序列分析就是通过观察历史数据预测未来的值.预测未来股价走势是一个再好不过的例子了.在本文中,我们将看到如何在递归神经网络的帮助下执行时间序列分析 ...
- 时间序列分析工具箱——sweep
版权声明:本文为博主原创文章,未经博主同意不得转载. https://blog.csdn.net/kMD8d5R/article/details/81977856 作者:徐瑞龙.量化分析师,R语言中文 ...
随机推荐
- HBase详解(03) - HBase架构和数据读写流程
RegionServer 架构 每个RegionServer可以服务于多个Region 每个RegionServer中有多个Store, 1个WAL和1个BlockCache 每个Store对应一个列 ...
- 题解P4474 王者之剑
双倍经验 简要题意 给你一个 \(n\times m\) 的网格,数字在格子里,你需要取出一些格子,使得任意两个格子之间没有公共边,输出格子中的数字和的最大值. \(1 \le n,m \le 100 ...
- 可持久化栈学习笔记 | 题解 P6182 [USACO10OPEN]Time Travel S
简要题意 你需要维护一个栈,有 \(n\) 个操作,支持: 给定一个 \(x\),将 \(x\) 加入栈. 将一个元素出栈. 给定一个 \(x\),将当前栈回退到 第 \(x\) 操作前. 每一次操作 ...
- 过年必备!亲戚计算器「GitHub 热点速览 v.23.02」
过完这周大家就要开始为期 7 天的春节长假了,当然有些 HG 小伙伴拥有了 10+ 天的长假就低调点不要告诉他人,以免招人妒忌.春节必经的事情可能就是走亲戚了,所以本周特推选取了一个研究亲戚关系的资深 ...
- C語言成績分析系統
C語言成績分析系統,可以實現七個功能.(使用的編譯器是 code::blocks) 主要實現對於學生信息的輸入 顯示輸入學生的信息 根據期末成績來進行排名. 查找某個學生的信息 刪除某個學生的信息 修 ...
- 使用 flexible.js + rem 制作苏宁移动端首页
一.技术选型 二.搭建相关文件夹 三.设置视口标签以及引入初始化样式文件和js文件 四.body 样式 五.rem 适配方案二 body样式修改 index.css body { min-width: ...
- python del 函数
用法: -------del用于list列表操作,删除一个或者连续几个元素. # 定义一个list >>> a = [1,2,3,4] >>> a [1,2,3, ...
- 浅谈Python中的with,可能有你不知道的
Python中的with,没那么简单,虽然也不难 https://docs.python.org/zh-cn/3.9/reference/compound_stmts.html#the-with-st ...
- 数据库系列:MySQL慢查询分析和性能优化
1 背景 我们的业务服务随着功能规模扩大,用户量扩增,流量的不断的增长,经常会遇到一个问题,就是数据存储服务响应变慢. 导致数据库服务变慢的诱因很多,而RD最重要的工作之一就是找到问题并解决问题. 下 ...
- JAVA虚拟机04---对象的创建
主要是针对HotSpot虚拟机来说的 1.对象的创建过程-new 对象() 1.1检查类是否被加载 检查创建的这个对象的类是否能在常量池中找到类的符号引用,并检查这个类是否被加载.解析和初始化.如果没 ...