《时间序列分析——基于R》王燕,读书笔记

笔记:

一、检验:
1、平稳性检验:
  • 图检验方法:
    时序图检验:该序列有明显的趋势性或周期性,则不是平稳序列
    自相关图检验:(acf函数)平稳序列具有短期相关性,即随着延迟期数k的增加,平稳序列的自相关系数ρ会很快地衰减向0(指数级衰减),反之非平稳序列衰减速度会比较慢
 
  • 构造检验统计量进行假设检验:单位根检验adfTest()——fUnitRoots包
2、纯随机性检验、白噪声检验(Box.test(data,type,lag=n)——lag表示输出滞后n阶的白噪声检验统计量,默认为滞后1阶的检验统计量结果)
1、Q统计量:type=“Box-Pierce”
2、LB统计量:type=“Ljung-Box”
二、模型
1、ARMA平稳序列模型
1.1平稳性检验
1.2ARMA的p、q定阶——acf(),pacf(),auto.arima()自动定阶
1.3建模arima()
1.4模型显著性检验:残差的白噪声检验Box.test();参数显著性检验t分布
2、非平稳确定性分析
2.1趋势拟合:直线、曲线(一般是多项式,还有其它函数)
2.2平滑法
  • 移动平均法:SMA()——TTR包
  • 指数平滑法:HoltWinters()
3、非平稳随机性分析
3.1ARIMA
1平稳性检验,差分运算
2拟合ARMA
3白噪声检验
3.2疏系数模型arima(p,d,f)
3.3季节模型
 
可以叠加的模型
4、残差自回归模型:
4.1建立线性模型
4.2对滞后的因变量间拟合线性模型,对模型做残差自相关DW检验。dwtest()——lmtest包,增加选项order.by指定延迟因变量
4.3对残差建立ARIMA模型
5、条件异方差模型:异方差检验:LM检验ArchTest()——FinTS包,用ARCH、GARCH模型建模
 
 
 

第一章 简介

  • 统计时序分析方法:
1、频域分析方法
2、时域分析方法
 
  • 步骤:
1、观察序列特征
2、根据序列特征选择模型
3、确定模型的口径
4、检验模型,优化模型
5、推断序列其它统计性质或预测序列将来的发展
 
  • 时域分析研究的发展方向:
1、AR,MA,ARMA,ARIMA(Box-Jenkins模型)
2、异方差场合:ARCH,GARCH等(计量经济学)
3、多变量场合:“变量是平稳”不再是必需条件,协整理论
3、非线性场合:门限自回归模型,马尔科夫转移模型
 

第二章 时间序列的预处理

预处理内容:对它的平稳性和纯随机性进行检验,最好是平稳非白噪声的序列
1、特征统计量
1.1概率分布分布函数或密度函数能够完整地描述一个随机变量的统计特征,同样一个随机变量族{Xt}的统计特性也完全由它们的联合分布函数或联合密度函数决定。
1.2特征统计量:
  • 均值Ex
  • 方差σ2
  • 自协方差函数(γ)和自相关系数(ρ):比较的是1个事件不同时期之间的相互影响程度
 
2、平稳的时间序列
2.1定义
  • 严平稳:随机变量族的统计性质完全有它们的联合概率分布族决定,若任意的t下的联合概率分布族相等,则认为该序列是严平稳的
  • 宽平稳:统计性质主要由它的低阶矩决定:
1)Ex2<无穷
2)均值为常数:Ex=μ(μ为常数)
3)自协方差和自相关系数只依赖于时间的平移长度而与时间的起止点无关
满足以上3点则称为宽平稳时间序列(弱平稳或者二阶平稳)
例子:正态分布
一般满足宽平稳就称作平稳序列,当宽平稳序列服从多元正态分布时,二阶平稳可以推出严平稳。
 
2.2性质
1)均值为常数:Ex=μ(μ为常数)
2)自协方差和自相关系数只依赖于时间的平移长度而与时间的起止点无关
自相关系数满足相关性系数的3性质:规范性、对称性和非负定性
一个平稳时间序列一定唯一决定它的自相关函数,一个自相关函数未必唯一对应一个平稳时间序列
 
3、时序图与自相关图
1)时序图:横轴为时间,纵轴为序列取值
2)自相关图:横轴为延期时期数,纵轴为自相关系数
 
4、平稳性检验
图检验方法
  • 时序图检验:该序列有明显的趋势性或周期性,则不是平稳序列
  • 自相关图检验:(acf函数)平稳序列具有短期相关性,即随着延迟期数k的增加,平稳序列的自相关系数ρ会很快地衰减向0,反之非平稳序列衰减速度会比较慢
 
构造检验统计量进行假设检验:单位根检验P205
5、纯随机序列——白噪声
5.1定义
1)Ex=μ(μ为常数)
2)自相关系数γ为0(t!=s),或为σ2(t=s)
在平稳序列中,如果序列值之间没有任何相关性,即一个没有记忆的序列满足以上2个条件,这种序列称为纯随机序列,也称为白噪声序列。记为X~WN(μ,σ2),这是一种最简单的平稳序列。:比如:标准正态分布
5.2性质
1)纯随机序列各项之间没有任何关联,γ=0,随机事件呈现出纯随机波动的特征,就认为该随机事件没有包含任何值得提取的有用信息。
2)方差齐性:序列中每个方差都相等为σ2
5.3纯随机性检验(Box.test(data,type,lag=n)——lag表示输出滞后n阶的白噪声检验统计量,默认为滞后1阶的检验统计量结果)
1、Q统计量:type=“Box-Pierce”
2、LB统计量:type=“Ljung-Box”
  • 平稳序列通常具有短期相关性,若序列之间存在显著的相关关系,通常只存在于延迟时期比较短的序列值之间,因此lag不用全部进行延迟检验。
 

第三章 平稳时间序列分析——ARMA

1、差分运算
1)p阶差分:p-1阶差分后序列再进行一次1阶差分运算成为p阶差分运算
2)k步差分:相距k期的两个序列值之间的减法运算称为k步差分运算
2、延迟算子:将当前序列值乘以一个延迟算子,即把当前序列值的时间向过去拨一个时刻,记B为延迟算子,则有:
xt-1=B*xt
xt-2=B2*xt
...
xt-p=Bp*xt
用延迟算子表示差分运算:
1)p阶差分:(1-B)pxt
2)k步差分:(1-Bk)xt
3、线性差分方程:zt+a1zt-1+a2zt-2+...+apzt-p=h(t)(p>=1)
  • 齐次线性差分方程:h(t)=0
  • 非齐次线性差分方程:
4、ARMA模型——自回归移动平均模型
1、AR模型
2、MA模型
3、ARMA模型:适用于平稳白噪声序列
平稳序列建模步骤:P72
1)求出该观察值序列的样本相关系数(ACF)和样本偏相关系数(PACF)
2)选择ARMA(p,q)的参数p和q,进行拟合:自动定阶参数auto.arima()——需要zoo包和forecast包P79
3)检验模型的有效性:模型显著性检验(残差序列应该为白噪声序列)和参数显著性检验
4)多建立几个拟合模型,选择最优模型
5)预测forecast()——需要forecast包P100
 
第四章 非平稳序列——确定性时序分析
4.1非平稳时序的分解:
1)Wold分解定理:对于任何一个离散平稳过程{xt},它都可以分解为两个不相关的平稳序列之和,其中一个为确定性的,另一个为随机性的。
2)Cramer分解定理:任何一个时间序列{xt}都可以分解为两部分的叠加,其中一部分是由多项式决定的确定性趋势成分,另一个是平稳的0均值误差成分
4.2确定性因素分解
  • 四大类因素:
1)长期趋势
2)循环波动
3)季节性变化
4)随机波动
  • 相互作用模式
1)加法模型
2)乘法模型
  • 目标
1)克服其它因素影响,单纯测度某一个确定性因素的(长期趋势或季节效应)
2)推断出各种确定性因素彼此之间的相互作用关系以及它们对序列的综合影响
  • 局限

1)确定性因素分解方法只能提取强劲的确定性信息,对随机性信息浪费严重

2)确定性因素分解方法把所有序列的变化都归结为四因素的综合影响,却始终无法提供明确、有效的方法判断各大因素之间确切的作用关系
4.3趋势分析
  • 趋势拟合法
线性拟合:lm()
曲线拟合:lm或nls,二次型,指数型。。。
  • 平滑法
移动平均法:SMA()——TTR包
指数平滑法:HoltWinters()
4.4季节效应分析:构造季节指数S=季节平均数/总平均数
4.5综合分析decompose()

第五章 非平稳序列——随机时序分析

5.1差分运算:确定信息提取:diff(x,lag,differences)——lag为差分的步长,默认1;differences为差分次数,默认为1
  • 线性趋势,1阶差分就可以实现趋势平稳
  • 曲线趋势,低阶(2阶或3阶)差分就可以提取曲线趋势的影响
  • 周期序列,步长为周期长度的差分运算
  • 综合:趋势+周期的序列——1阶差分去掉线性趋势,在1阶差分的基础上进行12步差分去掉年为单位的周期影响(季节波动)
过差分现象:过多次数的差分导致有效信息的无谓浪费而降低了估计的精度。检测方法是在计算方差,若高阶差分序列的方差大于低阶,则可能是过差分现象
 
5.2 ARIMA模型——差分运算与ARMA模型的组合
例子:随机游走模型(有效市场理论核心):从起始点找醉汉
性质:平稳性方差齐性
  • ARIMA模型
  • 梳系数模型:模型中有部分自相关系数或平滑系数为0(将自相关较小的阶数的系数设置为0,其它大于2D的系数为NA)
  • 季节模型(加法,乘积)
差分方法
  • 优点:对确定性信息的提取比较充分
  • 局限:很难对模型进行直观解释
 
自相关:
5.3残差自回归模型:用确定性因素提取序列中主要的确定性信息,检验残差序列的自相关性,若自相关性显著,可以考虑对残差序列拟合自回归模型P163(模型的残差再建模型!)
残差自相关检验:Durbin-Watson(DW)检验-->dwtest()——lmtest包
Durbin h检验:dwtest()——lmtest包,增加选项order.by指定延迟因变量
 
异方差:
5.4异方差情况:随机误差序列的方差不再是常数,它会随着时间的变化而变化
5.5方差齐性变换:对于标准差与水平成正比的异方差序列,对数变换可以有效地实现方差齐性。P174
5.6条件异方差模型(波动信息)
集群效应:在消除确定性平稳因素的影响之后,残差序列的波动在大部分时段是平稳的,但会在某些时段波动持续偏大,在某些时段波动持续偏小。
ARCH模型——自回归条件异方差模型:只适用于异方差短期自相关过程
ARCH检验P179
  • 拉格朗日乘子检验(LM检验)ArchTest()——FinTS包
  • PortmanteauQ检验:对残差平方序列进行纯随机性检验Box.test()
GARCH模型:在ARCH模型中增加考虑了异方差函数的p阶自相关性而形成的,可以有效地拟合据有长期记忆性的异方差函数

第六章 多元时间序列分析

6.3单位根检验P211:adfTest()——fUnitRoots包
DF检验
  • type=“nc”:无常数均值,无趋势类型
  • type=“c”:有常数均值,无趋势类型
  • type=“ct”:有常数均值,又有趋势类型
 
非平稳3大类型:
1、无漂移项自回归(不带漂移项的差分平稳序列,DS序列):均值序列非平稳,方差非齐(随机游走模型)
2、带漂移项自回归(带漂移项的差分平稳序列):有趋势且波动性不断增强的非平稳序列
3、带趋势回归(趋势平稳序列,TS):最好通过线性拟合提取序列相关关系,使残差序列平稳
 
ADF检验:
 
6.4协整:两个非平稳序列之间具有稳定的线性关系
 
 
 
 

【转】时间序列分析——基于R,王燕的更多相关文章

  1. 《时间序列分析——基于R》王燕,读书笔记

    笔记: 一.检验: 1.平稳性检验: 图检验方法:     时序图检验:该序列有明显的趋势性或周期性,则不是平稳序列     自相关图检验:(acf函数)平稳序列具有短期相关性,即随着延迟期数k的增加 ...

  2. 时间序列分析算法【R详解】

    简介 在商业应用中,时间是最重要的因素,能够提升成功率.然而绝大多数公司很难跟上时间的脚步.但是随着技术的发展,出现了很多有效的方法,能够让我们预测未来.不要担心,本文并不会讨论时间机器,讨论的都是很 ...

  3. R时间序列分析实例

    一.作业要求 自选时间序列完成时间序列的建模过程,要求序列的长度>=100. 报告要求以下几部分内容: 数据的描述:数据来源.期间.数据的定义.数据长度. 作时间序列图并进行简单评价. 进行时间 ...

  4. 《时间序列分析及应用:R语言》读书笔记--第一章 引论

    "春节假期是难得的读书充电的时间."--来自某boss.假期能写多少算多少,一个是题目中的这本书,另一个是<python核心编程>中的高级部分,再一个是拖着的<算 ...

  5. 【R实践】时间序列分析之ARIMA模型预测___R篇

    时间序列分析之ARIMA模型预测__R篇 之前一直用SAS做ARIMA模型预测,今天尝试用了一下R,发现灵活度更高,结果输出也更直观.现在记录一下如何用R分析ARIMA模型. 1. 处理数据 1.1. ...

  6. R语言实现金融数据的时间序列分析及建模

    R语言实现金融数据的时间序列分析及建模 一 移动平均    移动平均能消除数据中的季节变动和不规则变动.若序列中存在周期变动,则通常以周期为移动平均项数.移动平均法可以通过数据显示出数据长期趋势的变动 ...

  7. 基于 Keras 的 LSTM 时间序列分析——以苹果股价预测为例

    简介 时间序列简单的说就是各时间点上形成的数值序列,时间序列分析就是通过观察历史数据预测未来的值.预测未来股价走势是一个再好不过的例子了.在本文中,我们将看到如何在递归神经网络的帮助下执行时间序列分析 ...

  8. python时间序列分析

              题记:毕业一年多天天coding,好久没写paper了.在这动荡的日子里,也希望写点东西让自己静一静.恰好前段时间用python做了一点时间序列方面的东西,有一丁点心得体会想和大家 ...

  9. 基于R语言的时间序列指数模型

    时间序列: (或称动态数列)是指将同一统计指标的数值按其发生的时间先后顺序排列而成的数列.时间序列分析的主要目的是根据已有的历史数据对未来进行预测.(百度百科) 主要考虑的因素: 1.长期趋势(Lon ...

随机推荐

  1. 高性能JavaScript模板引擎实现原理详解

    这篇文章主要介绍了JavaScript模板引擎实现原理详解,本文着重讲解artTemplate模板的实现原理,它采用预编译方式让性能有了质的飞跃,是其它知名模板引擎的25.32 倍,需要的朋友可以参考 ...

  2. F. Fixing Banners

    http://codeforces.com/gym/102394/problem/F F. Fixing Banners time limit per test 1 second memory lim ...

  3. vue.js(15)--vue的生命周期

    生命周期钩子 生命周期钩子=生命周期函数=生命周期事件 每个 Vue 实例在被创建时都要经过一系列的初始化过程——例如,需要设置数据监听.编译模板.将实例挂载到 DOM 并在数据变化时更新 DOM 等 ...

  4. Python Paramiko模块使用

    1 执行远程命令 #!/usr/bin/python import paramiko ssh = paramiko.SSHClient() ssh.set_missing_host_key_polic ...

  5. MYSQL学习笔记——常用语句

    1.检索数据 1.1.检索单个列:SELECT prod_name FROM products; 1.2.检索多个列:SELECT prod_id, prod_name, prod_price FRO ...

  6. debian系列systemd 配置nodejs服务

    1  新建service配置文件 vi /etc/systemd/system/node.service [Unit] Description=My super nodejs app [Service ...

  7. prufer 序列 学习笔记

    prufer 序列是一种无根树的序列,对于一个 \(n\) 个点的树,其 prufer 序列的长度为 \(n-2\). prufer 序列和原树之间都可以唯一地相互转化. 构造 构造 prufer 序 ...

  8. 黑客已经瞄准5G网络,如何防止LTE网络攻击?

    黑客是如何攻击5G网络?即使5G进行大规模应用,LTE技术会被淘汰吗?那么我们应该如何防止LTE网络攻击? 5G-网络黑客 即将推出的5G网络也可能容易受到这些攻击,来自中国网络安全研究人员表示,尽管 ...

  9. element-ui 里面el-checkbox多选框,实现全选单选

    data里面定义了 data:[],        actionids:[],//选择的那个actionid        num1:0,//没选择的计数        num2:0,//选中的计数  ...

  10. 为什么选择Linux

    从最近的统计数据可以看到,全球大量数据中心的服务器已经开始向基于 Linux Server 平台转移.相较 Windows Server 而言,Linux Server 提供了更多优势.包括 Goog ...