【转】时间序列分析——基于R,王燕
时序图检验:该序列有明显的趋势性或周期性,则不是平稳序列自相关图检验:(acf函数)平稳序列具有短期相关性,即随着延迟期数k的增加,平稳序列的自相关系数ρ会很快地衰减向0(指数级衰减),反之非平稳序列衰减速度会比较慢
- 构造检验统计量进行假设检验:单位根检验adfTest()——fUnitRoots包
1、Q统计量:type=“Box-Pierce”2、LB统计量:type=“Ljung-Box”
1.1平稳性检验1.2ARMA的p、q定阶——acf(),pacf(),auto.arima()自动定阶1.3建模arima()1.4模型显著性检验:残差的白噪声检验Box.test();参数显著性检验t分布
2.1趋势拟合:直线、曲线(一般是多项式,还有其它函数)2.2平滑法
- 移动平均法:SMA()——TTR包
- 指数平滑法:HoltWinters()
1平稳性检验,差分运算2拟合ARMA3白噪声检验
4.1建立线性模型4.2对滞后的因变量间拟合线性模型,对模型做残差自相关DW检验。dwtest()——lmtest包,增加选项order.by指定延迟因变量4.3对残差建立ARIMA模型
第一章 简介
- 统计时序分析方法:
1、频域分析方法2、时域分析方法
- 步骤:
1、观察序列特征2、根据序列特征选择模型3、确定模型的口径4、检验模型,优化模型5、推断序列其它统计性质或预测序列将来的发展
- 时域分析研究的发展方向:
1、AR,MA,ARMA,ARIMA(Box-Jenkins模型)2、异方差场合:ARCH,GARCH等(计量经济学)3、多变量场合:“变量是平稳”不再是必需条件,协整理论3、非线性场合:门限自回归模型,马尔科夫转移模型
第二章 时间序列的预处理
- 均值Ex
- 方差σ2
- 自协方差函数(γ)和自相关系数(ρ):比较的是1个事件不同时期之间的相互影响程度
- 严平稳:随机变量族的统计性质完全有它们的联合概率分布族决定,若任意的t下的联合概率分布族相等,则认为该序列是严平稳的
- 宽平稳:统计性质主要由它的低阶矩决定:
1)Ex2<无穷2)均值为常数:Ex=μ(μ为常数)3)自协方差和自相关系数只依赖于时间的平移长度而与时间的起止点无关满足以上3点则称为宽平稳时间序列(弱平稳或者二阶平稳)
1)均值为常数:Ex=μ(μ为常数)2)自协方差和自相关系数只依赖于时间的平移长度而与时间的起止点无关
1)时序图:横轴为时间,纵轴为序列取值2)自相关图:横轴为延期时期数,纵轴为自相关系数
- 时序图检验:该序列有明显的趋势性或周期性,则不是平稳序列
- 自相关图检验:(acf函数)平稳序列具有短期相关性,即随着延迟期数k的增加,平稳序列的自相关系数ρ会很快地衰减向0,反之非平稳序列衰减速度会比较慢
1)Ex=μ(μ为常数)2)自相关系数γ为0(t!=s),或为σ2(t=s)在平稳序列中,如果序列值之间没有任何相关性,即一个没有记忆的序列满足以上2个条件,这种序列称为纯随机序列,也称为白噪声序列。记为X~WN(μ,σ2),这是一种最简单的平稳序列。:比如:标准正态分布
1)纯随机序列各项之间没有任何关联,γ=0,随机事件呈现出纯随机波动的特征,就认为该随机事件没有包含任何值得提取的有用信息。2)方差齐性:序列中每个方差都相等为σ2
1、Q统计量:type=“Box-Pierce”2、LB统计量:type=“Ljung-Box”
- 平稳序列通常具有短期相关性,若序列之间存在显著的相关关系,通常只存在于延迟时期比较短的序列值之间,因此lag不用全部进行延迟检验。
第三章 平稳时间序列分析——ARMA
1)p阶差分:p-1阶差分后序列再进行一次1阶差分运算成为p阶差分运算2)k步差分:相距k期的两个序列值之间的减法运算称为k步差分运算
xt-1=B*xtxt-2=B2*xt...xt-p=Bp*xt
1)p阶差分:(1-B)pxt2)k步差分:(1-Bk)xt
- 齐次线性差分方程:h(t)=0
- 非齐次线性差分方程:
1、AR模型2、MA模型3、ARMA模型:适用于平稳白噪声序列
1)求出该观察值序列的样本相关系数(ACF)和样本偏相关系数(PACF)2)选择ARMA(p,q)的参数p和q,进行拟合:自动定阶参数auto.arima()——需要zoo包和forecast包P793)检验模型的有效性:模型显著性检验(残差序列应该为白噪声序列)和参数显著性检验4)多建立几个拟合模型,选择最优模型5)预测forecast()——需要forecast包P100
1)Wold分解定理:对于任何一个离散平稳过程{xt},它都可以分解为两个不相关的平稳序列之和,其中一个为确定性的,另一个为随机性的。2)Cramer分解定理:任何一个时间序列{xt}都可以分解为两部分的叠加,其中一部分是由多项式决定的确定性趋势成分,另一个是平稳的0均值误差成分
- 四大类因素:
1)长期趋势2)循环波动3)季节性变化4)随机波动
- 相互作用模式
1)加法模型2)乘法模型
- 目标
1)克服其它因素影响,单纯测度某一个确定性因素的(长期趋势或季节效应)2)推断出各种确定性因素彼此之间的相互作用关系以及它们对序列的综合影响
- 局限
1)确定性因素分解方法只能提取强劲的确定性信息,对随机性信息浪费严重
2)确定性因素分解方法把所有序列的变化都归结为四因素的综合影响,却始终无法提供明确、有效的方法判断各大因素之间确切的作用关系
- 趋势拟合法
线性拟合:lm()曲线拟合:lm或nls,二次型,指数型。。。
- 平滑法
移动平均法:SMA()——TTR包指数平滑法:HoltWinters()
第五章 非平稳序列——随机时序分析
- 线性趋势,1阶差分就可以实现趋势平稳
- 曲线趋势,低阶(2阶或3阶)差分就可以提取曲线趋势的影响
- 周期序列,步长为周期长度的差分运算
- 综合:趋势+周期的序列——1阶差分去掉线性趋势,在1阶差分的基础上进行12步差分去掉年为单位的周期影响(季节波动)
- ARIMA模型
- 梳系数模型:模型中有部分自相关系数或平滑系数为0(将自相关较小的阶数的系数设置为0,其它大于2D的系数为NA)
- 季节模型(加法,乘积)
- 优点:对确定性信息的提取比较充分
- 局限:很难对模型进行直观解释
- 拉格朗日乘子检验(LM检验)ArchTest()——FinTS包
- PortmanteauQ检验:对残差平方序列进行纯随机性检验Box.test()
第六章 多元时间序列分析
- type=“nc”:无常数均值,无趋势类型
- type=“c”:有常数均值,无趋势类型
- type=“ct”:有常数均值,又有趋势类型
【转】时间序列分析——基于R,王燕的更多相关文章
- 《时间序列分析——基于R》王燕,读书笔记
笔记: 一.检验: 1.平稳性检验: 图检验方法: 时序图检验:该序列有明显的趋势性或周期性,则不是平稳序列 自相关图检验:(acf函数)平稳序列具有短期相关性,即随着延迟期数k的增加 ...
- 时间序列分析算法【R详解】
简介 在商业应用中,时间是最重要的因素,能够提升成功率.然而绝大多数公司很难跟上时间的脚步.但是随着技术的发展,出现了很多有效的方法,能够让我们预测未来.不要担心,本文并不会讨论时间机器,讨论的都是很 ...
- R时间序列分析实例
一.作业要求 自选时间序列完成时间序列的建模过程,要求序列的长度>=100. 报告要求以下几部分内容: 数据的描述:数据来源.期间.数据的定义.数据长度. 作时间序列图并进行简单评价. 进行时间 ...
- 《时间序列分析及应用:R语言》读书笔记--第一章 引论
"春节假期是难得的读书充电的时间."--来自某boss.假期能写多少算多少,一个是题目中的这本书,另一个是<python核心编程>中的高级部分,再一个是拖着的<算 ...
- 【R实践】时间序列分析之ARIMA模型预测___R篇
时间序列分析之ARIMA模型预测__R篇 之前一直用SAS做ARIMA模型预测,今天尝试用了一下R,发现灵活度更高,结果输出也更直观.现在记录一下如何用R分析ARIMA模型. 1. 处理数据 1.1. ...
- R语言实现金融数据的时间序列分析及建模
R语言实现金融数据的时间序列分析及建模 一 移动平均 移动平均能消除数据中的季节变动和不规则变动.若序列中存在周期变动,则通常以周期为移动平均项数.移动平均法可以通过数据显示出数据长期趋势的变动 ...
- 基于 Keras 的 LSTM 时间序列分析——以苹果股价预测为例
简介 时间序列简单的说就是各时间点上形成的数值序列,时间序列分析就是通过观察历史数据预测未来的值.预测未来股价走势是一个再好不过的例子了.在本文中,我们将看到如何在递归神经网络的帮助下执行时间序列分析 ...
- python时间序列分析
题记:毕业一年多天天coding,好久没写paper了.在这动荡的日子里,也希望写点东西让自己静一静.恰好前段时间用python做了一点时间序列方面的东西,有一丁点心得体会想和大家 ...
- 基于R语言的时间序列指数模型
时间序列: (或称动态数列)是指将同一统计指标的数值按其发生的时间先后顺序排列而成的数列.时间序列分析的主要目的是根据已有的历史数据对未来进行预测.(百度百科) 主要考虑的因素: 1.长期趋势(Lon ...
随机推荐
- 高性能JavaScript模板引擎实现原理详解
这篇文章主要介绍了JavaScript模板引擎实现原理详解,本文着重讲解artTemplate模板的实现原理,它采用预编译方式让性能有了质的飞跃,是其它知名模板引擎的25.32 倍,需要的朋友可以参考 ...
- F. Fixing Banners
http://codeforces.com/gym/102394/problem/F F. Fixing Banners time limit per test 1 second memory lim ...
- vue.js(15)--vue的生命周期
生命周期钩子 生命周期钩子=生命周期函数=生命周期事件 每个 Vue 实例在被创建时都要经过一系列的初始化过程——例如,需要设置数据监听.编译模板.将实例挂载到 DOM 并在数据变化时更新 DOM 等 ...
- Python Paramiko模块使用
1 执行远程命令 #!/usr/bin/python import paramiko ssh = paramiko.SSHClient() ssh.set_missing_host_key_polic ...
- MYSQL学习笔记——常用语句
1.检索数据 1.1.检索单个列:SELECT prod_name FROM products; 1.2.检索多个列:SELECT prod_id, prod_name, prod_price FRO ...
- debian系列systemd 配置nodejs服务
1 新建service配置文件 vi /etc/systemd/system/node.service [Unit] Description=My super nodejs app [Service ...
- prufer 序列 学习笔记
prufer 序列是一种无根树的序列,对于一个 \(n\) 个点的树,其 prufer 序列的长度为 \(n-2\). prufer 序列和原树之间都可以唯一地相互转化. 构造 构造 prufer 序 ...
- 黑客已经瞄准5G网络,如何防止LTE网络攻击?
黑客是如何攻击5G网络?即使5G进行大规模应用,LTE技术会被淘汰吗?那么我们应该如何防止LTE网络攻击? 5G-网络黑客 即将推出的5G网络也可能容易受到这些攻击,来自中国网络安全研究人员表示,尽管 ...
- element-ui 里面el-checkbox多选框,实现全选单选
data里面定义了 data:[], actionids:[],//选择的那个actionid num1:0,//没选择的计数 num2:0,//选中的计数 ...
- 为什么选择Linux
从最近的统计数据可以看到,全球大量数据中心的服务器已经开始向基于 Linux Server 平台转移.相较 Windows Server 而言,Linux Server 提供了更多优势.包括 Goog ...