时间序列:可以用来预测未来的参数,

1.生成时间序列对象

 sales <- c(18, 33, 41,  7, 34, 35, 24, 25, 24, 21, 25, 20,
22, 31, 40, 29, 25, 21, 22, 54, 31, 25, 26, 35)
# 1.生成时序对象
tsales <- ts(sales,start = c(2003,1),frequency = 12)
plot(tsales)
# 2.获得对象信息
start(tsales)
end(tsales)
frequency(tsales)
# 3.对相同取子集
tsales.subset <- window(tsales,start=c(2003,5),end=c(2004,6))
tsales.subset

  结论:手动生成的时序图

2.简单移动平均

案例:尼罗河流量和年份的关系

 library(forecast)
opar <- par(no.readonly = T)
par(mfrow=c(2,2))
ylim <- c(min(Nile),max(Nile))
plot(Nile,main='Raw time series')
plot(ma(Nile,3),main = 'Simple Moving Averages (k=3)',ylim = ylim)
plot(ma(Nile,7),main = 'Simple Moving Averages (k=3)',ylim = ylim)
plot(ma(Nile,15),main = 'Simple Moving Averages (k=3)',ylim = ylim)
par(opar)

  结论:随着K值的增大,图像越来越平滑我们需要找到最能反映规律的K值

3.使用stl做季节性分解

案例:Arirpassengers年份和乘客的关系

 # 1.画出时间序列
plot(AirPassengers)
lAirpassengers <- log(AirPassengers)
plot(lAirpassengers,ylab = 'log(Airpassengers)')
# 2.分解时间序列
fit <- stl(lAirpassengers,s.window = 'period')
plot(fit)
fit$time.series
par(mfrow=c(2,1))
# 3.月度图可视化
monthplot(AirPassengers,xlab='',ylab='')
# 4.季度图可视化
seasonplot(AirPassengers,year.labels = T,main = '')

                        原始图                                                                                                                                    对数变换

                  总体趋势图                                                                                                                        月度季度图

4.指数预测模型

  4.1单指数平滑

    案例:预测康涅狄格州的气温变化

# 1.拟合模型
fit2 <- ets(nhtemp,model = 'ANN')
fit2
# 2.向前预测
forecast(fit2,1)
plot(forecast(fit2,1),xlab = 'Year',
ylab = expression(paste("Temperature (",degree*F,")",)),
main="New Haven Annual Mean Temperature")
# 3.得到准确的度量
accuracy(fit2)

      结论:浅灰色是80%的置信区间,深灰色是95%的置信区间

  4.2有水平项,斜率和季节项的指数模型

    案例:预测5个月的乘客流量

 # 1.光滑参数
fit3 <- ets(log(AirPassengers),model = 'AAA')
accuracy(fit3)
# 2.未来值预测
pred <- forecast(fit3,5)
pred
plot(pred,main='Forecast for air Travel',ylab = 'Log(Airpassengers)',xlab = 'Time')
# 3.使用原始尺度预测
pred$mean <- exp(pred$mean)
pred$lower <- exp(pred$lower)
pred$upper <- exp(pred$upper)
p <- cbind(pred$mean,pred$lower,pred$upper)
dimnames(p)[[2]] <- c('mean','Lo 80','Lo 95','Hi 80','Hi 95')
p

      结论:从表格中可知3月份的将会有509200乘客,95%的置信区间是[454900,570000]

  4.3ets自动预测

    案例:自动预测JohnsonJohnson股票的趋势

 fit4 <- ets(JohnsonJohnson)
fit4
plot(forecast(fit4),main='Johnson and Johnson Forecasts',
ylab="Quarterly Earnings (Dollars)", xlab="Time")

      结论:预测值使用蓝色线表示,浅灰色表示80%置信空间,深灰色表示95%置信空间

5.ARIMA预测

步骤:

  1.确保时序是平稳的

  2.找出合理的模型(选定可能的p值或者q值)

  3.拟合模型

  4.从统计假设和预测准确性等角度评估模型

  5.预测

library(tseries)
plot(Nile)
# 1.原始序列差分一次
ndiffs(Nile) dNile <- diff(Nile)
# 2.差分后的图形
plot(dNile)
adf.test(dNile)
Acf(dNile)
Pacf(dNile)
# 3.拟合模型
fit5 <- arima(Nile,order = c(0,1,1))
fit5
accuracy(fit5)
# 4.评价模型
qqnorm(fit5$residuals)
qqline(fit5$residuals)
Box.test(fit5$residuals,type = 'Ljung-Box')
# 5.预测模型
forecast(fit5,3)
plot(forecast(fit5,3),xlab = 'Year',ylab = 'Annual Flow')

                原始图                                                                                                                                        一次差分图形

            正态Q-Q图(如果满足正态分布,点会落在图中的线上)                                                                                       使用Arima(0,1,1)模型的预测值

Arima自动预测

  案例:预测3个月之后的太阳黑子

 fit6 <- auto.arima(sunspots)
fit6
forecast(fit6,3)
accuracy(fit6)
plot(forecast(fit6,3), xlab = "Year",
ylab = "Monthly sunspot numbers")

     结论:函数自动选定(2,1,2)与其他模型相比,AIC的值最小,预测结果更准确

R语言-时间序列的更多相关文章

  1. R语言-时间序列图

    1.时间序列图 plot()函数 > air<-read.csv("openair.csv") > plot(air$nox~as.Date(air$date,& ...

  2. 基于R语言的时间序列指数模型

    时间序列: (或称动态数列)是指将同一统计指标的数值按其发生的时间先后顺序排列而成的数列.时间序列分析的主要目的是根据已有的历史数据对未来进行预测.(百度百科) 主要考虑的因素: 1.长期趋势(Lon ...

  3. Rserve详解,R语言客户端RSclient【转】

    R语言服务器程序 Rserve详解 http://blog.fens.me/r-rserve-server/ Rserve的R语言客户端RSclient https://blog.csdn.net/u ...

  4. 【R语言学习】时间序列

    时序分析会用到的函数 函数 程序包 用途 ts() stats 生成时序对象 plot() graphics 画出时间序列的折线图 start() stats 返回时间序列的开始时间 end() st ...

  5. 用R语言的quantreg包进行分位数回归

    什么是分位数回归 分位数回归(Quantile Regression)是计量经济学的研究前沿方向之一,它利用解释变量的多个分位数(例如四分位.十分位.百分位等)来得到被解释变量的条件分布的相应的分位数 ...

  6. R语言学习笔记-机器学习1-3章

    在折腾完爬虫还有一些感兴趣的内容后,我最近在看用R语言进行简单机器学习的知识,主要参考了<机器学习-实用案例解析>这本书. 这本书是目前市面少有的,纯粹以R语言为基础讲解的机器学习知识,书 ...

  7. R入门<三>-R语言实战第4章基本数据管理摘要

    入门书籍:R语言实战 进度:1-4章 摘要: 1)实用的包 forecast:用于做时间序列预测的,有auto.arima函数 RODBC:可以用来读取excel文件.但据说R对csv格式适应更加良好 ...

  8. R语言实战(三)基本图形与基本统计分析

    本文对应<R语言实战>第6章:基本图形:第7章:基本统计分析 =============================================================== ...

  9. 机器学习:异常检测算法Seasonal Hybrid ESD及R语言实现

    Twritters的异常检测算法(Anomaly Detection)做的比较好,Seasonal Hybrid ESD算法是先用STL把序列分解,考察残差项.假定这一项符合正态分布,然后就可以用Ge ...

随机推荐

  1. java里程碑之泛型--深入理解泛型

    所谓泛型,就是允许在定义类,接口,方法时使用类型形参,这个类型形参将在声明变量,创建对象,调用方法的时候动态的指定.JAVA5之后修改了集合中所有的接口和类,为这些接口和类都提供了泛型的支持. 关于泛 ...

  2. ansible 批量安装zabbix agentd客户端

    目录结构 # tree /etc/ansible/ /etc/ansible/ ├── ansible.cfg ├── hosts ├── roles │   └── zabbix-agentd │  ...

  3. [SQL] 函数整理(T-SQL 版)

    函数整理(T-SQL 版) 一.数学函数 1.求绝对值 ABS() 函数用来返回一个数值的绝对值. SELECT ABS(-5.38) AS absValue; 2.求指数 POWER()  函数是用 ...

  4. 18_Python列表常用方法总结

    ''' 1.列表切片索引\截取 2.列表的增删改查 3.列表最大值\列表最小值\排序 4.列表的遍历 5.列表的嵌套 6.列表和字符串的互转 7.判断元素是否在列表中 ''' #列表使用中括号表示 元 ...

  5. jquery实现上传图片本地预览效果

    html: <img id="pic" src="" ><input id="upload" name="fil ...

  6. python3操作redis

    redis也被称为缓存 1.redis是一个key-value存储系统,没有ForeignKey和ManyToMany的字段. 2.在redis中创建的数据彼此之间是没有关系的,所以也被称为是非关系型 ...

  7. linux下的打包与压缩

    linux压缩或解压缩工具有很多,除了已经很少有人使用的compress外,现在常用的还有tar,bzip2,xz 和gziplinux压缩或解压缩工具有很多,除了已经很少有人使用的compress外 ...

  8. linux上的组管理

    上一次我们谈了CentOS上的用户管理,现在我们再来谈下CentOS上的用户组管理. groupadd创建一个新的组 用法如下: groupadd [选项] groupname 常用选项: -f 强制 ...

  9. [eslint-plugin-vue] [vue/no-unused-vars] 'scope' is defined but never used.

    前言 今天在做项目的时候Visual Studio Code报了一个错 这个错的意思是声明了scope却没有使用它,这是vue的eslink插件检测的. 我想这个scope的属性不是自己的吗,咋是我声 ...

  10. Apache优化配置:修改最大并发连接数

    此文摘自: http://www.365mini.com/page/apache-concurrency-configuration.htm Apache查看连接数和限制当前的连接数 : http:/ ...