在对短期数据的预测分析中,我们经常用到时间序列中的指数平滑做数据预测,然后根据不同。

下面我们来看下具体的过程

x<-data.frame(rq=seq(as.Date('2016-11-15'),as.Date('2016-11-22'),by='day'),
sr=c(300,697,511,1534,1155,1233,1509,1744)) xl<-ts(x$sr) #构建时间序列 plot.ts(xl)

从上图的结果来看,这是一个增长趋势的时间序列。

模型选择上我们可以依据以下标准进行判断,自己要选用的时间序列算法。

简单指数平滑法——处于恒定水平和没有季节性变动的时间序列。

霍尔特指数平滑法——有增长或下降趋势的,但没有季节性因素的时间序列

霍尔特-温特指数平滑法——有增长或下降趋势,且有季节性变动趋势的时间序列

按照上面的的时间序列趋势来看,数据有增长的趋势,不存在季节性因素,这里我们要选择霍尔特指数平滑法。

接下来我们构建时间序列模型

model<-HoltWinters(xl,gamma=FALSE,l.start=300,b.start=200)

这里的参数,gamma 是用于霍尔特-温特指数平滑法,这里要用false屏蔽,同样构建简单指数平滑时也要把beta参数屏蔽,l.start 通常用的是时间序列的第一个值,b.start表示斜率,这里需要个人基于数据增长趋势给一个预估值,也可以用简单的方法,把较近的两个值进行相见得到一个预估值。

model

Holt-Winters exponential smoothing with trend and without seasonal component.

Call:
HoltWinters(x = xl, gamma = FALSE, l.start = 300, b.start = 200) Smoothing parameters:
alpha: 0.2437346
beta : 0.01562883
gamma: FALSE Coefficients:
[,1]
a 1717.1539
b 203.1948

从模型结果来看

alpha 和 beta 参数来看都相对较低(在0到1之间),数值较低说明较远的时间点上的数值权重较高。

plot(model)

从模型的预测值和实际值来看,预测后期的数据重合度较高,整体上模型预测效果应该相对不错。

library(forecast)
premodel<-forecast.HoltWinters(model, h=7) #预测未来7天的数据走势
premodel

Point Forecast Lo 80 Hi 80 Lo 95 Hi 95

9 1920.349 1481.805 2358.892 1249.654 2591.044

10 2123.543 1671.763 2575.324 1432.605 2814.482

11 2326.738 1861.705 2791.772 1615.531 3037.946

12 2529.933 2051.626 3008.240 1798.425 3261.441

13 2733.128 2241.522 3224.733 1981.282 3484.974

14 2936.323 2431.390 3441.255 2164.095 3708.550

15 3139.517 2621.227 3657.808 2346.861 3932.174

plot.forecast(premodel)

从增长趋势来看预测结果吻合度较高。

接下来,我们要检验下模型的预测误差是否非存在自相关性,

premodel$residuals

Time Series:

Start = 1

End = 8

Frequency = 1

[1] NA NA 11.000000 831.277018 46.457606 -90.251162 4.704513 35.498288

查看模型预测误差情况,里面存着NA值,我们需要先去掉

b<-premodel$residuals[-which(is.na(premodel$residuals))]
acf(b,lag.max=7,plot=TRUE)

从结果来看,模型滞后5阶内都没有超出置信边界。

Box.test(premodel$residuals,lag=5, type="Ljung-Box")

Box-Ljung test

data:  premodel$residuals
X-squared = 1.01, df = 5, p-value = 0.9618

检验的结果来看p值较大,可能存在自相关性。由于样本整体较小,预测误差服从零均值,方差不变的正太分布可能性较小。

整体上来看,上面的预测走势应该是相对比较接近真实情况,这里也给我们一个反思的地方,要使得模型具有足够的说服力,样本数据应该较大的情况下才能得出更准确的预测模型。

时间序列 预测分析 R语言的更多相关文章

  1. Python中利用LSTM模型进行时间序列预测分析

    时间序列模型 时间序列预测分析就是利用过去一段时间内某事件时间的特征来预测未来一段时间内该事件的特征.这是一类相对比较复杂的预测建模问题,和回归分析模型的预测不同,时间序列模型是依赖于事件发生的先后顺 ...

  2. R语言中文社区历史文章整理(类型篇)

    R语言中文社区历史文章整理(类型篇)   R包: R语言交互式绘制杭州市地图:leafletCN包简介 clickpaste包介绍 igraph包快速上手 jiebaR,从入门到喜欢 Catterpl ...

  3. Pytorch循环神经网络LSTM时间序列预测风速

    #时间序列预测分析就是利用过去一段时间内某事件时间的特征来预测未来一段时间内该事件的特征.这是一类相对比较复杂的预测建模问题,和回归分析模型的预测不同,时间序列模型是依赖于事件发生的先后顺序的,同样大 ...

  4. 预测分析建模 Python与R语言实现

    预测分析建模 Python与R语言实现 目录 前言 第1章 分析与数据科学1第2章 广告与促销10第3章 偏好与选择24第4章 购物篮分析31第5章 经济数据分析42第6章 运营管理56第7章 文本分 ...

  5. R语言︱处理缺失数据&&异常值检验、离群点分析、异常值处理

    在数据挖掘的过程中,数据预处理占到了整个过程的60% 脏数据:指一般不符合要求,以及不能直接进行相应分析的数据 脏数据包括:缺失值.异常值.不一致的值.重复数据及含有特殊符号(如#.¥.*)的数据 数 ...

  6. 基于R语言的时间序列指数模型

    时间序列: (或称动态数列)是指将同一统计指标的数值按其发生的时间先后顺序排列而成的数列.时间序列分析的主要目的是根据已有的历史数据对未来进行预测.(百度百科) 主要考虑的因素: 1.长期趋势(Lon ...

  7. 【R语言学习】时间序列

    时序分析会用到的函数 函数 程序包 用途 ts() stats 生成时序对象 plot() graphics 画出时间序列的折线图 start() stats 返回时间序列的开始时间 end() st ...

  8. survival analysis 生存分析与R 语言示例 入门篇

    原创博客,未经允许,不得转载. 生存分析,survival analysis,顾名思义是用来研究个体的存活概率与时间的关系.例如研究病人感染了病毒后,多长时间会死亡:工作的机器多长时间会发生崩溃等. ...

  9. 利用R语言打造量化分析平台

    利用R语言打造量化分析平台 具体利用quantmod包实现对股票的量化分析 1.#1.API读取在线行情2.#加载quantmod包3.if(!require(quantmod)){4. instal ...

随机推荐

  1. touch命令功能

    touch命令功能   touch fileA,如果fileA存在,使用touch命令可更改这个文件或目录的日期时间,包括存取时间和更改时间:如果fileA不存在,touch命令会在当前目录下新建一个 ...

  2. Asp.Net Web Api 接口,拥抱支持跨域访问。

    如何让你的 Asp.Net Web Api 接口,拥抱支持跨域访问. 由于 web api 项目通常是被做成了一个独立站点,来提供数据,在做web api 项目的时候,不免前端会遇到跨域访问接口的问题 ...

  3. Object Pool

    设计模式之美:Object Pool(对象池)   索引 意图 结构 参与者 适用性 效果 相关模式 实现 实现方式(一):实现 DatabaseConnectionPool 类. 意图 运用对象池化 ...

  4. Django是Python下的一款网络服务器框架

    被解放的姜戈01 初试天涯   Django是Python下的一款网络服务器框架.Python下有许多款不同的框架.Django是重量级选手中最有代表性的一位.许多成功的网站和APP都基于Django ...

  5. 【转】几点 iOS 开发技巧

    [译] 几点 iOS 开发技巧 原文:iOS Programming Architecture and Design Guidelines 原文来自破船的分享 原文作者是开发界中知晓度相当高的 Mug ...

  6. 职责链(Chain of Responsibility)模式

    一. 职责链(Chainof Responsibility)模式 责任链模式是一种对象的行为模式.在责任链模式里,很多对象由每一个对象对其下家的引用而连接起来形成一条链.请求在这个链上传递,直到链上的 ...

  7. elasticsearch文档-modules

    elasticsearch文档-modules modules 模块 cluster 原文 基本概念 cluster: 集群,一个集群通常由很多节点(node)组成 node: 节点,比如集群中的每台 ...

  8. [转]iOS Tutorial – Dumping the Application Heap from Memory

     Source:https://blog.netspi.com/ios-tutorial-dumping-the-application-heap-from-memory/ An essential ...

  9. 大数据之HBase

    大数据之HBase数据插入优化之多线程并行插入实测案例 一.引言: 上篇文章提起关于HBase插入性能优化设计到的五个参数,从参数配置的角度给大家提供了一个性能测试环境的实验代码.根据网友的反馈,基于 ...

  10. hightchart导出图片

    通常在使用highchart导出图片pdf等文件时,我们一般直接引入exporting.js即可 执行导出操作则会直接请求highchart服务器,执行生成图片等操作,然后下载到客户端: 但这一切的操 ...