• 预测流程

    确定主题。指标、主体、精度、周期、用户、成本和数据七要素。

    收集数据。内容划分、收集原则、

    选择方法。主要方法有自相关分析、偏相关分析、频谱分析、趋势分析、聚类分析、关联分析、相关分析、互相关分析、典型相关分析、对应分析等。

    分析规律。常见的规律有趋势性、周期性、波动性、相关性、相似性、项关联性、段关联性。

    建立模型。特征构建、特征选择、算法选择(可理解性、性能、数据要求)、构建模型(分割数据集)、测试模型、模型优化、评估效果、发布模型。

  • 分析方法
  • 自相关分析,同一时间序列在不同时刻的取值的相关程度。函数acf,主要参数有lag.max最大滞后阶数,type设定计算acf的字符串,有相关系数、协方差、偏相关系数三种。
  • 偏相关分析,pacf.
  • 简单相关分析,一种不能用函数关系表示的关系。可以用散点图和相关图来观测。pairs/scatterplotMatrix可以绘制各个变量的散点图,三维的可以使用car包的scatter3d函数。相关图可以用corrgram,corrplot包,函数名即为包名
  • 互相关分析,两个时间序列在做任意两个不同时刻的相关程度,ccf,参数lag.max, type
  • 典型相关分析,反映两组变量的整体相关性,通过构建综合指标进行,stats包cancor函数,参数x,y为n行的矩阵xcenter,ycenter表示是否进行中心化。
  • 对应分析,将样本取值和变量取值联系起来,主要应用在市场细分、产品定位方面,MASS包corresp函数。
  • 频谱分析,将时域信号转换为频域信号,stats包spec.pgram函数计算谱密度,参数意义不明......不懂这玩意儿。
  • 趋势分析,TTR包中SMA和EMA函数,SMA计算的是n日的平均值,就是所谓的移动平均线(ps,那我还自己写了一个类似的有何用),EMA指数加权平均,wilder和ratio配置权重。
  • 聚类分析,聚类方法相当的多....多到怀疑人生,见过最牛逼的是13年发表哦在science上面的聚类,真花Q厉害。最简单的kmeans,参数algorithm课选择算法,trace可以跟踪运算过程;另一种是系统聚类,将独立样本看作一类,然后缩减,hclust。
  • 关联规则分析,在交易数据、关系数据等信息中,挖掘对象集合间的规律或者模式的过程。关联分析的主要算法有Apriori和Eclat。arules包apriori和eclat函数。
  • 序列模式挖掘,SPADE算法。需要考虑事务间的先后顺序。该类算法分为两类,一类是类Apriori算法(GSP、SPADE),另一类是基于划分的模式生长算法(FreeSpan、perfixSpan)。arulesSequences包中的cspade函数。

R语言预测实战(游浩麟)笔记1的更多相关文章

  1. R语言预测实战(游浩麟)笔记2

    特征构建技术 特征变换,对原始的某个特征通过一定的规则或映射得到新特征的方法,主要方法包括概念分层.标准化.离散化.函数变换以及深入表达.特征变换主要由人工完成,属于比较基础的特征构建方法. 概念分层 ...

  2. R语言预测实战(第二章--预测方法论)

    2.1预测流程 从确定预测主题开始,一次进行数据收集.选择方法.分析规律.建立模型.评估效果直到发布模型. 2.2.1确定主题 (1)指标:表达的是数量特征,预测的结果也通常是通过指标的取值来体现. ...

  3. R语言预测实战(第一章)

    本例使用forecast包中自带的数据集wineind,它表示从1980年1月到1994年8月, 由葡萄酒生产商销售的容量不到1升的澳大利亚酒的总量.数据示意如下: #观察曲线簇 len=1993-1 ...

  4. 使用R语言预测产品销量

    使用R语言预测产品销量 通过不同的广告投入,预测产品的销量.因为响应变量销量是一个连续的值,所以这个问题是一个回归问题.数据集共有200个观测值,每一组观测值对应一种市场情况. 数据特征 TV:对于一 ...

  5. R语言数据处理包dplyr、tidyr笔记

    dplyr包是Hadley Wickham的新作,主要用于数据清洗和整理,该包专注dataframe数据格式,从而大幅提高了数据处理速度,并且提供了与其它数据库的接口:tidyr包的作者是Hadley ...

  6. 【转】R语言知识体系概览

    摘要:R语言的知识体系并非语法这么简单,如果都不了R的全貌,何谈学好R语言呢.本文将展示介绍R语言的知识体系结构,并告诉读者如何才能高效地学习R语言. 最近遇到很多的程序员都想转行到数据分析,于是就开 ...

  7. 《R语言实战》读书笔记--为什么要学

    本人最近在某咨询公司实习,涉及到了一些数据分析的工作,用的是R语言来处理数据.但是在应用的过程中,发现用R很不熟练,所以再打算学一遍R.曾经花一个月的时间看过一遍<R语言编程艺术>,还用R ...

  8. R 语言实战-Part 4 笔记

    R 语言实战(第二版) part 4 高级方法 -------------第13章 广义线性模型------------------ #前面分析了线性模型中的回归和方差分析,前提都是假设因变量服从正态 ...

  9. R 语言实战-Part 3 笔记

    R 语言实战(第二版) part 3 中级方法 -------------第8章 回归------------------ #概念:用一个或多个自变量(预测变量)来预测因变量(响应变量)的方法 #最常 ...

随机推荐

  1. JS宽高理解

    1.clentWidth和clientHeight ①加入无padding.无滚动条显示占据位置 clientWidth=style.width ②假如有padding.无滚动 clientWidth ...

  2. Java面向对象内存分析

    title: Java面向对象内存分析 date: 2018-07-28 11:12:50 tags: JavaSE categories: - Java - JavaSE 一.Java虚拟机的内存区 ...

  3. [转载]EXCEL绝对引用中$A$1、A$1、$A1三个的区别?

    转自:https://zhidao.baidu.com/question/167695289.html EXCEL绝对引用中$A$1.A$1.$A1三个的区别? 符号“$”加在不地方的含义有何不同? ...

  4. 【HNOI 2016】序列

    Problem Description 给定长度为 \(n\) 的序列:\(a_1, a_2, \cdots , a_n\),记为 \(a[1 \colon n]\).类似地,\(a[l \colon ...

  5. 进程部分(IPC机制及生产者消费者模型)和线程部分

    进程部分 一:进程间通信IPC机制:由于进程之间的内存空间是相互隔离的,所以为了进程间的通信需要一个共享的内存空间, 但是共享带来的问题是数据在写的时候就不安全了,所以需要一种机制既有能共享的内存 空 ...

  6. Hybrid App 开发模式

    开发移动App主要有三种模式:Native. Hybrid 和 Web App. 需要注意的一点是在选择开发模式的时候,要根据你的项目类型(图片类?视频类?新闻类?等),产品业务和人员技术储备等做权衡 ...

  7. shell 获得后台进程返回值

    获得后台进程返回值我们用“&”把进程放入后台以后,如果需要了解进程的执行情况,可以使用wait函数.默认情况下wait会等待任意子进程结束但是不会返回子进程的返回值.而以子进程的pid作为参数 ...

  8. [原][杂谈]如果人类的末日:"天网"出现

    本文由南水之源在2019年3月21日发布,转载需声明原作者 本文仅为一次基于科技发展与科幻小说的幻想,如果天网真的出现,请不要参考这篇逻辑破败的推论. 参考: 天网(Skynet),是电影<终结 ...

  9. cordova自定义插件的创建过程

    最近学习了cordova插件,记录一下大概的过程,仅供参考. 前期的配置就不记录了网上好多. 在简书上从新写了一个更详细的cordova插件教程,有需要的可以点这里进去看看. 第一步 创建一个cord ...

  10. 什么是,session、cookies、token

    在一片文章上看到关于cookies和session 的解释,大概意思是这样的. 说你去星巴克喝咖啡,你平均一星期去两次,你的操作是看菜单,点咖啡.结账 加入你三星期不去,店员也许不及得你了,你依旧需要 ...