• 预测流程

    确定主题。指标、主体、精度、周期、用户、成本和数据七要素。

    收集数据。内容划分、收集原则、

    选择方法。主要方法有自相关分析、偏相关分析、频谱分析、趋势分析、聚类分析、关联分析、相关分析、互相关分析、典型相关分析、对应分析等。

    分析规律。常见的规律有趋势性、周期性、波动性、相关性、相似性、项关联性、段关联性。

    建立模型。特征构建、特征选择、算法选择(可理解性、性能、数据要求)、构建模型(分割数据集)、测试模型、模型优化、评估效果、发布模型。

  • 分析方法
  • 自相关分析,同一时间序列在不同时刻的取值的相关程度。函数acf,主要参数有lag.max最大滞后阶数,type设定计算acf的字符串,有相关系数、协方差、偏相关系数三种。
  • 偏相关分析,pacf.
  • 简单相关分析,一种不能用函数关系表示的关系。可以用散点图和相关图来观测。pairs/scatterplotMatrix可以绘制各个变量的散点图,三维的可以使用car包的scatter3d函数。相关图可以用corrgram,corrplot包,函数名即为包名
  • 互相关分析,两个时间序列在做任意两个不同时刻的相关程度,ccf,参数lag.max, type
  • 典型相关分析,反映两组变量的整体相关性,通过构建综合指标进行,stats包cancor函数,参数x,y为n行的矩阵xcenter,ycenter表示是否进行中心化。
  • 对应分析,将样本取值和变量取值联系起来,主要应用在市场细分、产品定位方面,MASS包corresp函数。
  • 频谱分析,将时域信号转换为频域信号,stats包spec.pgram函数计算谱密度,参数意义不明......不懂这玩意儿。
  • 趋势分析,TTR包中SMA和EMA函数,SMA计算的是n日的平均值,就是所谓的移动平均线(ps,那我还自己写了一个类似的有何用),EMA指数加权平均,wilder和ratio配置权重。
  • 聚类分析,聚类方法相当的多....多到怀疑人生,见过最牛逼的是13年发表哦在science上面的聚类,真花Q厉害。最简单的kmeans,参数algorithm课选择算法,trace可以跟踪运算过程;另一种是系统聚类,将独立样本看作一类,然后缩减,hclust。
  • 关联规则分析,在交易数据、关系数据等信息中,挖掘对象集合间的规律或者模式的过程。关联分析的主要算法有Apriori和Eclat。arules包apriori和eclat函数。
  • 序列模式挖掘,SPADE算法。需要考虑事务间的先后顺序。该类算法分为两类,一类是类Apriori算法(GSP、SPADE),另一类是基于划分的模式生长算法(FreeSpan、perfixSpan)。arulesSequences包中的cspade函数。

R语言预测实战(游浩麟)笔记1的更多相关文章

  1. R语言预测实战(游浩麟)笔记2

    特征构建技术 特征变换,对原始的某个特征通过一定的规则或映射得到新特征的方法,主要方法包括概念分层.标准化.离散化.函数变换以及深入表达.特征变换主要由人工完成,属于比较基础的特征构建方法. 概念分层 ...

  2. R语言预测实战(第二章--预测方法论)

    2.1预测流程 从确定预测主题开始,一次进行数据收集.选择方法.分析规律.建立模型.评估效果直到发布模型. 2.2.1确定主题 (1)指标:表达的是数量特征,预测的结果也通常是通过指标的取值来体现. ...

  3. R语言预测实战(第一章)

    本例使用forecast包中自带的数据集wineind,它表示从1980年1月到1994年8月, 由葡萄酒生产商销售的容量不到1升的澳大利亚酒的总量.数据示意如下: #观察曲线簇 len=1993-1 ...

  4. 使用R语言预测产品销量

    使用R语言预测产品销量 通过不同的广告投入,预测产品的销量.因为响应变量销量是一个连续的值,所以这个问题是一个回归问题.数据集共有200个观测值,每一组观测值对应一种市场情况. 数据特征 TV:对于一 ...

  5. R语言数据处理包dplyr、tidyr笔记

    dplyr包是Hadley Wickham的新作,主要用于数据清洗和整理,该包专注dataframe数据格式,从而大幅提高了数据处理速度,并且提供了与其它数据库的接口:tidyr包的作者是Hadley ...

  6. 【转】R语言知识体系概览

    摘要:R语言的知识体系并非语法这么简单,如果都不了R的全貌,何谈学好R语言呢.本文将展示介绍R语言的知识体系结构,并告诉读者如何才能高效地学习R语言. 最近遇到很多的程序员都想转行到数据分析,于是就开 ...

  7. 《R语言实战》读书笔记--为什么要学

    本人最近在某咨询公司实习,涉及到了一些数据分析的工作,用的是R语言来处理数据.但是在应用的过程中,发现用R很不熟练,所以再打算学一遍R.曾经花一个月的时间看过一遍<R语言编程艺术>,还用R ...

  8. R 语言实战-Part 4 笔记

    R 语言实战(第二版) part 4 高级方法 -------------第13章 广义线性模型------------------ #前面分析了线性模型中的回归和方差分析,前提都是假设因变量服从正态 ...

  9. R 语言实战-Part 3 笔记

    R 语言实战(第二版) part 3 中级方法 -------------第8章 回归------------------ #概念:用一个或多个自变量(预测变量)来预测因变量(响应变量)的方法 #最常 ...

随机推荐

  1. Android系统应用Mms之短信会话列表加载流程一

    1. ConversationList短息会话列表界面 1. 开始进行加载 ConversationList: protected void onStart(){ ... // 进行异步查询 star ...

  2. 破解360doc个人图书馆网站的右键、复制方法

    chrome浏览器如下做法: 右上角菜单按钮→设置→显示高级设置→隐私设置下的 内容设置按钮→javascript下的管理例外情况→添加 [*.]360doc.com 设置为禁止 →完成

  3. [ZOJ 4024] Peak

    题目链接:http://acm.zju.edu.cn/onlinejudge/showProblem.do?problemCode=4024 从前往后找满足al<al+1的最大下标l,从后往前找 ...

  4. C++第二章复习与总结(思维导图分享)

    在完成了第二章的学习后,为了便于日后的复习整理,我制作了一张思维导图,有需要的可以自取. 基本数据类型 基础类型在cppreference网站上有非常完备的介绍,我一句话两句话也说不清,具体网址我会给 ...

  5. kali虚拟机添加共享文件夹

    1.保证安装了vmtools 2.在虚拟机本身设置共享文件夹,如图 其中选的这个文件夹就是宿主机里待共享的文件夹. 3,在kali里启用它: vmhgfs-fuse .host:[宿主机文件夹] /m ...

  6. 四、Python数据类型(二)

    一.布尔(Boolean) 布尔类型的数据只有两个:(真)True和(假)False.多用于条件语句或者是作为函数返回值. 二.字典(dictionary) 1.认识字典 将数据组织成键值对(key- ...

  7. .NET、C#和ASP.NET、ASP.NET MVC四者之间的区别

    什么是.NET? .NET是微软公司下的一个开发平台,.NET核心就是.NET Framwork(.NET框架)是.NET程序开发和运行的环境,在这个平台下可以用不同的语言进行开发,因为.NET是跨语 ...

  8. Android 自定义类型文件与程序关联

    0x01 功能 实现在其他应用中打开某个后缀名的文件 可以直接跳转到本应用中的某个activity进行处理 0x01 实现 首先创建一个activity ,然后在manifest里对该activity ...

  9. 如何查看卖家ID (Merchant ID) 亚马逊哪里找?

    如何查看卖家ID (Merchant ID) 亚马逊哪里找? 如何查看卖家ID (Merchant ID) 亚马逊哪里找? 1. 找到想要获取ID的卖家,点击店铺名(跟卖的卖家会收在”Other Se ...

  10. pta

    一:实验代码 include <stdio.h> char theValue[10] = { 'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j ...