1 样本的自协方差函数的通式如下: 2 其实,后面要计算的自相关函数也可以用自协方差来表示: # @author: "Thomas.Shih" # @date: 2018/3/5 0005 # !/usr/bin/python3 # -*- coding:utf-8 -*- TimeSeries = [11.67602657, 5.637492979, 1.375516942, 0.618705492, -0.152047234, -0.508555434, -6.065288121,…
1 很多人已经了解到AR(1)这种最简单的时间序列模型,ARMA模型包括AR模型和MA模型两个部分,这里要详细介绍Box-Jenkins模型的观念(有些资料中把ARMA模型叫做Box-Jenkins模型,都是一会儿事,这里说明一下),并说明模型. 2 首先现将重点放在介绍“单变数时间序列模型”(univariate time series model),也就是从模型中只有“一个”时间序列变数来开始谈起,但你必须先要记住的是其实时间模型也可以包含“多变数”的情况. 3 什么是Box-Jenkins…
1.   为了使计算简单,引入滞后算子的概念: 2.   定义LYt = Yt-1 , L2Yt = Yt-2,... , LsYt = Yt-s. 3.   也就是把每一期具体滞后哪一期的k提到L的上方,来用一个Yt来标记具体属于哪一个滞后期.默认,Yt-1的上方为1,其实不用写. 4.   一定和一个滞后变量放在一起的,不能单独出现L. 5.   用滞后算子来表示比较方便一些,但是最后要带回去,表示具体的哪一个滞后期. 6   另外,我们把滞后算子的s标记,标记成负数,就为超前算子.比如L-…
1   在时间序列中ACF图和PACF图是非常重要的两个概念,如果运用时间序列做建模.交易或者预测的话.这两个概念是必须的. 2   ACF和PACF分别为:自相关函数(系数)和偏自相关函数(系数). 3   在许多软件中比如Eviews分析软件可以调出某一个序列的ACF图和PACF图,如下: 3.1   有时候这张图是横躺着的,不过这个不重要,反正一侧为小于0的负值范围,一侧为大于0的正值范围,均值(准确的说是坐标y轴为0,有些横着的图,会把x轴和y轴表示出来,值都在x轴上下附近呈现出来).…
1   我们对于acf和pacf值计算完毕之后,在需要计算两个数值的标准差. 2   acf和pacf的标准差计算略有不同.acf的标准差是一个移动过程,而pacf是一个相对固定过程. 3   我们继续引用这篇博文中最后的到的数值http://www.cnblogs.com/noah0532/p/8451375.html.来计算他们的标准差.代码如下: # 求acf的标准差 import math se = 0 acf_tmp0 = [] while se < len(AcfValue): ac…
1 ADF检验也叫扩展的迪克富勒检验,主要作用是检测序列的平稳性,也是最常用检测序列平稳性的检验方法. 2 何为:平稳性?单位根?(略),见这部分随便的其他内容有讲解.是建模对数据的先决条件. 3 ADF检验的三种情形: 4 在MATLAB中常用的adf检验的操作: 4.1 经过差分使序列平稳. % 如果结果h=0,表示拒绝原假设,数据不平稳 % 如果结果h=1,表示不拒绝原假设,数据平稳 % 注意这里和上图不一样,原假设为平稳1,. %% 单位根检验实例 % Load Canadian inf…
1. DeepFM算法的提出 由于DeepFM算法有效的结合了因子分解机与神经网络在特征学习中的优点:同时提取到低阶组合特征与高阶组合特征,所以越来越被广泛使用. 在DeepFM中,FM算法负责对一阶特征以及由一阶特征两两组合而成的二阶特征进行特征的提取:DNN算法负责对由输入的一阶特征进行全连接等操作形成的高阶特征进行特征的提取. 具有以下特点: 结合了广度和深度模型的优点,联合训练FM模型和DNN模型,同时学习低阶特征组合和高阶特征组合. 端到端模型,无需特征工程. DeepFM 共享相同的…
Mmseg中文分词算法解析 @author linjiexing 开发中文搜索和中文词库语义自己主动识别的时候,我採用都是基于mmseg中文分词算法开发的Jcseg开源project.使用场景涉及搜索索引创建时的中文分词.新词发现的中文分词.语义词向量空间构建过程的中文分词和文章特征向量提取前的中文分词等,整体使用下来,感觉jcseg是一个非常优秀的开源中文分词工具,并且可配置和开源的情况下,能够满足非常多场景的中文分词逻辑.本文先把jcseg使用到最主要的mmseg算法解析一下. 1. 中文分…
数据结构与算法(Python) Why? 我们举一个可能不太恰当的例子: 如果将最终写好运行的程序比作战场,我们码农便是指挥作战的将军,而我们所写的代码便是士兵和武器. 那么数据结构和算法是什么?答曰:兵法! 我们可以不看兵法在战场上肉搏,如此,可能会胜利,可能会失败.即使胜利,可能也会付出巨大的代价.我们写程序亦然:没有看过数据结构和算法,有时面对问题可能会没有任何思路,不知如何下手去解决:大部分时间可能解决了问题,可是对程序运行的效率和开销没有意识,性能低下:有时会借助别人开发的利器暂时解决…
地理围栏算法解析 http://www.cnblogs.com/LBSer/p/4471742.html 地理围栏(Geo-fencing)是LBS的一种应用,就是用一个虚拟的栅栏围出一个虚拟地理边界,当手机进入.离开某个特定地理区域,或在该区域内活动时,手机可以接收自动通知和警告.如下图所示,假设地图上有三个商场,当用户进入某个商场的时候,手机自动收到相应商场发送的优惠券push消息.地理围栏应用非常广泛,当今移动互联网主要app如美团.大众点评.手淘等都可看到其应用身影. 图1 地理围栏示意…