计量经济与时间序列_ACF自相关与PACF偏自相关算法解析(Python,TB(交易开拓者))
1 在时间序列中ACF图和PACF图是非常重要的两个概念,如果运用时间序列做建模、交易或者预测的话。这两个概念是必须的。
2 ACF和PACF分别为:自相关函数(系数)和偏自相关函数(系数)。
3 在许多软件中比如Eviews分析软件可以调出某一个序列的ACF图和PACF图,如下:
3.1 有时候这张图是横躺着的,不过这个不重要,反正一侧为小于0的负值范围,一侧为大于0的正值范围,均值(准确的说是坐标y轴为0,有些横着的图,会把x轴和y轴表示出来,值都在x轴上下附近呈现出来)。
3.2 红色框框部分就是ACF图,青色框框部分就是PACF图,其中对应左边的Autocorrelation就是英文单词自相关的全称;Partial Correlation就是英文单词偏自相关的全称。
3.3 我们要计算的就是这两列数值。
3.4 其中紫色箭头标注出来的是指的2倍标准误范围,后面可以用对应的数值是否超过范围来判断截尾、拖尾等信息,进而判断采用哪种模型。
3.5 这里特别注明一下在默认状态下,这两根线是如何计算的:
在大样本下(T很大的时候,这里T指的是样本的个数;其实准确的说样本符合均值为0的正太分布)。因此这里的对于ACF或PACF属于一种分位点检验,这个东西在很多baidu可以找到一个正太分布图,然后左右画线会得到99%,90%...的分位点,这里的这两根线就是指的这个。我们这里要做的是双侧对称检验,所以上下两根线分布式0±分位点的值。分位点=2倍×sqrt开方(1/T),这里的T指的是样本的个数,样本个数指的是原始的那个样本的个数,不是ACF或PACF计算完的样本个数。如果某一个值大于2倍标准误,也就是说大于正态分布左/右的95%分位点,于是,在拒绝域,则拒绝0假设(也就是拒绝均值为0的假设)
例如:样本共10个,ACF或PACF计算完毕后,他们的数量都为9个,其分为点为:2×sqrt(1/10) = 0.6324555320...,双侧检验边沿值为:(0-0.6324555320,0+0.6324555320) = [-0.6324555320,+0.6324555320](这就是两根虚线的值)。 (3.5.1)
另外我们还通过另外一个公式Sρk ≈ sqrt(1/n * (1+2*ρ12 + ... + 2*ρk-12))来计算acf的双侧检验值。具体在这篇博文中得出。http://www.cnblogs.com/noah0532/p/8453959.html
4 ACF算法的实现(python):
4.1 首先:给定一组数据,这里的是线性数据,不用太多10个元素,一组的时间序列。
- TimeSeries = [13, 8, 15, 4, 4, 12, 11, 7, 14, 12] # 列表形式
- print(TimeSeries)
- # 显示结果:[13, 8, 15, 4, 4, 12, 11, 7, 14, 12]
4.2 算法表达式。
4.3 算法解析:
计算ρ1:
给定一阶滞后序列:其中滞后用L来表示,具体表示方法见链接:http://www.cnblogs.com/noah0532/p/8449991.html
- LZt = TimeSeries[:-1:]
- print(LZt)
- # 显示结果:[13, 8, 15, 4, 4, 12, 11, 7, 14]
对应的这两个序列分别为:
[13, 8, 15, 4, 4, 12, 11, 7, 14, 12]
[13, 8, 15, 4, 4, 12, 11, 7, 14]
我们在把原始序列与一阶滞后序列进行对齐:
- Zt = TimeSeries[1::]
- print(Zt)
- # 显示结果:[8, 15, 4, 4, 12, 11, 7, 14, 12]
这样两个序列变为:
[ 8, 15, 4, 4, 12, 11, 7, 14, 12]
[13, 8, 15, 4, 4, 12, 11, 7, 14]
对这两个序列进行计算就会得出ρ1的结果(也就是ACF的第一个值)
4.4 其实我们可以得到这样一个结果,就是这样不断的比较下去,计算每一个滞后,原始序列会少一个值来对应滞后的序列,然后分别来进行计算。我们把这个过程化简一下,代码如下(以如上10个序列为例,最后会得出9对)
- TimeSeries = [13, 8, 15, 4, 4, 12, 11, 7, 14, 12] # 列表形式
- Zt = []
- LZt = []
- i = 1
- while i < len(TimeSeries):
- L = TimeSeries[i::]
- LL = TimeSeries[:-i:]
- Zt.append(L)
- LZt.append(LL)
- i += 1
- print(TimeSeries)
- print(Zt)
- print(LZt)
- # 显示结果:
- # [13, 8, 15, 4, 4, 12, 11, 7, 14, 12]
- # [[8, 15, 4, 4, 12, 11, 7, 14, 12], [15, 4, 4, 12, 11, 7, 14, 12], [4, 4, 12, 11, 7, 14, 12], [4, 12, 11, 7, 14, 12], [12, 11, 7, 14, 12], [11, 7, 14, 12], [7, 14, 12], [14, 12], [12]]
- # [[13, 8, 15, 4, 4, 12, 11, 7, 14], [13, 8, 15, 4, 4, 12, 11, 7], [13, 8, 15, 4, 4, 12, 11], [13, 8, 15, 4, 4, 12], [13, 8, 15, 4, 4], [13, 8, 15, 4], [13, 8, 15], [13, 8], [13]]
4.5 通过这种遍历加减方式,如果原始列表为10个元素的话会得到9对ACF带计算序列,以此类推,这样做的目的就是为了把序列进行对齐计算。把这9对列出来看一下:
[8, 15, 4, 4, 12, 11, 7, 14, 12]
[13, 8, 15, 4, 4, 12, 11, 7, 14]
[15, 4, 4, 12, 11, 7, 14, 12]
[13, 8, 15, 4, 4, 12, 11, 7]
[4, 4, 12, 11, 7, 14, 12]
[13, 8, 15, 4, 4, 12, 11]
[4, 12, 11, 7, 14, 12]
[13, 8, 15, 4, 4, 12]
[12, 11, 7, 14, 12]
[13, 8, 15, 4, 4]
[11, 7, 14, 12]
[13, 8, 15, 4]
[7, 14, 12]
[13, 8, 15]
[14, 12]
[13, 8]
[12]
[13]
4.6 根据算法公式,其分母为原始序列每一个元素距离平均值的平方。因此我们也可以把分母计算出来。
- TimeSeries = [13, 8, 15, 4, 4, 12, 11, 7, 14, 12] # 列表形式
- Zt = []
- LZt = []
- sum = 0
- i = 1
- while i < len(TimeSeries):
- L = TimeSeries[i::]
- LL = TimeSeries[:-i:]
- sum = sum + TimeSeries[i - 1]
- Zt.append(L)
- LZt.append(LL)
- i += 1
- sum = sum + TimeSeries[-1]
- avg = sum / len(TimeSeries)
- print(TimeSeries)
- print(Zt)
- print(LZt)
- print(avg)
- # 显示结果:
- # 10.0
4.7 我们具备了这些所有的元素后开始计算这些所有ACF的ρ值,最终我们还是用列表来表示:
- k = 0
- result_Deno = 0
- # 首先计算分母=分母都为通用
- while k < len(TimeSeries):
- result_Deno = result_Deno + pow((TimeSeries[k] - avg), 2)
- k += 1
- print(result_Deno)
- # 显示结果:144.0
- # 然后计算分子
- p = 0
- q = 0
- acf = []
- while p < len(Zt):
- # print(Zt[p])
- # print(LZt[p])
- q = 0
- result_Mole = 0
- while q < len(Zt[p]):
- result_Mole = result_Mole + (Zt[p][q] - avg) * (LZt[p][q] - avg)
- q += 1
- acf.append(round(result_Mole / result_Deno, 3)) # 保留小数点后三位
- p += 1
- print(acf)
- # 显示结果:
- # [-0.188, -0.201, 0.181, -0.132, -0.326, 0.118, -0.049, 0.056, 0.042]
4.7 结果验证:与用Eviews软件计算的结果一致,算法结束:
[-0.188, -0.201, 0.181, -0.132, -0.326, 0.118, -0.049, 0.056, 0.042]
5 PACF算法的实现(python)
5.1 PACF算法源于ACF算法,必须先算出ACF的值来,然后再计算PACF,PACF这里用的是一个递推形式的公式,计算每一个φ值。在书中有些φ值用φkk来表示,有时候也用一个大Pk来表示,其实道理都一样。
5.2 递推式如下:
5.3 这个递推式,紫色框内为每期值,下面的属于过度值,用于递推累计。
5.4 这个递推式算法看起来无从下手比较麻烦。我们先分解一下:
5.5 j和k的下标解析:
如果k = 1,那么 j = 1,2
如果k = 2,那么 j = 1,2
如果k = 3,那么 j = 1,2,3
如果k = 4,那么 j = 1,2,3,4
如果k = 5,那么 j = 1,2,3,4,5
如果k = 6,那么 j = 1,2,3,4,5,6
如果k = 7,那么 j = 1,2,3,4,5,6,7
如果k = 8,那么 j = 1,2,3,4,5,6,7,8
如果k = 9,那么 j = 1,2,3,4,5,6,7,8,9
... ....
从下标可以看出这个递推关系,如果处于k的某种状态(数值),那么 j 将从当前状态递减到1。这也就是 j = 1,...,k的解析。
5.6 从这个下标解析可以看出,这两部分的递推式,第一部分(紫色框框中)的是计算PACF当前值,而第二部分是计算每阶段的PACF值的缺省值(所需值)的计算。因此每期的PACF值的计算,需要递推第二个公式中的值,然后再去计算下一期PACF值。这个逻辑是这样。
5.7 从5.5的这个规律可以看出,j 是 k递减数,也就是当前值如果为k = 3的话,我们需要有3个第二个公式的值;如果k = 7的话,我们需要有7个第二个公式的值;这个逻辑是没有问题的,我们以一个多的为例子
k = 8 通式如下:
φ9,j = φ8j - φ99*φ8,9-j
j = 1
φ91 = φ81 - φ99*φ88
j = 2
φ92 = φ82 - φ99*φ87
j = 3
φ93 = φ83 - φ99*φ86
j = 4
φ94 = φ84 - φ99*φ85
j = 5
φ95 = φ85 - φ99*φ84
j = 6
φ96 = φ86 - φ99*φ83
j = 7
φ97 = φ87 - φ99*φ82
j = 8
φ98 = φ88 - φ99*φ81
5.8 正如上面所示,我们会得到8个表达式。其每一期的表达式的值我们需要用列表来进行记录;这里的规律是φ99来自于第一个部分的公式,其φ8x和后面的φ8x是来自第二部分公式计算的上一期的值。这样这个第二部分的表达式我们就可以计算出来了。
5.9 我们再来递推第一部分的那个公式。还是以上面的为例子。我们举一个小点儿的数。
k = 2 通式如下
φ33 = φ3 - sigma(φ2j*ρ3-j) / 1 - sigma(φ2j*ρj)
j = 1
φ33 = φ3 - sigma(φ21*ρ2) / 1 - sigma(φ21*ρ1)
j = 2
φ33 = φ3 - sigma(φ22*ρ1) / 1 - sigma(φ22*ρ2)
我们把sigma中的两部分进行合并得:
φ33 = φ3 - (φ21*ρ2 + φ22*ρ1) / 1 - (φ21*ρ1 + φ22*ρ2)
5.10 我们发现一个规律。如果要计算33的时候,其括号内的值φ的顺序不变,其ρ值为反向求积然后再求和。
5.11 我们现在试着来求一下这段代码的写法,以上面计算出来的ACF值,接着来计算PACF值:
ACF = [-0.188, -0.201, 0.181, -0.132, -0.326, 0.118, -0.049, 0.056, 0.042]
ACF[0] = ρ1 = -0.188
ACF[1] = ρ2 = -0.201
ACF[2] = ρ4 = 0.181
ACF[3] = ρ5 = -0.132
ACF[4] = ρ6 = -0.326
ACF[5] = ρ7 = 0.118
ACF[6] = ρ8 = -0.049
ACF[7] = ρ9 = 0.056
ACF[8] = ρ9 = 0.042
5.12 (具体过程稍显复杂,所以下面用这个颜色写,这样更清楚一些):
(1):递推算法,在编写的时候可能会对初学者烧脑一些。重要的是对于每一种算法,我们首先要找到他们的规律,再不会算,可以找张纸先手工验算一下。
(2):acf值与pacf值的长度都是一样,且第一个值都相等。φkk如果是两个整数,比如φ11,φ33,这就是我们要求的pacf对应每期的值。
(3):正如上面所说的,都是整数的话是所求的值,那么不是整数的话,类似于φ41,φ42,φ43...等等这些,就是第二个递推式所需要计算的值。这是值是为了求下一组数值所用。
(4):因此我们得出这样一个规律,除去第一个值(pacf和acf第一个值都相等)。后面每期值分两组来进行计算,然后一组循环结束,以此类推,知道pacf长度减-1都完成为止。
(5):那么一组是什么样子的?比如第一组是:φ22,φ21;第二组:φ33,φ32,φ31;第三组:φ44,φ43,φ42,φ41...以此类推。一组等于一个大循环。
(6):每组值分第一部分整值计算和第二部分非整值计算,每一组所需的φ值(看递推公式),是来自于上一组的值。因此我们计算完一组后,把所需要的值(代码中是用个过渡变量bridge来记录),送给下一组计算用,计算完毕删除,再赋新值,再给下一组。循环往复,直到结束。
(7):那每组需要的值是什么样子,以计算到φ44,这个为例子,所需要的bridge值为[φ31,φ32,φ33]。用完了后,bridge更新为[φ41,φ42,φ43,φ44],供下一组φ55使用,其他每组都是这个原理。在这里引入了一个桥变量。
(8):由于精度可能略有差别,这样我们把之前计算的acf值先不要保留小数点后三位,计算完毕后,我们统一保留小数点后三位。
(9):最后再把上边界和下边界的值算出来。这个公式上面有。
5.13 具体代码如下:
- TimeSeries = [13, 8, 15, 4, 4, 12, 11, 7, 14, 12] # 列表形式
- Zt = []
- LZt = []
- total = 0
- i = 1
- while i < len(TimeSeries):
- L = TimeSeries[i::]
- LL = TimeSeries[:-i:]
- total = total + TimeSeries[i-1]
- Zt.append(L)
- LZt.append(LL)
- i += 1
- total = total + TimeSeries[-1]
- avg = total / len(TimeSeries)
- k = 0
- result_Deno = 0
- # 首先计算分母=分母都为通用
- while k < len(TimeSeries):
- result_Deno = result_Deno + pow((TimeSeries[k] - avg), 2)
- k += 1
- # print(result_Deno)
- # 显示结果:144.0
- # 然后计算分子
- p = 0
- q = 0
- acf = []
- while p < len(Zt):
- # print(Zt[p])
- # print(LZt[p])
- q = 0
- result_Mole = 0
- while q < len(Zt[p]):
- result_Mole = result_Mole + (Zt[p][q] - avg) * (LZt[p][q] - avg)
- q += 1
- acf.append(result_Mole / result_Deno) # 我们把前面计算的acf值先不要保留小数点后三位。
- # acf.append(result_Mole / result_Deno)
- p += 1
- # print(acf)
- # 初始化pacf
- pacf = []
- bridge = []
- bridge.append(acf[0])
- pacf.append(acf[0]) # 第一个φ11等于ρ1,再初始化pacf的第一个值。
- # 这里采用的是bridge这个循环变量。计算的逻辑是每次重新赋值一遍共下一轮计算所用。
- T = 0 # 初始化大循环的值为0,9个数值一共循环7次。原因是下面。
- while T < len(acf)-1: # pacf的初始值已经计算过一个了,acf的长度和pacf的长度是一样的,因此,len(acf)此时要减去一个1
- # 每进行一轮循环,这些变量都重新初始化一遍
- Mole = 0 # 计算紫框中Σ累加的分子值
- Deno = 0 # 计算紫框中Σ累计的分母值
- cross = 0 # 每计算完一遍第一部分的值,暂时用cross这个变量先保存起来。
- UnderCross = [] # 每计算完第二步的值,用UnderCross的值先保存起来,因为有时候第二步的值不是一个,所以用列表形式。
- # 计算第一部分
- t = 0
- while t < len(bridge): # 计算φ22,φ33,φ44,φ55,φ66,φ22,φ77,φ88...这些值
- Mole = Mole + (bridge[t] * acf[len(bridge)-1-t])
- Deno = Deno + (bridge[t] * acf[t])
- t += 1
- cross = (acf[t] - Mole) / (1 - Deno) # acf[t] 正确,每次迭代完成,都是分子的第一个值。
- # print(cross)
- # print(t)
- # 计算第二部分
- p = 0
- while p < len(bridge): # 计算像φ21,φ32,φ31...这样的值
- UnderCross.append(bridge[p] - cross * bridge[len(bridge)-1-p])
- p += 1
- bridge = [] # bridge使用完毕,初始化,再次赋值供下一次计算
- bridge.extend(UnderCross) # 把计算完毕的Under值赋值到bridge
- bridge.append(cross) # 把计算完毕的cross值存放到最后的位置
- pacf.append(cross) # 把pacf值累计进行添加并记录
- # print(bridge)
- # print(UnderCross)
- T += 1
- # print(pacf)
- # 整个的一段循环完毕。
- # 最后我们重新遍历一遍,然后把acf和pacf都保留小数点后三位。
- AcfValue = []
- PacfValue = []
- lag = 0
- for sht in acf:
- lag = round(sht, 3)
- AcfValue.append(lag)
- lag = 0
- print("acf值(保留小数点后三位)为:", AcfValue)
- for sht in pacf:
- lag = round(sht, 3)
- PacfValue.append(lag)
- lag = 0
- print("pacf值(保留小数点后三位)为:", PacfValue)
- # 最后把bounds值算出来。
- import math
- bound = []
- bound.append(-2*math.sqrt(1/len(TimeSeries)))
- bound.append(2*math.sqrt(1/len(TimeSeries)))
- print("上下边界值分别为:", bound)
- # 最终显示结果:
- # acf值(保留小数点后三位)为: [-0.188, -0.201, 0.181, -0.132, -0.326, 0.118, -0.049, 0.056, 0.042]
- # pacf值(保留小数点后三位)为: [-0.188, -0.245, 0.097, -0.134, -0.361, -0.126, -0.213, 0.036, -0.119]
- # 上下边界值分别为: [-0.6324555320336759, 0.6324555320336759]
5.14 最终结果验证:
acf值(保留小数点后三位)为: [-0.188, -0.201, 0.181, -0.132, -0.326, 0.118, -0.049, 0.056, 0.042]
pacf值(保留小数点后三位)为: [-0.188, -0.245, 0.097, -0.134, -0.361, -0.126, -0.213, 0.036, -0.119]
上下边界值分别为: [-0.6324555320336759, 0.6324555320336759]这里是计算的pacf的bound值。在看图的时候直接通用pacf的bound值。但是实际过程中这两个标准差是不太一样。具体见这篇博文http://www.cnblogs.com/noah0532/p/8453959.html
对照上面给出的Eviews软件自动统计的值:
结果完全一致!
6 TB(交易开拓者代码)
(持续编辑中。。。。。。。。。。)
计量经济与时间序列_ACF自相关与PACF偏自相关算法解析(Python,TB(交易开拓者))的更多相关文章
- 计量经济与时间序列_ACF与PACF标准差(均标准误)的计算(含代码)
1 我们对于acf和pacf值计算完毕之后,在需要计算两个数值的标准差. 2 acf和pacf的标准差计算略有不同.acf的标准差是一个移动过程,而pacf是一个相对固定过程. 3 我们继 ...
- 计量经济与时间序列_关于Box-Jenkins的ARMA模型的经济学意义(重要思路)
1 很多人已经了解到AR(1)这种最简单的时间序列模型,ARMA模型包括AR模型和MA模型两个部分,这里要详细介绍Box-Jenkins模型的观念(有些资料中把ARMA模型叫做Box-Jenkins模 ...
- 计量经济与时间序列_自协方差(AutoCovariance)算法解析(Python)
1 样本的自协方差函数的通式如下: 2 其实,后面要计算的自相关函数也可以用自协方差来表示: # @author: "Thomas.Shih" # @date: 2018/3/5 ...
- 计量经济与时间序列_滞后算子和超前算子L的定义
1. 为了使计算简单,引入滞后算子的概念: 2. 定义LYt = Yt-1 , L2Yt = Yt-2,... , LsYt = Yt-s. 3. 也就是把每一期具体滞后哪一期的k提到L的 ...
- 计量经济与时间序列_ADF单位根检验步骤
1 ADF检验也叫扩展的迪克富勒检验,主要作用是检测序列的平稳性,也是最常用检测序列平稳性的检验方法. 2 何为:平稳性?单位根?(略),见这部分随便的其他内容有讲解.是建模对数据的先决条件. 3 A ...
- 第二章平稳时间序列模型——ACF和PACF和样本ACF/PACF
自相关函数/自相关曲线ACF AR(1)模型的ACF: 模型为: 当其满足平稳的必要条件|a1|<1时(所以说,自相关系数是在平稳条件下求得的): y(t)和y(t-s)的 ...
- ARIMA模型——本质上是error和t-?时刻数据差分的线性模型!!!如果数据序列是非平稳的,并存在一定的增长或下降趋势,则需要对数据进行差分处理!ARIMA(p,d,q)称为差分自回归移动平均模型,AR是自回归, p为自回归项; MA为移动平均,q为移动平均项数,d为时间序列成为平稳时所做的差分次数
https://www.cnblogs.com/bradleon/p/6827109.html 文章里写得非常好,需详细看.尤其是arima的举例! 可以看到:ARIMA本质上是error和t-?时刻 ...
- 【R语言学习】时间序列
时序分析会用到的函数 函数 程序包 用途 ts() stats 生成时序对象 plot() graphics 画出时间序列的折线图 start() stats 返回时间序列的开始时间 end() st ...
- 时间序列算法理论及python实现(1-算法理论部分)
如果你在寻找时间序列是什么?如何实现时间序列?那么请看这篇博客,将以通俗易懂的语言,全面的阐述时间序列及其python实现. 就餐饮企业而言,经常会碰到如下问题. 由于餐饮行业是胜场和销售同时进行的, ...
随机推荐
- Day 15:缓冲输入输出常用方法和小练习
以拷贝图片为例子,演示异常处理的代码: 拷贝一张图片 import java.io.File;import java.io.FileInputStream;import java.io.FileOut ...
- CentOS下的安装命令 安装Nginx 更新yum源 kali系统当中的软件管理命令(第五天)
Linux下软件的安装:方式:yum/rpm/源码安装YUM安装(帮助管理员解决依赖关系):yum search mysqld 在源中搜索软件包yum install mysql-connector- ...
- sping--事务
事务的四大特性(ACID): 原子性(Atomicity) 一致性(Consistency) 隔离性(Isolation) 持久性(Durability) 事务属性: 1. propagation : ...
- 抗干扰性极强非接触式读卡13.56mhz芯片:SI522
由于智能门锁产品不断地火爆,市场上的不断出现破解的方法.对此中科微联合深圳市动能世纪科技有限公司不断满足市场需求,推出一款抗干扰性极强的13.56mhz芯片. 该芯片出了抗干扰性强以外还直接PIN2P ...
- POJ-3262 贪心的一个小技巧
Protecting the Flowers Time Limit: 2000MS Memory Limit: 65536K Total Submissions: 3204 Accepted: ...
- 「黑科技」智能消毒防疫机器人 技术方案介绍-disinfection robot
消毒机器人 小新防疫消杀机器人 - 自主导航全方位360°臭氧杀菌消毒机器人,采用臭氧无阻碍.无死角.遍布整个空间除菌:强力涡轮风机,30㎡室内空气循环6次/h,10分钟速效杀菌.除异味.自动转化为氧 ...
- js 循环与判断语句的几个练习
<script type="text/javascript"> /*1.X3 * 6528 = 3X * 8256 X为一个数字 填入一个数字 使等式成立*/ for ...
- [Qt5] QSlider设置步长
这是一个小问题,就是QSlider是一个滑动条控件,既然是个滑动条控件,就会想要用鼠标滚轮或者鼠标去移动它来实现某些功能,但是呢,我能说这个控件的一个属性函数设置也是比较奇怪的,它设置步长的函数有 s ...
- 14. react 基础 redux 的编写 TodoList 功能
1. 安装 redux 监听工具 ( 需要翻墙 ) 打开 谷歌商店 搜索 redux devtool 安装第一个即可 2. 安装 redux yarn add redux 3. 创建 一个 store ...
- Exchange 2016 OWA更改css样式
css文件目录:E:\Exchange 2016\FrontEnd\HttpProxy\owa\auth\15.1.1713\themes\resources\logon.css ##更改左侧页面颜色 ...