Python分析离散心率信号(中)
一些理论和背景
心率信号不仅包含有关心脏的信息,还包含有关呼吸,短期血压调节,体温调节和荷尔蒙血压调节(长期)的信息。也(尽管不总是始终如一)与精神努力相关联,这并不奇怪,因为大脑是一个非常饥饿的器官,因此消耗了总葡萄糖的25%和氧气消耗的20%。如果活动增加,心脏需要更加努力地工作以保持其供应。
感兴趣的是这些措施可以被分为时间序列数据连接频域数据。如果熟悉傅立叶变换,则频率部分会很有意义。如果不是,请参阅维基百科页面具有很好的解释,并且对过程也非常直观。基本思想是,要获取随时间重复的信号(例如心率信号),并确定由哪些频率构成该信号。将信号从时域转换到频域。这是特别喜欢的另一种可视化效果,清楚地显示了如何将重复信号近似为随时间重复的不同正弦波之和。
时间序列数据
对于心率信号的时间序列部分,主要关注心跳之间的间隔及其随时间的变化。想要所有R复合物(R1,R2,... Rn)的位置,之间的间隔(RR1,RR2,... RRn,定义为)以及相邻间隔之间的差异(RRdiff-1,…RRdiff-n,定义为)。
可视化:
在科学文献中经常发现的时间序列度量是:
§
BPM,即每分钟的心跳量,在上一部分中进行了计算;
§
IBI(心跳间隔),即心跳之间的平均距离,在前一部分中隐式地将其计算为BPM计算的一部分;
§ SDNN,心跳间隔的标准偏差:
§
SDSD,相邻RR间隔之间的连续差的标准偏差:
§
RMSSD,相邻RR间隔之间的连续差的均方根:
§
pNN50 / pNN20,比例差异大于50ms / 20ms。
IBI,SDNN,SDSD,RMSSD和pNNx(以及频域量度)通常归为“心率变异性”(HRV)量度,因为可提供有关心率随时间变化的信息。
频域数据
在心率信号的频率侧,最常发现的量度称为HF(高频),MF(中频)和LF(低频)频段,这是对创新性命名水平的永恒证明。MF en HF频段通常合并在一起,并被标记为“ HF”。LF和HF大致对应于LF频段的0.04-0.15Hz和HF频段的0.16-0.5Hz。LF频段似乎与短期血压变化有关,HF频段与呼吸频率有关。
通过在RR间隔数据序列上执行快速傅立叶变换来计算频谱。顾名思义,该方法与离散傅立叶变换方法相比是快速的。数据集越大,方法之间的速度差异就越大。
首先对信号进行重新采样,以计算频谱,然后将重新采样的信号转换到频域,然后以给定的间隔积分曲线下的面积,从而计算出HF和LF的量度。
时域度量–入门
查看上述时间序列度量,需要一些成分才能轻松计算所有这些度量:
§
所有R峰的位置列表;
§
所有后续RR对之间的间隔的列表(RR1,RR2,.. RR-n);
§
RR对之间所有后续间隔之间的差异的列表(RRdiff1,…RRdiffn);
§
RR对之间所有后续差之间的平方差的列表。
已经从第一部分的detect_peaks()函数获得了所有R峰位置的列表,该列表包含在dict ['peaklist']中。还有来自calc_RR()函数的RR对差异列表,位于dict ['RR_list']中。大!无需编写其代码,已经完成了50%的编写。
为了获得最后两个成分,使用dict ['RR_list']并计算差值和相邻值之间的平方差:
RR_diff = []
RR_sqdiff = []
RR_list = measures['RR_list']
cnt = 1 #Use counter to iterate over RR_list
while (cnt < (len(RR_list)-1)): #Keep going as long as there are R-R intervals
RR_diff.append(abs(RR_list[cnt] - RR_list[cnt+1])) #Calculate
absolute difference between successive R-R interval
RR_sqdiff.append(math.pow(RR_list[cnt] - RR_list[cnt+1], 2)) #Calculate squared difference
cnt += 1
print(RR_diff, RR_sqdiff)
复制
计算时域度
量值现在有了所有成分,可以轻松计算所有度量值:
ibi = np.mean(RR_list) #Take the mean of RR_list to get the mean Inter Beat
Interval
print("IBI:", ibi)
sdnn = np.std(RR_list) #Take standard deviation of all R-R intervals
print("SDNN:", sdnn)
sdsd = np.std(RR_diff) #Take standard deviation of the differences between all
subsequent R-R intervals
print("SDSD:", sdsd)
rmssd = np.sqrt(np.mean(RR_sqdiff)) #Take root of the mean of the list of squared differences
print("RMSSD:", rmssd)
nn20 = [x for x in RR_diff if (x>20)] #First create a list of all values over 20, 50
nn50 = [x for x in RR_diff if (x>50)]
pnn20 = float(len(NN20)) / float(len(RR_diff)) #Calculate the proportion of NN20, NN50 intervals to all
intervals
pnn50 = float(len(NN50)) / float(len(RR_diff)) #Note the use of float(), because we don't want Python to
think we want an int() and round the proportion to 0 or 1
print("pNN20,
pNN50:", pnn20, pnn50)
复制
时间序列度量就是这样。让将包装在可调用函数中。扩展calc_RR()函数以计算额外成分,并将其附加到字典对象中,还将calc_bpm()与其时间序列测量值合并到一个新函数calc_ts_measures()中,并将附加到字典中:
def calc_RR(dataset, fs):
peaklist = measures['peaklist']
RR_list = []
cnt = 0
while (cnt < (len(peaklist)-1)):
RR_interval = (peaklist[cnt+1] - peaklist[cnt])
ms_dist = ((RR_interval / fs) * 1000.0)
RR_list.append(ms_dist)
cnt += 1
RR_diff = []
RR_sqdiff = []
cnt = 0
while (cnt < (len(RR_list)-1)):
RR_diff.append(abs(RR_list[cnt] - RR_list[cnt+1]))
RR_sqdiff.append(math.pow(RR_list[cnt] - RR_list[cnt+1], 2))
cnt += 1
measures['RR_list'] = RR_list
measures['RR_diff'] = RR_diff
measures['RR_sqdiff'] = RR_sqdiff
def calc_ts_measures():
RR_list = measures['RR_list']
RR_diff = measures['RR_diff']
RR_sqdiff = measures['RR_sqdiff']
measures['bpm'] = 60000 / np.mean(RR_list)
measures['ibi'] = np.mean(RR_list)
measures['sdnn'] = np.std(RR_list)
measures['sdsd'] = np.std(RR_diff)
measures['rmssd'] = np.sqrt(np.mean(RR_sqdiff))
NN20 = [x for x in RR_diff if (x>20)]
NN50 = [x for x in RR_diff if (x>50)]
measures['nn20'] = NN20
measures['nn50'] = NN50
measures['pnn20'] = float(len(NN20)) / float(len(RR_diff))
measures['pnn50'] = float(len(NN50)) / float(len(RR_diff))
#Don't forget to
update our process() wrapper to include the new function
def process(dataset, hrw, fs):
rolmean(dataset, hrw, fs)
detect_peaks(dataset)
calc_RR(dataset, fs)
calc_ts_measures()
复制
这样称呼:
import heartbeat as hb #Assuming we
named the file 'heartbeat.py'
dataset = hb.get_data('data.csv')
hb.process(dataset, 0.75, 100)
#The module dict
now contains all the variables computed over our signal:
hb.measures['bpm']
hb.measures['ibi']
hb.measures['sdnn']
#etcetera
#Remember that
you can get a list of all dictionary entries with "keys()":
print(hb.measures.keys())
复制
在计算机上,分析信号并计算单个线程中的所有度量大约需要25毫秒。
频域度量–入门频域度量
计算比较棘手。主要原因是不想要将心率信号转换到频域(这样做只会返回等于BPM / 60(以Hz表示的心跳)的强频率)。相反,希望将RR间隔转换到频域。很难理解?这样思考:随着身体需求的变化,心率随着时间的变化而变化。这种变化表现为心跳之间的距离随时间变化(之前计算的RR间隔)。RR峰之间的距离随其自身频率随时间变化。为了可视化,绘制之前计算的RR间隔:
从图中可以清楚地看到,RR间隔不会随心跳而剧烈变化,而是随时间呈正弦波状变化(更准确地说是不同正弦波的组合)。想找到组成该模式的频率。
但是,任何傅立叶变换方法都依赖于均匀间隔的数据,并且RR间隔在时间上肯定不是均匀间隔的。这是因为间隔的时间位置取决于长度,每个间隔都不同。希望这是有道理的。
要找到措施,需要:
§
创建一个带有RR间隔的均匀间隔的时间线;
§
内插信号,既可以创建均匀间隔的时间序列,又可以提高分辨率;
§
在某些研究中,此插值步骤也称为重新采样。
§
将信号转换到频域;
§
积分频谱的LF和HF部分下方的面积。
计算频域量度
首先,为RR间隔创建均匀间隔的时间线。为此,获取所有R峰的样本位置,这些样本位置位于在第1部分中计算的列表dict ['peaklist']中。然后,将y值分配给列表dict ['中的这些样本位置RR_list'],其中包含所有RR间隔的持续时间。最后,对信号进行插值。
from scipy.interpolate import interp1d #Import the
interpolate function from SciPy
peaklist = measures['peaklist'] #First retrieve the lists we need
RR_list = measures['RR_list']
RR_x = peaklist[1:] #Remove the first entry, because first interval is
assigned to the second beat.
RR_y = RR_list #Y-values are equal to interval lengths
RR_x_new = np.linspace(RR_x[0],RR_x[-1],RR_x[-1]) #Create evenly spaced timeline starting at the second
peak, its endpoint and length equal to position of last peak
f = interp1d(RR_x, RR_y, kind='cubic') #Interpolate the signal with cubic spline interpolation
复制
请注意,时间序列不是从第一个峰值开始,而是从第二个R峰值的采样位置开始。因为使用间隔,所以第一个间隔在第二个峰值可用。
现在,可以使用创建的函数f()查找信号范围内任何x位置的y值:
print f(250)
#Returns
997.619845418, the Y value at x=250
复制
同样,可以将整个时间序列RR_x_new传递给该函数并进行绘制:
plt.title("Original and
Interpolated Signal")
plt.plot(RR_x, RR_y, label="Original", color='blue')
plt.plot(RR_x_new, f(RR_x_new), label="Interpolated", color='red')
plt.legend()
plt.show()
复制
现在,要查找组成插值信号的频率,请使用numpy的快速傅立叶变换np.fft.fft()方法,计算采样间隔,将采样仓转换为Hz并作图:
#Set variables
n = len(dataset.hart) #Length of the
signal
frq = np.fft.fftfreq(len(dataset.hart), d=((1/fs))) #divide the bins
into frequency categories
frq = frq[range(n/2)] #Get single side of the frequency range
#Do FFT
Y = np.fft.fft(f(RR_x_new))/n #Calculate FFT
Y = Y[range(n/2)] #Return one side of the FFT
#Plot
plt.title("Frequency
Spectrum of Heart Rate Variability")
plt.xlim(0,0.6) #Limit X axis to frequencies of interest (0-0.6Hz for
visibility, we are interested in 0.04-0.5)
plt.ylim(0, 50) #Limit Y axis for
visibility
plt.plot(frq, abs(Y)) #Plot it
plt.xlabel("Frequencies
in Hz")
plt.show()
复制
可以清楚地看到信号中的LF和HF频率峰值。
剩下的最后一件事是对LF(0.04 – 0.15Hz)和HF(0.16 – 0.5Hz)频带下的曲线下面积进行积分。需要找到与感兴趣的频率范围相对应的数据点。在FFT期间,计算了单侧频率范围frq,因此可以在其中搜索所需的数据点位置。
lf = np.trapz(abs(Y[(frq>=0.04) & (frq<=0.15)])) #Slice frequency spectrum where x is between 0.04 and
0.15Hz (LF), and use NumPy's trapezoidal integration function to find the area
print("LF:", lf)
hf = np.trapz(abs(Y[(frq>=0.16) & (frq<=0.5)])) #Do the same for 0.16-0.5Hz (HF)
print("HF:", hf)
复制
返回:
LF: 38.8900414093
HF: 47.8933830871
复制
这些是感兴趣频谱处频谱下的区域。请记住,从理论上讲,HF与呼吸有关,而LF与短期血压调节有关。这些措施也与增加精神活动有关。
全面包装
已经走了很长一段路,现在可以从心率信号中提取许多有意义的指标。但是,如果输入其心率数据,则该模块很可能会失败,因为可能比理想数据更嘈杂,或者可能包含伪像。将处理信号过滤,错误检测和离群值剔除。
Python分析离散心率信号(中)的更多相关文章
- Python分析离散心率信号(下)
Python分析离散心率信号(下) 如何使用动态阈值,信号过滤和离群值检测来改善峰值检测. 一些理论和背景 到目前为止,一直在研究如何分析心率信号并从中提取最广泛使用的时域和频域度量.但是,使用的信号 ...
- Python分析离散心率信号(上)
Python分析离散心率信号(上) 一些理论和背景 心率包含许多有关信息.如果拥有心率传感器和一些数据,那么当然可以购买分析包或尝试一些可用的开源产品,但是并非所有产品都可以满足需求.也是这种情况.那 ...
- Python标准库07 信号 (signal包,部分os包)
作者:Vamei 出处:http://www.cnblogs.com/vamei 欢迎转载,也请保留这段声明.谢谢! 在了解了Linux的信号基础之后,Python标准库中的signal包就很容易学习 ...
- python笔记之提取网页中的超链接
python笔记之提取网页中的超链接 对于提取网页中的超链接,先把网页内容读取出来,然后用beautifulsoup来解析是比较方便的.但是我发现一个问题,如果直接提取a标签的href,就会包含jav ...
- python多线程在渗透测试中的应用
难易程度:★★★ 阅读点:python;web安全; 文章作者:xiaoye 文章来源:i春秋 关键字:网络渗透技术 前言 python是门简单易学的语言,强大的第三方库让我们在编程中事半功倍,今天, ...
- 【转】Python之向日志输出中添加上下文信息
[转]Python之向日志输出中添加上下文信息 除了传递给日志记录函数的参数(如msg)外,有时候我们还想在日志输出中包含一些额外的上下文信息.比如,在一个网络应用中,可能希望在日志中记录客户端的特定 ...
- 用Python分析国庆旅游景点,告诉你哪些地方好玩、便宜、人又少
注:本人参考“裸睡的猪”公众号同名文章,学习使用. 一.目标 使用Python分析出国庆哪些旅游景点:好玩.便宜.人还少的地方,不然拍照都要抢着拍! 二.获取数据 爬取出行网站的旅游景点售票数据,反映 ...
- python接口自动化:pycharm中import yaml报错问题解决
一:问题 python3在cmd命令行中已经安装了yaml,且import yaml是成功的,但是pcharm中import yaml还是红色报错 二:分析原因 pycharm和python环境需要分 ...
- python 分析慢查询日志生成报告
python分析Mysql慢查询.通过Python调用开源分析工具pt-query-digest生成json结果,Python脚本解析json生成html报告. #!/usr/bin/env pyth ...
随机推荐
- hdu1287 破译密码
题意: 破译密码 Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others) Total Subm ...
- 从苏宁电器到卡巴斯基第15篇:我在苏宁电器当营业员 VII
我们苹果的倒班制度 当年我在苏宁的时候,实行的是单休制度,而且只能选择在周一到周五其中的某一天,因为周六周日顾客比较多,是不允许休息的.尽管是单休,但并不表示我们在上班的时候每天都要完完整整地上八小时 ...
- hdu4291 暴力循环节+矩阵快速幂
题意: 给你一个关系式,x[n] = 3*x[n-1] + x[n-2],求x(x(x[n]))%1000000007. 思路: 做这个题目要明确一点,就是对于取余操作大多数时 ...
- 缓冲区溢出之栈溢出利用(手动编写无 payload 的 Exploit)
0x01 介绍 Exploit 的英文意思就是利用,它在黑客眼里就是漏洞利用.有漏洞不一定就有Exploit(利用),有Exploit就肯定有漏洞.编写缓冲区溢出的Exploit分为3个方面:漏洞溢出 ...
- Win64 驱动内核编程-20.UnHook SSDT
UNHOOK SSDT 要恢复 SSDT,首先要获得 SSDT 各个函数的原始地址,而 SSDT 各个函数的原始地址,自然是存储在内核文件里的.于是,有了以下思路: 1.获得内核里 KiService ...
- SSRF_FastCGI
SSRF_FastCGI 目录 SSRF_FastCGI FastCGI协议 SSRF ssrf + fastcgi 参考 FastCGI协议 简介 Fast CGI源自旧版本的CGI 路由/结构图 ...
- WPF之自定义委托命令
常用命令 WPF的命令实际上就是实现了ICommand接口的类,平时使用最多的是RoutedCommand类,还可以使用自定义命令. RoutedCommand只负责跑腿,并不对命名目标做任何操作,实 ...
- PowerDesigner安装教程
准备安装 准备好可执行文件.汉化.破解文件 将可执行文件以管理员身份运行: 向导初始化 next 选香港.点同意: 可以默认,如果说这个路径不能用下次就换一个 除了Eclipse全选 全选 好像有个空 ...
- vue 2.9.6升级到最新版本
在看文档https://cli.vuejs.org/zh/guide/installation.html中,按步骤升级vue: 于是就先通过 npm uninstall vue-cli -g卸载vue ...
- 一文读懂 SuperEdge 云边隧道
作者 李腾飞,腾讯容器技术研发工程师,腾讯云TKE后台研发,SuperEdge核心开发成员. 杜杨浩,腾讯云高级工程师,热衷于开源.容器和Kubernetes.目前主要从事镜像仓库,Kubernete ...