开发者说 | 云+AI赋能心电医疗领域的应用
以“医工汇聚 智竞心电”为主题的首届中国心电智能大赛自2019年1月1日启动全球招募起,共吸引总计545支来自世界各地的医工结合团队,308支团队近780名选手通过初赛资格审查,经过初赛、复赛、决赛近8个月的激烈角逐,越光医疗通过其算法成绩及答辩结果斩获大赛总决赛一等奖,同时开启了企业自身从传统心电分析算法到人工智能和机器学习新一代算法的战略转型。
此文应首届“中国心电智能大师赛”举办方京东云与AI和清华数据院的邀请,作为大赛的获奖单位代表,以及越光医疗CTO,分享和探讨越光医疗在心电智能诊断领域的理解,应用与实践成果。
一、行业背景
自从Holter(24小时连续动态心电记录)发明以来半个多世纪,随着半导体技术的不断发展,心电记录存储时长已从最初24小时做到14天,设备也从收音机体积降到贴附可穿戴式。大量心电数据的便宜获取使得心电自动分析算法逐渐成为Ambulatory ECG的核心技术门槛。自上世纪80年代开始,美国麻省理工学院和哈佛医学院,政府机构及多家心电企业专家们探索动态心电诊断算法行业标准,直到90年代末形成AAMI 标准被美国FDA和CE采纳为动态心电产品认证要求,极大推动了以欧美为主导的Holter标准化和市场化。
长期以来,我国Holter以进口Holter产品和技术为主,直到2014年10月国家药监局正式颁布了与全球统一的行业YY标准,提供了国产产品与进口产品一致性评价的客观路径,将对国产心电诊断技术产品的创新和发展产生深远影响。
越光医疗自2016年获得新标准下药监局批准的长时程可穿戴式动态心电记录仪,陆续推出了个人心律监测和社区心律患教机等专利创新产品。利用医疗心电传感技术和独有超低功耗技术实现了无需充电的连续不断(最长30天)或高频次(2万次)心电采集,性能和功能达到或超越美国行业同类产品。极大降低医生操作门槛,提升患者依从性,并且在全国范围内200多家医疗机构得到广泛和稳定的临床使用。但与此同时,也带来海量心电原始数据,医疗机构对心电智能处理的时效性和准确性的要求与日俱增。
二、挑战与机遇并存
虽然传统心电图机发明已超过100年历史,但临床心律失常的诊断仍依赖动态心电或Holter。中国有近3亿心血管疾病人群。60岁以上超过2亿。常见心律失常如房颤带来5倍以上脑卒中风险,也是造成20%以上脑梗的主要原因。除脑梗、猝死等风险,心律失常也将严重降低患者生活质量,治疗或长期管理不善甚至导致结构型心脏病或心衰等不可逆慢病。
据统计,我国每年进行2.5亿次10秒常规心电图和3500万份动态心电图检查,而心电图医师约有3万名。临床出具1份动态心电报告需要基于15-30分钟的数据清理。如果每位医生每日处理超过10份动态心电报告和100份常规心电图则会带来巨大工作负担。因此无论临床诊断,或健康预防,心电检查服务都需要供给侧改变,这正是我们对人工智能的应用期望之一。
美国过去10年间,由于其医疗保险特有制度,形成了第三方独立诊断服务中心,为全国范围内临床医生提供心电处理服务。也由此成就了不少成功企业,例如iRhythm和CardioNet,日均服务上万人次,市值共计40亿美元(约人民币280亿)。
因此,对于如中国、印度等人口众多,医疗资源地域差异大、相对缺乏的国家或地区来说,需求大,挑战大,但创新和市场的想象空间更大。
三、AI在心电诊断中的应用
吴恩达领导的斯坦福大学团队在今年的Nature Medicine发表了深度神经网络学习(DNN算法)在心律失常自动诊断的应用结果:通过91232份单导联心电记录(平均10.6天)对比算法和普通医生,发现前者(ROC达0.97)的平均阳性预测率和平均敏感度均超过后者。
越光认为AI在医疗领域的应用有三种方向:
(1)比医生做得更好的AI,因为医生肉眼有限;
(2)比医生做得更快、可以辅助医生提高工作效率的AI;
(3)可以通过大量学习资深医生或专家经验,帮助普通医生或基层医生达到工作要求的AI。
吴恩达团队该项研究也验证了AI在(2)和(3)方面的可行性和共性,即监督化学习和海量临床数据。
四、越光医疗在心电智能大赛中的突破
京东云与AI和清华数据院提供了本次大赛计算基础设施和计算能力,清华大学医学院和清华长庚医院等组织设计了比赛所用常规心电图数据库,共计20000多条,包括正常心电图,八种异常心电图(心房颤动、一度房室传导阻滞、右束支阻滞、左前分支阻滞、室性早搏、房性早搏、早复极图形改变和T波改变),以及“其他心电图”。“其他心电图”较广泛地覆盖了以上9类无法准确描述的心电图数据。
越光医疗参赛算法基于ResNet并进行了如下创新:
(1)结合深度学习与传统心电处理及特征工程的特点实现有效平衡,比如通过希尔伯特变换增加心电信息,对信号降采样以提高效率并避免过拟合,提取QRS位置,RR,RR变化率,QRS宽度,ST段高度,电轴方向等诸多传统特征,对传统特征进行直方图,求最高、最低、平均、方差等方式进行变换,并进行Z Normalization(归一化),对于频繁出现的异常采用Global Pooling,对于偶然出现的异常采用Max Pooling。
(2)使用单一模型预测互斥与共存进行分类
定义损失函数的两部分及其主要任务,并根据训练集数据标签进行频率加权:
- Multi-class softmax cross entropy 区分:正常,待确认异常,和未知异常
- Multi-label binary cross entropy 识别:8种待确认异常
(3)根据心电数据特点进行预处理和扩张
在每个Batch中,通过数据随机截取至最短长度作为一种数据平移的数据增强,并根据预处理结果保留有效信息的片段。
(4)实现更强的可解释性
考虑到实际临床工作中医生可能对“黑箱”式诊断算法存在顾虑,越光医疗引入Class Activation Mapping技术可视化神经网络学习的关键过程,做到既能打破“黑箱”又能获取医生反馈从而进一步学习,该策略获得总决赛评委的一致认可和好评。
(5)结合多种防止过拟合的方法避免过度拟合
通过多任务学习共享权重,如各类异常共享ResNet提取的特征,Global Pooling,对模型采用L2正规化项,提前终止,使用滤波降低噪音,不影响诊断的前提下,降低采样率,及Bagging等技术。
(6)保证算法的可拓展性
实现通过对单一模型的简单修改即可完成对更多互斥或共存的异常分类。
越光参赛算法一路过关斩将,得到了F1=0.879的总决赛高分以及最高答辩评分,获得本次大赛的一等奖的同时,也被2019年国际医学图像计算和计算机辅助领域的顶级综合性学术会议(MICCAI)论文收录。越光通过实践验证了以上创新点的正确性。
尽管如此,大赛与越光实际临床业务还存在不少方面的差异。比如:
(1)心电数据类型与采集时间。大赛提供数据为10秒的12导联心电图片段。越光业务数据为连续动态心电图(最长30天)的单导联心电图,或30秒的单导联心电图片段。虽然10秒12导联常规心电图机在临床和体检已广泛应用,但对心律失常的诊断仍是以最少24小时的动态心电为主,而且记录时间越长、患者佩戴依从性越好,捕捉心律失常的能力就越高,已经形成全球临床专家共识和指南。
(2)数据规模。大赛共20000多条数据,每条数据几百KB量级,总量几百M。而越光业务数据每条数倍于常规心电图,多数单条数据超过100M,数据总量达TB级别,累计几十万人次且保持每月不断持续高速增长。
(3)比赛与临床诊断要求。 大赛仅要求结论性判断,使用的F1评分兼顾准确性和敏感度的平衡。而实际临床诊断不仅要求敏感度和准确度高,对于假阳性或假阴性的容忍度也较低。除了结论性判断,更要求对于心拍检出和心率检出,甚至各类心律失常事件负荷度的统计,才能支持临床诊断服务的要求。
(4)响应时效要求。大赛是针对离线数据进行调优,而实际临床诊断需要实时或较短(24小时内)的准确结果才能保证患者就诊流畅。
五、越光医疗在现有产品中的应用实施案例
国外临床文献早在2009年就进行过大规模和多中心的单导联与12导联的单盲诊断对比,发现针对房颤和正常心律检测的准确性可以高达96%-99%以上。
越光现有产品通过传统心电分析和心律失常诊断算法,虽然在国家药监局和FDA及CE行业标准要求的数据库(MIT、AHA等DB)评测达到30秒及以上房颤检出率100%,但在真实临床使用中,仍存在需要临床医生审核干预去除假阳性检查的工作环节。因此不断提升算法,降低真实世界的假阳性检出率来不断减少一线医生工作是AI在心电医疗应用的真实需求之一。
为此,越光将此次大赛算法应用到通过越光产品产生的46万人次30秒单导联心电数据库中,与心电医师确认结果进行单盲比对,发现4.5%的噪声或伪差之外,房颤检查的准确性可以达到94.7%。越光与中国和美国心律临床专家一道将研究结果提交2020年度的国际心律学会(Heart Rhythm)会议论文。
六、可持续性创新合作
本次大赛给予了像越光医疗这样的医疗器械企业与京东云与AI和清华数据院的可持续性创新合作机会。除了与临床机构或客户端的落地应用,越光认为企业可以在以下方面借力IT基础设施提供方(如京东云与AI):
(1)提供流畅和安全的数据服务:中国有3万家医疗机构和90多万家基层卫生服务中心,遍布全国各地。网络条件地区性差异与海量数据上行下传将是首要需要解决的问题,需要尽可能靠近用户并且覆盖多运营商的节点提供数据接收服务。此外,数据安全性要求和级别也将随着规模的迅速扩大而提上日程。比如,可以选择京东云与AI OSS用户所在地域节点实现接收并存储数据,以达到需求。
(2)提供高速经济的规模化模型训练:实际临床数据总量量级,如果在自有服务器训练需要经由京东云与AI OSS相关数据服务,有耗时长且自有服务器能力不足等缺陷。比如,可直接在京东云上使用GPU云主机进行数据训练,并通过内网快速拉取OSS数据供单机使用的测量,以达到需求。
(3)模型部署与弹性伸缩:临床实际使用中,算法只需对每条数据一次性处理,并且每日使用频次波峰波谷将明显突出,与实验或回测工作形成鲜明不同。因此,可采取直接使用CPU进行处理,并封装至docker镜像内的策略。并通过京东kubernetes集群配合弹性伸缩对用户数据完成及时相应,以达到需求。
在解决了以上问题的基础上,可以和有心律失常社区化管理需求的地区性中心医院建立心律失常分级诊疗医联体模式的多方运营合作,形成样版工程。
七、结束语
首届“中国心电智能大赛”虽然顺利落下帷幕,但大赛在推动中国心电人工智能在临床实践方面提供了可借鉴、能实践的案例,属于推动健康医疗和大数据发展的一次里程碑。
在建立不断壮大的临床数据库持续推动临床和科研创新的过程中,完善可复制性产品和服务方案,既满足医院和患者的实际需求,又实现国家对健康中国的战略性要求。
再次感谢本次大赛的举办单位,清华大学临床医学院、数据科学研究院,北京清华长庚医院,青岛大学附属医院,天津市武清区人民医院,中关村医院,福建省立医院,京津高村科技创新园,京津高村科技创新园,京东云与AI云桌面云平台技术支持。
这是笔者第一次参加基于深度学习应用开发的比赛,为了让更多像笔者一样才入门的朋友能尽快上手,所以记录下来了笔者整个初赛解题思路与实践过程。最后很感谢举办方组织的这个比赛,让参赛选手收获很多实战经验与应用技巧。
越光医疗团队简介
邢文辉
越光医疗联合创始人兼CTO(2014年至今),负责越光动态心电诊断系统研发,组织越光中美心脏专家和技术团队,越光系统在全国和印度范围100+家医院的临床运营使用。复旦大学计算机与信息技术系(2006),NOI全国信息学竞赛铜牌(43名),ACM/ICPC 2006 亚洲分赛区冠军,世界总决赛第26名。过往工作经历:Google、Topcoder
袁彬航
Rice University PhD(2019 expected),第17届生物学竞赛全国银牌(31名),复旦大学计算机与信息技术系(2009),VLDB 2019 Honourable Mention Award。 过往工作经历:MSRA、TABLEAU
公司简介
上海越光成立于2014年9月。作为国产企业,致力于自主研发生产达到和超过国际水平的新型心电诊断和数据管理技术和产品,为心血管医生提供更经济高效的心律失常诊断管理手段,通过技术创新、产品创新和服务创新,实现目标客户临床和科研诉求。“欲善其事,先利其器”,越光将结合智能化处理的优势,在保证医疗精准质量的前提下,降低一线医疗人员和基层医疗机构的资源负担。同时将互联网、物联网和云计算等通用技术应用到房颤及心律失常诊断管理中,借鉴医联体模式来减少甚至消除地域带来就诊“不平等”或“看病难”等问题。
公司官网:http://www.prudencemed.com/
点击【阅读】可查看更多大赛赛程及成果
开发者说 | 云+AI赋能心电医疗领域的应用的更多相关文章
- 网易云易盾CTO朱浩齐:我们是如何用AI赋能内容安全?
本文由 网易云发布. 5月19日,LiveVideoStack携手网易云易盾,共同打造了“娱乐多媒体开发应用实践”专题,帮助开发者和泛娱乐平台运营人员,提升技术能力,突破难点,拓展思路与视野. 在专 ...
- 腾讯云AI应用产品总监王磊:AI 在传统产业的最佳实践
欢迎大家前往腾讯云+社区,获取更多腾讯海量技术实践干货哦~ 背景:5月23-24日,以"焕启"为主题的腾讯"云+未来"峰会在广州召开,广东省各级政府机构领导.海 ...
- 腾讯云AI平台张文杰:构建一站式机器学习服务平台
欢迎大家前往腾讯云+社区,获取更多腾讯海量技术实践干货哦~ 5月24日,以"无界数据无限智能"为主题的腾讯"云+未来"峰会AI大数据分论坛在广州拉开帷幕.此次分 ...
- 李飞飞确认将离职!谷歌云AI总帅换人,卡耐基·梅隆老教授接棒
https://mp.weixin.qq.com/s/i1uwZALu1BcOq0jAMvPdBw 看点:李飞飞正式回归斯坦福,新任谷歌云AI总帅还是个教授,不过这次是全职. 智东西9月11日凌晨消息 ...
- 七牛云杜江华:让云 + AI 成为企业服务的标配
12 月 5-6 日,2018 创业邦 100 未来领袖峰会暨创业邦年会(以下简称「创业邦 100 未来领袖峰会」)在北京国家会议中心举行.12 月 5 日下午,七牛云执行副总裁杜江华在企业服务论坛上 ...
- 华为云 AI 实战营计划,带你迈上 AI 之路
当今,AI的开发人才需求呈现极大的供需不平衡.所有开发者都关心,要如何从一名开发者晋升为AI开发者?AI开发能力,是主要的进入障碍.不用慌,华为云推出了 <华为云ModelArts-Lab AI ...
- 华为鲁勇:5G+云+AI三大核心引擎将驱动广州数字经济发展
[摘要] 华为云将携手广州政企,全面释放 5G+云+AI新动能,推动广州步入高质量发展新阶段. [中国,广州] 广州是一座多样化的城市,在历史上被誉为千年的商都,现在,广州也在持续的开放.融合.与时俱 ...
- 军医王-moTestin云测试看好移动医疗行业
看医生汪谟军:Testin云測在移动医疗产业大有可为 2014/10/21 · Testin · 开发人员訪谈 日常生活可能常常碰到这种情况:突然遇上头疼脑热.小病小痛,去医院又不方便:非常想了解家人 ...
- 【活动公告】Hackathon —— 腾讯云AI API接入迷你赛
一. 活动简介 编程马拉松(Hackathon)是将热爱软硬件开发的人聚集起来所举办的一项比赛,本次活动由腾讯云AI联合云+社区发起,希望让广大开发者体验到腾讯云AI的魅力.比赛过程中,参赛者可以尽情 ...
随机推荐
- c++子类父类关系(翁恺c++公开课[15-16]学习笔记)
关于类的继承有三种:public继承.private继承.protected继承 首先说明,关于类的成员变量.函数的权限有三种(public.private.protected) 我们通常会让所有的成 ...
- day21-Python运维开发基础(单个字符匹配 / 多字符匹配)
1. 正则表达式(单个字符匹配) # ### 正则表达式 => 单个字符匹配 import re """ lst = re.findall(正则表达式,字符串) & ...
- [POI 2014]PTA-Little Bird
Description 题库连接 给你 \(n\) 棵树,第 \(i\) 棵树的高度为 \(d_i\).有一只鸟从 1 号树出发,每次飞跃不能超过 \(k\) 的距离.若飞到下一棵树的高度大于等于这一 ...
- 设计模式课程 设计模式精讲 15-2 桥接模式Coding
1 代码演练 1.1 代码演练1 1.2 代码演练2 1 代码演练 1.1 代码演练1 需求: 打印出从银行获取的账号类 优点: a 假如我只用用一个银行接口 去获取账号的内容,银行实现类要有定期 ...
- docker原理学习-环境搭建
1. mac下用VMware虚拟机安装ubunt16.04 2. ubuntu安装并启动ssh服务 3. 用mac终端ssh到虚拟机中 ssh didiyu@ip 输入登陆密码
- 清除编译缓存DerivedDate
当多次重构工程造成代码没有错误却编译失败时,可以尝试删除DerivedData目录.DerivedData目录是Xcode的编译缓存,路径是~/Library/Developer/Xcode/Deri ...
- 集合set() 二
集合分类 可变集合set() 可以添加和删除元素,非可哈希的(值set之后的整体),不能用作字典的键,也不能做其它集合的元素. set() 之后变为不可哈希的 不可变集合 frozenset( ...
- MySQL操作之DCL
目录 SQL语句的分类 DCL语句 SQL语句的分类 DDL(Data Definition Languages)语句:数据定义语言.这些语句定义了不同的数据段. 数据库.表.列.索引等数据库对象的定 ...
- 浅谈Windows入侵检查
1 准备工作 检查人员应该可以物理接触可疑的系统.因为黑客可能侦测到你可以在检查系统,例如网络监听,所以物理接触会比远程控制更好. 为了当做法庭证据可能需要将硬盘做实体备份.如果需要,断开所有与可 ...
- Acwing779 最长公共字符串后缀
题目大意:给定n个字符串,让你找到他们的最长公共字符串后缀是什么,可能为空. 分析:题目数据范围比较小,可以O(n*n)暴力匹配,即可解决这道问题.之所以写这道题的题解还是因为写字符串的题还不够多啊, ...