学生开发者勇担青年使命,用AI守护少数人的“视界”
本文分享自华为云社区《【先锋开发者云上说】学生开发者勇担青年使命,用AI守护少数人的“视界”》,作者:华为云社区精选 。
青年动人之处,在于他们的勇气,和非凡的创造探索精神。
有这样一群00后学生开发者、,他们用AI探索医疗领域的技术创新,为少数群体守护光明。
在刚刚结束的2023华为开发者大赛全球总决赛上,他们一路过关斩将,凭借AI眼部医疗辅助诊断系统获得了中国赛区学生赛道全国一等奖的铜奖。
如果早一点,人们眼里光就多一点
孙洋今年大三,是电子科技大学成都学院人工智能专业的一名学生,他很喜欢这个伴随着AI技术浪潮而起的新兴专业,常常泡在学校实验室里研究神经网络、深度学习、图像识别、人机交互等各种技术。直到一次比赛,孙洋无意中接触到一个医疗辅助诊断系统的项目,顿时兴趣高涨。
“我就想基于最初的原型,结合AI技术把项目进一步扩大。”在这个过程中,孙洋找来了几个志同道合的小伙伴,正式组建了“融创眼援”团队,即用融合创新的技术“援助”那些患有眼部疾病的群体。
孙洋选择做这个项目的初衷,既是为了研究图像识别技术在医疗领域的应用,更是考虑到宏观的社会现状和市场环境下,眼健康行业中普遍存在缺乏早筛且资源分布不均的问题,“如果能早一点,那么人们眼里的光就多一点”,他们渴望用学到的技术去做一些实事,为这个世界带来一点改变。
接入上云,项目加速
团队成员先是去学校的合作医院走访调研,从与眼科医生的访谈中抽象出项目的数据模型逻辑,随着调研的深入,他们发现做医疗项目最棘手的就是数据隐私安全。由于医疗数据的特殊性,患者的病史数据难以在各个医疗机构共享,不可避免形成“数据孤岛”的局面,从而导致医疗资源的浪费,也让医生难以全面了解患者情况,难以做出正确的诊疗决策。
介于医疗数据的特殊性,孙洋和团队选择采用联邦学习的训练框架,将敏感的眼部影像数据保存在本地,把数据训练出来的模型参数上传到云端,来保证模型的效果。
但对于学生开发者来说,上云面临着巨大的成本压力。此时,孙洋在学校论坛上看到了华为开发者大赛的消息,当即决定带着团队试一试。报名成功后,孙洋很快申领到了一定数额的上云代金券。
他们先是用华为云云耀服务器搭建了一个底座,本地通过SSH连接到云服务器,配置好联邦学习需要的基本网络设置,以及依赖库,将模型参数传到云上的数据库,团队成员都可以直接访问下载,进行新的训练和计算,再将新的模型参数更新到云端,提高模型的准确率。
“最开始我们在做云端系统搭建的时候,完全摸不着头脑。好在华为云官网上的技术文档非常详细,再加上华为云社区其他开发者分享的详细教程,跟着一步步做基本上没问题。之前我们在本地构建数据库管理数据也挺麻烦的,但在云上一键就能完成,省时省力。”孙洋提到,在华为云的支持下,他们基本上实现了零成本的接入上云,从而能更顺利地推进整个项目。
在数据训练方面,最初孙洋也只能用自己的电脑来跑,后来借助华为赠送的昇腾Atlas 200I DK2开发板,得以快速高效地在本地完成模型的训练,然后再将数据传回电脑和云上,既节省了一定的硬件成本,也缩短了他们的研发周期。
从实践中来,创新的多模态融合
在和医生的交流中,孙洋观察到他们在实际诊断中,不仅仅要仔细查看病人的眼底影像,而且要综合病人的的其他病理检查结果,才能得出一定的结论。
孙洋举了个例子,假如一个患者患有糖尿病视网膜病变,血糖的升高会导致他眼球血管里面的渗透压增大,医生要去检查他眼球血管是否有增生或者阻塞。但单从一张眼底彩相只能看到血管的分布,医生还需要查看患者拍摄的 FFA(荧光素眼底血管造影技术)的图像,了解血管的流向,并综合患者的血糖、日常饮食习惯等其他情况,来给出最终的诊断结果。
“于是,我们就做了多模态数据的融合,将眼底图像、FFA图像、OCT图像和检测数据转化成向量,并对不同的数据类型进行权重分配,加入到神经网络里面来实现融合诊断。”
由于获取到的医疗数据有限,孙洋和团队对既有的数据进行增强来提高模型的准确率;并自主研发了基于超参数的改进TransCNN模型,试验结果的准确率高达97.48%,在500例与专业医师诊断结果对比中,差异率也控制在3%~5%之间。
为了让医生能够更高效得使用这套AI辅助系统,他们还创新研发了一体化图像处理技术,包含有血管分割、分类检测、自动标注、表格统计四大功能,满足了医生的绝大多数需求。
从确定产品规划、实现核心算法突破到与相关医院取得意向合作,对标一线完善系统定位与设计,历经一年的攻坚克难,融创眼援开发出了基于多模态的眼部医疗辅助诊断系统。
“现在,医生只需上传患者的影像资料,我们的眼部辅助诊断系统可在8秒内实现自动标注并给出影像诊断意见,随后生成病情报告,在单一病种诊断上对比专业医生,准确率高达97.48% 。”
让源源不断的创意变为现实
团队下一步的方向是将二维眼底图像转化成3D模型,可视化模拟真实的眼球血管走向,再借助传感器来实现手势识别,结合华为云的语音识别服务,开发出更高效的可视化交互诊断系统,这样医生就可以直接在这个3D眼球上进行观察或者手术模拟等。“类似于元宇宙医疗的概念”孙洋补充道。
回顾参赛以来的种种经历,孙洋心有戚戚,“就像打开了新世界的大门,因为之前参加的一些比赛都很看重表面工作,但华为开发者大赛评判作品的首要标准是技术创新,对于热爱技术的我们来说特别友好。而且华为云的很多产品有详细的学习路径和教程,即使和自己专业无关,我们也可以去玩一玩、学一学。”
当接触学习的内容多了,这群学生开发者经常会冒出各种新奇的想法,如孙洋所说,“脑子里就像有一台计算机,想去尝试各种新兴前沿的技术,比如我们现在对脑机接口很感兴趣,在想是不是可以通过它让抑郁症患者重回正常生活……”
开发者,是用代码改变世界的人。他们写下的每一行代码,开发的每一款应用,都有可能成为驱动创新的重要源泉。华为云予力学生开发者追求AI医疗技术创新,帮助他们脚踏实地去实现梦想,让源源不断的创意变为现实。
学生开发者勇担青年使命,用AI守护少数人的“视界”的更多相关文章
- 用AI识别内部人威胁面临的道德规范
用AI识别内部人威胁面临的道德规范 还记得汤姆·克鲁斯的<少数派报告>吗?人工智能可识别昭示未来风险的员工行为.该如何有效且有道德地使用这一数据呢? 为保护公司网络不受恶意软件.数据渗漏和 ...
- 音视频开发者的福音,快速集成AI配音能力
音视频内容创作者对剪辑应用中的AI配音需求与日俱增.它的优点很多,不光可以解决雇佣人力配音的成本以及创作者本身的口音.语言等限制,还可以大幅提升生产效率.比如,短视频的播放时间短的几十秒,长的vlog ...
- 国外AI界牛人主页 及资源链接
感觉 好博客要收集,还是贴在自己空间里难忘!!! 原文链接:http://blog.csdn.net/hitwengqi/article/details/7907366 http://people.c ...
- 全面解析百度大脑发布“AI开发者‘战疫’守护计划”
即日起,百度大脑发布“AI开发者战疫守护计划” 大疫当前,人人有责,携手开发者共同出击抗击疫情 基于百度大脑AI开放平台和飞桨深度学习平台,积极运用算法.算力.软件等“武器”助力抗疫! 谁能参与计 ...
- 百度大脑发布“AI开发者‘战疫’守护计划”,AI支援抗疫再升级
面对新冠肺炎疫情,AI开发者们正在积极运用算法.算力.软件等“武器”助力抗疫.针对开发者们在疫情防控期间的开发与学习需求,2月6日,百度大脑推出“AI开发者‘战疫’守护计划”, 正在进行疫情防控相关应 ...
- 华为有AI,这场转型战有点大
华为有AI,这场转型战有点大 https://mp.weixin.qq.com/s/qnUP5cgbNxXcAT82NQARtA 李根 发自 凹非寺 量子位 报道 | 公众号 QbitAI 华为有AI ...
- AI+教育落地,百度大脑如何让校园更智能?
人工智能作为影响社会底层技术革命逐渐向传统行业渗透,“AI+”已经替代“互联网+”成为创业创新的新引擎,出人意料的是,在AI在教育业的率先落地并且相当火爆. 现在,人工智能教育已成为从业者心目中的“教 ...
- AI小白快上车!这是发往高薪职位的车!
欢迎大家前往腾讯云+社区,获取更多腾讯海量技术实践干货哦~ 本文由腾讯云AI中心发表于云+社区专栏 AI到底有多火?看看下面这组数据: 腾讯研究院<2017全球人工智能人才白皮书>报告中提 ...
- 微软大礼包 | 集合在线学习资源,助你秒变AI达人
编者按:人工智能的浪潮正如火如荼地袭来,未来人工智能将大有所为,人们的生活轨迹也正在技术不断向前推进的过程中逐渐改变.人工智能不是科研人员或开发人员的专属,微软希望能够将人工智能带给每个人,从开发者到 ...
- 【转载】程序猿转型AI必须知道的几件事!
历史上AI火过两次,但是最终都已销声匿迹作为结束.这次AI大火的原因:AlphaGo 4比1战胜李世石,相对于一些外行人的恐慌和恐惧,其实很多业内人员在这场世纪之战结束后,都为人类点上了一个大大的赞. ...
随机推荐
- 从0开发属于自己的nestjs框架的mini 版 —— ioc篇
如今,nodejs的框架也是层出不穷,偏向向底层的有 express.koa. Fastify,偏向于上层有阿里的 Egg.thinkjs .还有国外的 nestjs. 在这里我更喜欢 nestjs, ...
- React: 动态添加样式
问题背景 在软件开发过程中,经常会出现动态添加style或className,比如:同一个表格组件在A处调用,需要固定前四列数据, B处调用则不用,那这时候,动态添加元素就派上了用场. 解决方案 如下 ...
- AB实验遇到用户不均匀怎么办?—— vivo游戏中心业务实践经验分享
作者:vivo 互联网数据分析团队 - Li Bingchao AB实验是业务不断迭代.更新时最高效的验证方法之一:但在进行AB实验效果评估时需要特别关注"用户不均匀"的问题,稍不 ...
- AI绘画StableDiffusion实操教程:可爱头像奶茶小女孩(附高清图片)
本教程收集于:AIGC从入门到精通教程汇总 今天继续分享AI绘画实操教程,如何用lora包生成超可爱头像奶茶小女孩 放大高清图已放到教程包内,需要的可以自取. 欢迎来到我们这篇特别的文章--<A ...
- Laf & 中大猫谱:让每一只流浪猫都有家
猫谱简介 中大猫谱是一款辅助校园流浪猫救助的开源小程序项目,服务端使用 Laf 云开发. 猫谱主要功能包括:猫咪信息登记.照片分享.拍照识猫.公告和留言等.项目创立的初衷,是解决校园猫猫交流群里的一个 ...
- Linux下导入MySQL数据库
导入数据库1.首先建空数据库mysql>create database abc; 2.导入数据库方法一:(1)选择数据库mysql>use abc;(2)设置数据库编码mysql>s ...
- DevSecOps之应用安全测试工具及选型
上篇文章,有同学私信想了解有哪些DevSecOps工具,这里整理出来,供大家参考(PS: 非专业安全人士,仅从DevOps建设角度,给出自己见解) 软件中的漏洞和弱点很常见:84%的软件漏洞都是利用应 ...
- [MAUI]实现动态拖拽排序列表
@ 目录 创建页面元素 创建可绑定对象 创建绑定服务类 拖拽(Drag) 拖拽悬停,经过(DragOver) 释放(Drop) 限流(Throttle)和防抖(Debounce) 项目地址 上一章我们 ...
- Solution -「营业」「CF 527C」Glass Carving
Description Link. 有一个块 \(n\times m\) 的矩形,有 \(q\) 次操作,每次把矩形横 / 竖着切一刀,问切完后的最大矩形面积. Solution 一个不同于大多数人. ...
- Cplex求解教程(基于OPL语言,可作为大规模运算输入参考)
最近导导让牛牛改篇论文,牛牛在她的指导下把非线性问题化成了线性.然鹅,化成线性后的模型决策变量和约束条件均达到上百甚至上千个,这让牛牛犯了难,以下方法或许能为这样大规模模型的变量和约束输入提供思路(๑ ...