探秘华为云盘古大模型:AI for industries的身体力行
摘要:大模型是新一轮AI发展的核心,其已在推进产业智能化升级中已表现出巨大潜力,并将在未来三年里形成风起云涌之势。
本文分享自华为云社区《探秘华为云盘古大模型:AI for industries的身体力行》,作者:华为云头条。
大模型是新一轮AI发展的核心,其已在推进产业智能化升级中已表现出巨大潜力,并将在未来三年里形成风起云涌之势。
华为云于2021年正式发布了盘古基础大模型,包括CV计算机视觉大模型、NLP自然语言处理大模型和科学计算大模型。在基础大模型之上,华为云践行AI for industries,陆续推出了矿山、药物分子、电力、气象、海浪等盘古行业大模型,加速各行各业数字化的进程。
货运列车智慧检测,盘古轨道大模型为铁路物流安全护航
随着海内外经济复苏,货运铁路的班次及载重均迎来新高潮。
在传统的货运铁路巡检中,TFDS(货车运行故障动态图像检测)系统作为5T检测技术的重要组成部分,通过高速拍摄的“电子眼”,动态采集列车车底配件、车体侧部等部位图像,实时判别货运列车是否存在故障。
一列50辆车厢的货车,“电子眼”会拍摄4000张照片,检测员每秒需审阅1张图。动态检车员不仅工作强度大、难度高,而且需对车辆专业理论与实际运用有较高水平,要在短时间内完成整列车的故障分析,确保整列车的运行安全。
华为云在现有设备和平台架构的基础上,基于盘古轨道行业大模型,推出TFDS故障智能识别方案,实现从图像采集、数据收发、列车拆分,到实时故障判别的全局分析,能够对多工位、多辆车关联等全局故障进行精准预报。
盘古铁路行业大模型具备五项核心竞争力:
- 自监督行业预训练模型
盘古预训练大模型基于语义相似样本、等级化语义聚集的对比表示学习方法,利用百万级无标注铁路行业图像生成轨道行业大模型;
- 图像质量自动增强&评估
通过底层视觉特征以及高层视觉特征对增强后的图像进行自动评估,对正常图像做进一步故障识别,非正常图像返回人工审核;
- 依托车型先验模板匹配
根据已知的车型信息建立零部件的相对位置模板,具有可解释性地预报部件异常情况,如脱落、丢失、错位等;
- 小样本故障定位、识别
基于轨道行业预训练大模型,结合当前最优的目标检测、图像识别框架,进行部件定位、故障识别,具有更强的泛化能力,仅需传统1/3的样本即可完成。
在实际应用中,盘古轨道大模型单张照片识别仅需4毫秒,可智能过滤95%的正常图片,实现了400多种故障的自动化识别以及严重故障的“零漏报”,比人工识别更准确,大幅度提升TFDS系统作业效率,动态检车员可腾出更多精力处理难度更高的辨图工作,确保列车安全运行。
AI辅助药物设计,盘古药物分子大模型加速新药研发
自1987年达托霉素被发现以来,人类已经有近40年没有新的抗生素被研发出来。药物研发专家需要花费超过10年时间、超过10亿美元成本,才有可能研发出一款新药。
为了帮助药物研发专家从海量药物分子中高效挑选出适合成药的小分子,华为云联合中国科学院上海药物研究所推出了盘古药物分子大模型,基于全流程AI辅助药物设计的能力,以靶点预测、分子设计、活性评估、毒性筛选等环节为抓手,帮助医药公司实现快速、精准、低成本的药物发现,开启药物研发的新模式。
- 在药物虚拟筛选方面
依靠华为云创新的iFitDock算法以及虚拟筛选服务,盘古药物分子大模型的成药性预测准确率比传统方式高20%,进而让药物筛选效率提升十倍;
- 在药物优化方面
基于华为云盘古药物分子大模型的结构优化器,研发专家可对先导药进行定向优化,通过更科学的药物结构设计,减弱对人体正常细胞可能产生的毒副作用。
盘古药物分子大模型四大核心技术特点:
- “图-序列不对称条件变分自编码器”
全新提出“图-序列不对称条件变分自编码器”深度学习架构,更好地提取化合物关键的分子特征指纹,提升下游任务的准确性;
- 超大规模的化合物表征模型训练
对17亿个小分子的化学结构进行预训练,结构重构率、唯一性等方面优于现有方法;
- 生成1亿个创新的类药物小分子库
其结构新颖性为99.68%,为发现新药创造可能性;
- 实现了领先的药物发现任务性能
在化合物-靶标相互作用预测、化合物ADME/T属性评分、化合物分子生成与优化等方面实现性能最优,赋能药物发现全链条任务。
西安交通大学第一附属医院刘冰教授在盘古药物分子大模型的辅助下,突破性地研发出一款超级抗菌药Drug X,其有望成为全球近40年来首个新靶点、新类别的抗生素。华为云盘古药物分子大模型让先导药的研发周期从数年缩短至几个月,研发成本降低70%。AI技术与基础科学的结合与创新,不仅解决了研发成本高和时间周期长的痛点,更为初创型科研团队提供了施展能力的舞台。
让风云可测,盘古气象大模型精准呈现台风轨迹
在气象气候预报任务中,除了短期天气预报,全球中长期预报也是业界最为关注、重要性非常高的预测任务,它以预测未来14天内的大气系统状态为目标,在气象、航海、农业、旅游等多个行业发挥着举足轻重的作用。
当前人工智能技术虽已广泛应用在气象预测领域,受大气系统中物理过程的复杂性影响,以及求解大气模型所需资源规模巨大,基于传统数值方法进行的中长期天气预报通常会累计误差,导致准确度低,且需在超级计算机上运算数小时。
基于近40年的全球气象数据,华为云盘古气象大模型在中长期确定性预报上超越当前最强的数值预报方法(欧洲气象中心的IFS系统),是业内首个精度超过传统数值预报方法的全球AI气象预测模型。平均预报误差降低了10%-15%,速度提升10000倍以上,实现秒级全球气象预报。
盘古气象大模型核心技术特点:
- 3D高分辨率的神经网络
首次采用3D高分辨率的神经网络(3D Earth-Specific Transformer):与二维的神经网络和低分辨率的神经网络相比,盘古气象大模型水平空间分辨率达到0.25∘×0.25∘,约28公里x28公里,可以精准地预测细粒度气象特征。在时间维度上,盘古气象大模型将预测频率从6小时/次提升至1小时/次,使气象预测结果更准确;
- 层次化时域聚合策略
使用层次化时域聚合策略:训练了4个不同预报间隔的模型(分别为1小时间隔、3小时间隔、6小时间隔、24小时间隔),使得预测特定时间气象状况的迭代次数最小,从而减少迭代误差,也避免了由递归训练带来的训练资源消耗。
华为云盘古气象大模型在极端天气过程(如台风)的预报中已展现出精准、快速的优势:
- 2022年8月,盘古气象大模型实现秒级预测台风“马鞍”的轨迹和登陆时间,准确率达90%,远超行业平均水平。
- 今年5月22日至23日,今年第2号台风“玛娃”在24小时内,中心附近最大风力从38米/秒(台风级)迅速加强到60米/秒(超强台风级)。
中央气象局指出,华为云盘古大模型在“玛娃”的路径预报中表现优异,提前五天预报出其将在台湾岛东部海域转向路径。
人工智能触发的产业变革正在改变每一个行业,人工智能也在越来越多的行业场景发挥重要价值。华为云以“AI for industries”为发力点,提升大模型通用能力,贴近客户业务场景的现实需求,让人工智能开发标准化、可复制、批量化生产,加速AI深入千行百业,推动人类社会进入智能世界。华为开发者大会2023 ( Cloud )大会将于7月7日在东莞拉开帷幕,华为云盘古大模型将迎来重大升级,敬请期待!
号外
7月7日,华为开发者大会2023 ( Cloud )将拉开帷幕,并将在国内30多个城市、海外10多个国家开设分会场,诚邀您参加这场不容错过的年度开发者盛会,让我们一起开启探索之旅!
我们将携手开发者、客户、合作伙伴,为您呈现华为云系列产品服务与丰富的创新实践,并与您探讨AI、大数据、数据库、PaaS、aPaaS、媒体服务、云原生、安全、物联网、区块链、开源等技术话题,展开全面深入的交流。
大会将汇聚全球科学家、行业领袖、技术专家、社区大咖,开设200多场开发者专题活动,为全球开发者提供面对面交流与合作的机会,共同探讨技术创新和业务发展。
大会官网:https://developer.huaweicloud.com/HDC.Cloud2023.html
参会购票:https://www.vmall.com/product/10086352254099.html?cid= 211761
点击参与开发者社区活动,观赏技术大咖秀、玩转技术梦工厂,有机会赢取4000元开发者礼包!
欢迎关注“华为云开发者联盟”公众号,获取大会议程、精彩活动和前沿干货。
探秘华为云盘古大模型:AI for industries的身体力行的更多相关文章
- 华为高级研究员谢凌曦:下一代AI将走向何方?盘古大模型探路之旅
摘要:为了更深入理解千亿参数的盘古大模型,华为云社区采访到了华为云EI盘古团队高级研究员谢凌曦.谢博士以非常通俗的方式为我们娓娓道来了盘古大模型研发的"前世今生",以及它背后的艰难 ...
- 沈抚示范区·“华为云杯”2021全国AI大赛圆满落
摘要:以赛促学,赛教结合!驱动AI产业繁荣发展 本文分享自华为云社区<云聚沈抚 · 智赢未来!沈抚示范区·"华为云杯"2021全国AI大赛圆满落幕>,作者:灰灰哒. 近 ...
- AI大模型学习了解
# 百度文心 上线时间:2019年3月 官方介绍:https://wenxin.baidu.com/ 发布地点: 参考资料: 2600亿!全球最大中文单体模型鹏城-百度·文心发布 # 华为盘古 上线时 ...
- AI本质就是“暴力计算”?看华为云如何应对算力挑战
随着AI人工智能技术的飞速发展,相关的AI应用场景已经拓宽至各行各业.你可能想象不到的是,现在大家手上的智能手机的运算能力,甚至比美国航空航天局1969年登月计划中最先进计算机还高出几百上千万倍乃至更 ...
- 顶会两篇论文连发,华为云医疗AI低调中崭露头角
摘要:2020年国际医学图像计算和计算机辅助干预会议(MICCAI 2020),论文接收结果已经公布.华为云医疗AI团队和华中科技大学合作的2篇研究成果入选. 同时两篇研究成果被行业顶会收录,华为云医 ...
- 华为云BigData Pro解读: 鲲鹏云容器助力大数据破茧成蝶
华为云鲲鹏云容器 见证BigData Pro蝶变之旅大数据之路顺应人类科技的进步而诞生,一直顺风顺水,不到20年时间,已渗透到社会生产和人们生活的方方面面,.然而,伴随着信息量的指数级增长,大数据也开 ...
- 华为云Stack新版发布:构筑行业云底座,共创行业新价值
摘要:在以"政企深度用云,释放数字生产力"为主题的华为云Stack战略暨新品发布会上,华为云提出深度用云三大关键举措,并发布华为云Stack 8.2版本,以智能进化推动创造行业新价 ...
- MySQL 8.0新增特性详解【华为云技术分享】
版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明. 本文链接:https://blog.csdn.net/devcloud/article/detai ...
- Spring Boot 最流行的 16 条实践解读!【华为云技术分享】
置顶:华为云618大促火热进行中,全场1折起,免费抽主机,消费满额送P30 Pro,点此抢购. Spring Boot是最流行的用于开发微服务的Java框架.在本文中,将与大家分享自2016年以来笔者 ...
- Python爬虫从入门到精通——基本库re的使用:正则表达式【华为云技术分享】
置顶:华为云618大促火热进行中,全场1折起,免费抽主机,消费满额送P30 Pro,点此抢购. 正则表达式是处理字符串的强大工具,它有自己特定的语法结构,有了它,实现字符串的检索.替换.匹配验证都不在 ...
随机推荐
- 使用 OpenTelemetry 构建 .NET 应用可观测性(4):ASP.NET Core 应用中集成 OTel
目录 前言 使用 elastic 构建可观测性平台 在 ASP.NET Core 应用中集成 OTel SDK 安装依赖 基础配置 Instrumentation 配置 创建自定义 Span 和 Me ...
- Godot - 创建翻译文件(常量表)
版本 Godot 3.1.2 背景 Godot的UI系统封装的很难受, 一些东西很难改动, 比如这个AcceptDialog的"确定""取消"按钮, 特别是在编 ...
- 广义 SAM 学习笔记
开 CF 开到了一道广义 SAM,决定来学一学. 发现网上确实充斥着各种各样的伪广义 SAM,也看到了前人反复修改假板子的过程,所以试着来整理一下这堆奇奇怪怪的问题. 当然本文的代码也不保证百分百正确 ...
- Atcoder Regular Contest 165
B. Sliding Window Sort 2 被题目名里的滑动窗口误导了,于是卡 B 40min /fn Description 给定长度为 \(n\) 的排列 \(P\) 和一个整数 \(K\) ...
- angular,vue,react三大框架选型
三大框架,本质都是基于js的web应用(前端做的都是web应用包括移动)框架,他们都是帮助我们解决问题的工具,具体用哪个,要结合具体场景. 这三者中,Angular的适用领域相对窄一些,React可以 ...
- 搓一个Pythonic list
总所周知,Python语言当中的list是可以存储不同类型的元素的,对应到现代C++当中,可以用std::variant或者std::any实现类似的功能.而Python官方的实现当中用到了二级指 ...
- Filter入门实例
一.介绍 Filter:Filter是Servlet的"加强版",它主要用于对用户请求进行预处理,也可对HttpServletResponse进行后处理,是个典型的"处理 ...
- Vue源码学习(十六):diff算法(三)暴力比对
好家伙,这是diff的最后一节了 0.暴力比对的使用场景 没有可复用的节点:当新旧虚拟 DOM 的结构完全不同,或者某个节点不能被复用时,需要通过暴力比对来创建新的节点,并在真实 DOM 上进行相 ...
- c#中命令模式详解
基本介绍: 命令模式,顾名思义就是将命令抽象化,然后将请求者和接收者通过命令进行绑定. 而命令的请求者只管下达命令,命令的接收者只管执行命令. 从而实现了解耦,请求者和接受者二者相对独立. ...
- Unity学习笔记--数据持久化XML文件(2)
IXmlSerializable接口: 使用该接口可以帮助处理不能被序列化和反序列化的特殊类得到处理, 使特殊类继承IXmlSerializable接口 ,实现其中的读写方法,检测到读写方法被重写之后 ...