摘要:本文介绍华为云函数工作流(FunctionGraph)的灵活、速度,如何让开发人员提升工程效率,缩短TTM等

本文分享自华为云社区《华为云FunctionGraph函数工作流—— Serverless“遇见”AI,释放AI生产力》,作者: 华为云PaaS服务小智 。

华为云Serverless研发工程师朱安东在2023年A2M峰会上带来了主题为“Serverless“遇见”AI,释放AI生产力”的分享,重点介绍了业界领先的基于函数计算的Serverless AI 推理解决方案,并展示了华为云函数工作流(FunctionGraph)的灵活、速度,如何让开发人员提升工程效率,缩短TTM等。

华为云 serverless研发工程师 朱安东

朱安东表示:“AIGC正逐渐在千行百业生根发芽,并且快速成为了行业中重要的生产力工具。伴随着AIGC大模型以及领域专家类型的中小模型的快速演进,引发了海量AI推理、大模型托管以及底层强大算力的诉求。 然而,要想实现AI扎根千行百业、实现“AI everywhere”的最终目标,我们仍然有很长的路要走。”

Serverless—— AI everywhere的下一块拼图

从业内工程师的角度来看,AI应用迭代发展的核心痛点主要包含2个方面:

  1. 算法工程师作为AI应用的核心开发者通常只会和模型、数据以及代码打交道,主要工作围绕数据清洗、数据工程、特征工程还有模型设计、开发、训练等,偏研究和理论方向。但是一旦涉及到算法模型和AI应用的最终落地,推广给大量用户使用就会涉及到模型发布、上线等动作,为了完成这些流程,开发者通常需要去花时间和经历学习托管类知识,尤其是云原生时代下的docker 还有k8s等;
  2. 对于参数量很大的模型上线后很难找到足量、优质的算力资源快速获得推理结果,推理性能差。从基础架构工程师的视角来看,GPU硬件设备成本高,研究阶段的需求量尚且能够满足,但是上线后面对海量用户和请求的资源量过于庞大,需要大量的投入;

另外,业务通常都是有浮动趋势的,就像旅游业的淡季和旺季,为了满足业务峰值准备的资源在业务量低的时候资源利用率也随之降低,资源严重浪费。

综上,AI应用如果想深入到人们的生活仍有很多问题需要克服。那么如何加速AI应用快速落地、敏捷迭代呢?Serverless是以应用为中心的新型云原生计算形态,这是业界的共识。而“用户无感、按需使用、以应用为中心,无需关注基础设施”这几个特性正好可以解决AI应用的几个痛点问题:

  1. 以应用为中心:AI工程师可以专注业务逻辑和模型performance,节约下大量的时间和精力。
  2. 无需关注基础设施:企业和架构工程师无需提前准备海量计算资源、自建机房,只需按需使用,按量计费。

华为云FunctionGraph解决AI用户上云4大问题

华为云FunctionGraph函数工作流是一项基于事件驱动的函数托管计算服务,通过函数工作流,只需编写业务函数代码并设置运行的条件,无需配置和管理服务器等基础设施,函数便可以弹性、免运维、高可靠的方式运行。对于现阶段人们对业务、弹性以及降本增效等诉求提升,华为云FunctionGraph无疑是AI推理Serverless化的优质选项。

在Serverless的开发模式下,开发人员和交付流程实际上是有明显界限的。开发人员只需要上传代码包或者一个镜像文件即可让整个业务跑起来,不需要面对繁琐的交付流程。

为了让用户能够在Serverless平台上更加丝滑、流畅的开发和运行AI,华为云FunctionGraph推出了针对AI场景的解决方案,主要解决AI用户上云的四大问题:

①工程效率

  • 模型开发、编排:专注业务代码,NoOps,低码编排
  • 支持代码包,容器镜像

②性能、弹性:

  • 长时负载,支持异步函数调用,最长函数执行时间72小时
  • 冷启动问题:池化预热、弹性调度

③运行时、异构计算:

  • 支持GPU/NPU,加速推理性能
  • 支持GPU共享,提升资源利用率

④模型加载加速:

  • 大文件加载:OBS+SFS结合,解决ML模型库&模型自身大文件加载问题;
  • 链路加速:高性能解压缩转换,降网络开销、CPU解压耗时;共享内存加速技术,降解压IO开销;依赖包预加载,降低公共依赖的下载、解压耗时

同时华为云FunctionGraph基于函数计算的 Serverless AI 推理解决方案具有5大优势:

1.更低的学习成本,更卓越的工程效率,更短的TTM

华为云FunctionGraph可以极大提升开发效率。精通Python的算法科学家无需学习如何安装、配置和操作复杂的计算和数据存储基础设施, 通过可视化拖拽式函 数流便能编排复杂业务场景。此外,函数还支持容器镜像,简化了AI推理Serverless化。

2.丰富的函数开发生态。

华为云FunctionGraph支持GPU/NPU能力,具备GPU虚拟化技术,从而提高GPU硬件资源的利用率并降低使用成本。

3.更低的资源成本,按需付费,提供工作负载感知智能推荐能力。

函数计算以1ms粒度按量计费,函数编排基于节点执行次数计费

4.极致的冷启动、弹性及更智能的调度能力。

资源池化预热、分层预加载与弹性水位控制:通过单实例多并发、分层预热提升性能、降低成本。函数实例百毫秒冷启动时延,毫秒级弹性。

5.多维度结合的大文件加载加速能力。

高性能解压缩转换,降网络开销、CPU解压耗时。

共享内存加速技术,降解压IO开销。

依赖包预加载,降低公共依赖的下载、解压耗时

Serverless代表现代化架构的演进方向,与微服务将长期并存,在5-10年内将成为云的首要交付模式。根据IDC今天发布的《全球半年度公有云服务跟踪报告》显示,2020年全球云计算市场同比增长24.1%,收入总额达3120亿美元。同时Serverless对客户端还具有成本优化、效率提升的商业价值。面对Serverless的发展大势,华为云将打造全栈全场景的Serverless能力,并在音视频、数据处理、物联网、端测应用等场景优先推广落地,围绕这些场景进行打穿,推动相关高阶服务进行Serverless化改造。今年,华为云在能力打造上将优先推出函数计算2.0、Serverless应用托管 CAE、事件网格服务EventGrid、ADM等;同时,也将在Serverless开发工具及可观测性上构建端到端的能力,并重点在前端Trigger、后端BaaS上进行丰富,全面打造Serverless应用生态。华为云FunctionGraph期待与更多的开发者见面。

华为云持续将最先进的技术提供给全球的客户、伙伴和开发者,助力千行百业的客户商业成功。

产品官网链接:https://www.huaweicloud.com/product/functiongraph.html?utm_source=&utm_medium=&utm_campaign=roma&utm_content=developer-iot

点击关注,第一时间了解华为云新鲜技术~

Serverless: AI everywhere的下一块拼图的更多相关文章

  1. 云上快速搭建Serverless AI实验室

    Serverless Kubernetes和ACK虚拟节点都已基于ECI提供GPU容器实例功能,让用户在云上低成本快速搭建serverless AI实验室,用户无需维护服务器和GPU基础运行环境,极大 ...

  2. 体验京东云 Serverless+AI 人脸属性识别

    云原生计算基金会CNCF(Cloud Native Computing Foundation, CNCF)Serverless Whitepaper v1.0对无服务器计算作了如下定义: Server ...

  3. 基于函数计算 + TensorFlow 的 Serverless AI 推理

    前言概述 本文介绍了使用函数计算部署深度学习 AI 推理的最佳实践, 其中包括使用 FUN 工具一键部署安装第三方依赖.一键部署.本地调试以及压测评估, 全方位展现函数计算的开发敏捷特性.自动弹性伸缩 ...

  4. 急速搭建 Serverless AI 应用:为你写诗

    前言 首先介绍下在本文出现的几个比较重要的概念: 函数计算(Function Compute): 函数计算是一个事件驱动的服务,通过函数计算,用户无需管理服务器等运行情况,只需编写代码并上传.函数计算 ...

  5. 为你写诗:3 步搭建 Serverless AI 应用

    作者 | 杜万(倚贤) 阿里巴巴技术专家 本文整理自 1 月 2 日社群分享,每月 2 场高质量分享,点击加入社群. 关注"阿里巴巴云原生"公众号,回复关键词 0102 即可下载本 ...

  6. 【智简联接,万物互联】华为云·云享专家董昕:Serverless和微服务下, IoT的变革蓄势待发

    摘要:Serverless.微服务,这些新技术和IoT有什么关系?纵观IoT行业的发展,云服务又扮演了什么角色? IoT并不是一个新名词.新技术,很长一段时间,它甚至给人一种"下工地&quo ...

  7. 6岁!是时候重新认识下Serverless了

    一.背景 Serverless 概念从2012年开始提出,真正推出相关云产品是2014年AWS推出Lambda.如果我们将 Serverless 比作一个婴儿,那么它已经6岁了. 虽然业界对Serve ...

  8. StartDT AI Lab | 需求预测引擎如何助力线下零售业降本增效?

    在当下经济明显进入存量博弈的阶段,大到各经济体,小到企业,粗放的增长模式已不适宜持续,以往高增长的时代已经成为过去,亟需通过变革发掘新的增长点.对于竞争激烈的线下零售行业而言,则更需如此. 零售行业一 ...

  9. 云开发如何解决serverless对端的最后一公里问题

    前端圈从来不缺少新的技术.点子和话题,有些留下来了而有些则转瞬即逝.在决定一种新技术是否能够长久的所有因素里,最核心的必然是自身实力过硬能够经受住实践检验.而除此之外,这项技术所解决问题的广泛程度.受 ...

  10. 用Canvas做视频拼图

    声明:本文为原创文章,如需转载,请注明来源WAxes,谢谢! 几天前同事给我看了一个特效,是一个拼图游戏,不同的是,拼图里的是动画.他让我看下做个DEMO,于是就自己整了一会,也确实不难.用canva ...

随机推荐

  1. InnoDB 存储引擎之 Buffer Pool

    Mysql 5.7 InnoDB 存储引擎整体逻辑架构图 一.Buffer Pool 概述 InnoDB 作为一个存储引擎,为了降低磁盘 IO,提升读写性能,必然有相应的缓冲池机制,这个缓冲池就是 B ...

  2. 如何使用markdown

    关于如何使用markdown写博客 markdown的语法 代码的插入 电脑Table建上面上面的键输入三个点``` 然后输入语言+回车 c语言中第一个程序 #include<stdio.h&g ...

  3. 【爬虫实战】用Python采集任意小红书笔记下的评论,爬了10000多条,含二级评论!

    目录 一.爬取目标 二.爬虫代码讲解 2.1 分析过程 2.2 爬虫代码 三.演示视频 一.爬取目标 您好!我是@马哥python说 ,一名10年程序猿. 我们继续分享Python爬虫的案例,今天爬取 ...

  4. 舵机驱动——STM32F407ZGT6探索者——HAL库

    舵机驱动--STM32F407ZGT6探索者--HAL库 1.材料准备 开发板:正点原子STM32F407ZGT6探索者 舵机:SG90 舵机线材分辨:褐色 / 红色 / 橘黄色 -- GND / V ...

  5. Kubernetes:kube-apiserver 和 etcd 的交互

    kubernetes:kube-apiserver 系列文章: Kubernetes:kube-apiserver 之 scheme(一) Kubernetes:kube-apiserver 之 sc ...

  6. 【NOI2014】 魔法森林---解题报告

    传送门 题目大意 给定 \(n\) 个点和 \(m\) 条边.每条边包含起点终点和两个精灵的最低限制,求最少需要携带的精灵数量. 题目解析 直接套 LCT 板子 将所有边按照进行升序排序,从小到大将边 ...

  7. APISIX proxy-cache 插件用法

    APISIX 的 proxy-cache 插件可以对上游的查询进行缓存,这样就不需要上游的应用服务自己实现缓存了,或者也能少实现一部分缓存,通用的交给插件来做. 下面的操作都是基于 APISIX 3. ...

  8. JAVA学习week1

    本周: 认识到Java是一门面向对象的编程语言,不仅吸收了C++语言的各种优点,还摒弃了C++里难以理解的多继承.指针等概念,因此Java语言具有功能强大和简单易用两个特征.Java语言作为静态面向对 ...

  9. 【Javaweb】Servlet九 | base标签的作用【详细介绍】 Web路径相关知识

    base标签的作用 导言:路径跳转 <a href="/a/b/c.html">这是a下的b下的c</a></br> <a href=&q ...

  10. 【Javaweb】给tomcat添加第三方jar包

    就是复制到lib文件夹里面 之后点击jar包右键 选择module library,点击ok就可以了