本文分享自华为云社区 《【云享问答】第3期:大模型时代,如何快速开发AI应用》,作者:华为云社区精选。

大模型快速普及应用的当下,AI浪潮汹涌而至,对于开发者来说,开发一款属于自己的AI应用并不是遥不可及。华为云AI生态技术专家、中科院计算所博士坐阵,从数据处理、算法开发、模型训练到部署,全方位拆解AI开发全流程,本期 【云享问答】 通过这14个问题,带你上手华为云一站式AI开发平台ModelArts,实现AI应用的快速开发。

Q1、AI开发的基本流程是怎样的?

一个典型的AI应用开发包括数据处理、算法开发、模型训练、模型部署等,在ModelArts上可以完成以上所有流程。数据处理主要是对上传到云端的数据进行标注和特征分析,算法开发可以使用ModelArts官方发布或自己开发的算法,模型训练即使用云上的CPU/GPU/NPU等资源创建训练作业,最终的模型部署可部署为在线服务或者边缘服务,可以参考这个免费案例 实操一下。

Q2、零基础小白,也可以快速上手AI开发吗?

零基础小白,可以使用ModelArts进行AI开发体验,推荐尝试ModelArts自动学习功能, 自动学习不需要AI能力和编码能力,只需上传数据,通过图像化界面操作即可完成模型训练和部署,当前支持图像分类、物体检测、预测分析、声音分类和文本分类等任务。 指导手册

也可以前往华为云AI开发交流社区——AI Gallery,里面有很多算法、模型、notebook等资产(这些资产的运行依赖的就是ModelArts),也有课程和讨论区。

Q3、华为云ModelArts是如何简化AI开发过程的?

简单的说,ModelArts解决了AI开发最关键的算力和算法获取问题:1、作为云平台,它提供非常方便的算力资源;2. AI Gallery作为社区,提供非常多开箱即用的模型。

AI开发包括多个步骤,每个步骤也有很多细节,ModelArts提供足够丰富的功能满足不同的需求。另一方面,ModelArts也提供了工作流能力(Workflow),覆盖数据标注、数据处理、模型开发/训练、模型评估、应用开发、应用评估等AI开发的多个步骤,使用者可以通过可视化配置运行开发好的工作流。

Q4、与本地开发相比, 在云上进行AI应用开发有什么优势?

以华为云一站式AI开发平台ModelArts为例,它的优势体现在:

  1. 数据智能标注、团队标注、特征分析,可以提高数据处理的效率;

  2. 自动学习、AI Gallery的预置算法,无需编写代码开发算法,可以快速进行实验;

  3. 推理部署,不用自己去开发Web服务、用户鉴权等模块,可以快速将模型部署成在线服务;

  4. 丰富的案例资料,在AI Gallery上可以学习了解当前热门的AI模型、算法等案例。

Q5、如何从本地IDE连接ModelArts,进行AI应用开发?

ModelArts支持通过本地IDE远程连接到云上的Notebook中,开发基于Pytorch、Tensorflow和MindSpore引擎的AI模型:具体操作指导参考

Q6、海量数据处理很繁琐,ModelArts可以简化这个流程吗?

可以的,ModelArts提供数据标注功能,即在云上提供图像、文本、音频、视频等数据的标注作业,除了人工标注外,ModelArts还提供自动标注、团队标注等;另外也提供数据特征分析功能,可以根据数据集中图片特征绘制曲线。

Q7、当前在ModelArts上能获得哪些公开的数据集?

数据集公开在AI Gallery上,一部分是常见的公开数据集,如ImageNet、COCO、CitySpaces、Imdb情感分析等;一部分是华为云以往的AI比赛中使用的数据集,如无人车比赛的交通标志识别、疲劳驾驶检测比赛的视频、OCR比赛的中英文购物小票等;最后就是开发者自发上传的各式数据集。可以去AI Gallery逛逛。

Q8、如何将本地训练的模型迁移上云?

我们既可以将模型部署到云上作为Web服务参考文档,也支持下发到端边侧
参考文档

如果自己线下训练的模型,部署到ModelArts平台成为一个API服务,不需要做模型转换,可以参考如下指导手册

Q9、其他格式的AI模型支持导入到ModelArts继续训练吗?

1、如果是简单的实验,可以用ModelArts的Notebook,这个环境比较自由,跟你在本地做AI开发差不多,比如Keras模型导入后用Keras API操作就行指导手册

2、如果是正式的训练/推理作业,需要适配ModelArts的规范,建议也是先参考1在Notebook里调通,再创建正式作业,需要注意的点是云上作业存储用的是华为云OBS(代码/数据需要先传到OBS),相关的规范可参考参考1参考2

Q10、ModelArts上会有训练好的开放模型吗?提供模型市场或线上调优服务吗?

模型资产发布在AI Gallery中,大部分没有公开权重,但是可以在ModelArts上部署使用,如往届华为云AI大赛的优秀作品;另外值得一提的是,最近火爆的开源大模型也陆续上架到AI Gallery中,如Stable Diffusion、MPT、Falcon等。

Q11、ModelArts中如何进行大规模分布式训练?

ModelArts主要支持数据并行方式的分布式训练,包括单机多卡、多机多卡,与单机单卡相比,借助PyTorch、MindSpore等框架能力,仅需修改几行代码即可。可参考以下链接了解详情和查看代码示例

Q12、目前ModelArts平台支持哪些AI框架?

PyTorch/TensorFlow/MindSpore都支持,CPU/GPU/Ascend版本都有。

Q13、ModelArts是否有像GPT那样的通用生成能力呢?

ModelArts是开发平台,你可以使用ModelArts开放自己的大语言模型,AI Gallery中也有ChatGLM这样的案例。

Q14、ModelArts会有一些支持开发者的活动吗?

近期上线了昇腾AI·玩转AIGC实战营活动,后续陆续有更多活动推出,敬请期待。

如果你有更多关于AI应用开发的问题,可以前往华为云开发者社区论坛提问,参与每个月的提问活动,有机会赢取精美礼品。

点击关注,第一时间了解华为云新鲜技术~

大模型时代,如何快速开发AI应用的更多相关文章

  1. 课程报名 | 基于模型训练平台快速打造 AI 能力

    我们常说的 AI 通用能力往往不针对具体的行业应用,而是主要解决日常或者泛化的问题,很多技术企业给出的方案是通用式的,比如通用文字识别,无论识别身份证.驾驶证.行驶证等,任何一张图片训练后的模型都会尽 ...

  2. 无插件的大模型浏览器Autodesk Viewer开发培训-武汉-2014年8月28日 9:00 – 12:00

    武汉附近的同学们有福了,这是全球第一次关于Autodesk viewer的教室培训. :) 你可能已经在各种场合听过或看过Autodesk最新推出的大模型浏览器,这是无需插件的浏览器模型,支持几十种数 ...

  3. 华为高级研究员谢凌曦:下一代AI将走向何方?盘古大模型探路之旅

    摘要:为了更深入理解千亿参数的盘古大模型,华为云社区采访到了华为云EI盘古团队高级研究员谢凌曦.谢博士以非常通俗的方式为我们娓娓道来了盘古大模型研发的"前世今生",以及它背后的艰难 ...

  4. paip.提高效率---微信 手机app快速开发平台—微网络撬动大市场

    paip.提高效率---微信 手机app快速开发平台-微网络撬动大市场   手机app快速开发平台 尤其适合crm系统,呼叫中心等业务功能...    作者Attilax  艾龙,  EMAIL:14 ...

  5. 大数据时代快速SQL引擎-Impala

    背景 随着大数据时代的到来,Hadoop在过去几年以接近统治性的方式包揽的ETL和数据分析查询的工作,大家也无意间的想往大数据方向靠拢,即使每天数据也就几十.几百M也要放到Hadoop上作分析,只会适 ...

  6. 转:大数据时代快速SQL引擎-Impala

    本文来自:http://blog.csdn.net/yu616568/article/details/52431835 如有侵权 可立即删除 背景 随着大数据时代的到来,Hadoop在过去几年以接近统 ...

  7. SNF快速开发平台2019-权限管理模型简介-权限都在这里

    1.1    权限的概念 权限是指为了保证职责的有效履行,任职者必须具备的,对某事项进行决策的范围和程度.它常常用“具有批准……事项的权限”来进行表达.例如,具有批准预算外5000元以内的礼品费支出的 ...

  8. JeecgBoot 2.1.1 代码生成器AI版本发布,基于SpringBoot+AntDesign的JAVA快速开发平台

    此版本重点升级了 Online 代码生成器,支持更多的控件生成,所见即所得,极大的提高开发效率:同时做了数据库兼容专项工作,让 Online 开发兼容更多数据库:Mysql.SqlServer.Ora ...

  9. SNF快速开发平台3.0之BS页面展示和九大优点-部分页面显示效果-Asp.net+MVC4.0+WebAPI+EasyUI+Knockout

    一)经过多年的实践不断优化.精心维护.运行稳定.功能完善: 能经得起不同实施策略下客户的折腾,能满足各种情况下客户的复杂需求. 二)编码实现简单易懂.符合设计模式等理念: 上手快,见效快.方便维护,能 ...

  10. Atitit 快速开发的推荐技术标准化 规范 大原则

    Atitit 快速开发的推荐技术标准化 规范 大原则 1. 如何评估什么样的技术适合快速开发??1 1.1. (重要)判断语言层次..层次越高开发效率越高  4gl  dsl> 3.5gl &g ...

随机推荐

  1. 杭电多校第二场 DOS Card

    杭电多校第二场 DOS Card 评价一下这道题:我写过最爽的线段树题. 这道题真的非常令人身心愉悦,非常厉害的一道线段树入门题.我写这个一次调试都没有,过了样例就交了就过了,一切都是行云流水. 这道 ...

  2. CHS、LAB地址

    CHS地址 CHS地址指的是柱面(Cylinder).磁头(Head).扇区(Sector)三个参数组成的地址,是用来表示磁盘上每个扇区位置的一种方式. 物理扇区号 = ((柱面号×磁头数) + 磁头 ...

  3. CANoe _ Panel面板的创建过程

    在Canoe中创建Panel面板,用于显示和操作CAN网络的数据和信号,遵循以下步骤: 1.打开Canoe 启动Canoe软件. 2.打开项目 在Canoe的菜单栏中,选择"File&quo ...

  4. 【问题解决】 网关代理Nginx 301暴露自身端口号

    一般项目上常用Nginx做负载均衡和静态资源服务器,本案例中项目上使用Nginx作为静态资源服务器出现了很奇怪的现象,我们一起来看看. "诡异"的现象 部署架构如下图,Nginx作 ...

  5. C++ 核心指南之资源管理(中)

    C++ 核心指南(C++ Core Guidelines)是由 Bjarne Stroustrup.Herb Sutter 等顶尖 C++ 专家创建的一份 C++ 指南.规则及最佳实践.旨在帮助大家正 ...

  6. matlab转C++——C++中的矩阵运算和矩阵型函数

    最近接到一个委托,把matlab代码转译为c++语言,看看能不能提高运行效率. matlab虽然本身具有将程序转化为C++的app库,但是对代码格式有严格的要求: 变量使用之前需要对变量类型和空间大小 ...

  7. iOS 循环引用的问题总结

    原因: self -> Timer -> target(self), 造成循环引用 导致控制器不会销毁,不会调用dealloc 方法,内存泄漏 - (void)dealloc{ [_tim ...

  8. Ubuntu18.04 软件源更新:图形界面

    通过图形UI界面更新Ubuntu的软件源,手动修改虽然简单,但是要自己去找源,选一个系统配置好的更简单.但是新版的好像没有该功能,找到个奇葩的路径: 将Ubuntu16.04升级为Ubuntu18.0 ...

  9. ch-manager.sh

    [root@dev-clickhouse1 ~]# cat ch-manager.sh #!/bin/bash ch_arr=(ch1-shard1-main ch1-shard2-sub ch2-s ...

  10. 号外号外!首届开源 AI 游戏挑战赛圆满结束!

    北京时间 7 月 8 日到 7 月 10 日, 我们举办了 首届开源 AI 游戏开发挑战赛.这是一场激动人心的赛事活动,游戏开发者在紧迫的 48 小时内使用 AI 创造.创新有创意的游戏. 本次赛事活 ...