简介: 用交互技术辅以澎湃的算力带给大家最真实的“沉浸式体验”

2022年9月2日,在世界人工智能大会“区块新生 数字宇宙——元宇宙技术与生态合作”分论坛上,阿里云弹性计算产品专家张新涛带来了题为《澎湃算力,同频沉浸》的主题演讲,以下为精华演讲内容:

大家下午好,我是阿里云弹性计算团队负责异构计算产品的产品经理张新涛。今天我要和大家分享的是:站在公共云的角度如何看待下一代互联网,以及如何去服务下一代互联网。

01 交互升级,抽象变具象,沉浸式体验为产业带来变革

我们认为不管是当前的“元宇宙”名词提法,还是新的技术浪潮,在我们看来都会把它称为是交互技术的演进。对于交互技术来说其实在过去上百年一直都在不断进展,特别是近几十年发展的非常快,它演进也是有方向的,并且也是有规律可循的。我们看到的是:交互逐渐从单向变成双向,从抽象的信息变成具象的信息。

通俗的理解,广播和报纸作为传播媒介,都是以文字内容作为主要支撑,很抽象,同时也很难能够和报纸背后的作者直接沟通,也就是我们所说的交互困难。同理,和一些小说里面的人物去交互沟通,也非常难,因为这都是单向的。但是现在有了交互技术,我们可能戴着一个XR的头盔,就可以在虚拟的世界里和任何一个物体、环境、人实现交互,这也就实现了双向的交互。

那么实现了有效双向交互有什么样的意义或者作用呢?其实针对这样的双向交互我们视之为现实世界和虚拟世界的融合,这个融合也产生了非常多的好处。现实世界是刚性的,很多东西难以改变,但虚拟世界是柔性的,我们可以任意定制,当我们把现实世界和虚拟世界的特征结合起来,我们就找了另一个解决问题的模型。

举个例子:我们想要在某地规划一个CBD,但是无法准确预估CBD建成后对周围交通的影响,从而在建成后造成周边交通拥堵不堪,这种情况在早些时候是时有发生的。而这个时候如果我们把CBD模型放到虚拟城市中,同时把所有的交通要素引入,包括汽车、两轮车、行人等,并放进对应的参数加以仿真。我们就可以预估,在某地建设一个CBD,哪些地方需要调整修改,最终形成了一个模型。总结来讲:就是把现实世界的问题带到虚拟世界里去仿真找到答案,再重新影响现实世界。

像这样虚实结合的应用已经非常普遍的出现在了我们的生活和工作当中。比如:在消费端场景中我们常见的各种数字虚拟人,元宇宙演唱会,沉浸式数字博物馆,企业端场景中的各种虚拟仿真系统,数字孪生工厂等等。目前主要的沉浸式应用或者叫做视觉计算应用主要是在这两个比较大的场景里,总结而言带来的优势是:在消费端领域给大家的生活带来的是美好和有趣,在企业端领域带来的是创造力和生产力。

这些如此多元宇宙应用的呈现,是需要云计算的,我们看下这些应用对云计算的挑战有哪些。

02 阿里云,突破产业链挑战,打通商业协作

在我们看来这场新的产业革新是影响到全行业的,所有的元宇宙应用或者视觉计算应用都可以使用这个模型来表示。开发者开发的元宇宙应用,需要通过云端计算能力并借助人机接口设备将虚拟体验带给用户。即便看上去如此简单的模型,在产业实际的落地过程中也面临巨大挑战,挑战的原因来自三个方面:元宇宙产业的技术栈异常复杂,要影响到的行业众多,潜在的用户也是众多。最终带来两个比较大的挑战:技术上的挑战和商业协作上的挑战。

先来看技术上的挑战。

技术方面的挑战主要是计算方面的挑战。过去20年大家都经历了从PC到手机的转变,最重要的变化来自于交互方式的变化。大家的交互从PC时代的鼠键+显示器到了现在多点触控的方式,甚至是在XR头盔和眼镜上使用了手势和语音的交互,这些交互需要更多的计算能力,但是终端的计算能力演进速度却日益捉襟见肘,交互计算负载开始逐渐向数据中心移动。

在过去20年间,数据中心的计算力规模扩大了百倍,这里面除了互联网用户增量带来的增量变化而外,剩下是交互方式带来的计算增量,最显著的变化是数据中心出现了异构加速计算。例如:我们常见的手机上的语音识别,购物推荐,刷脸支付,AI相机等等,都需要借助云端AI计算资源协助。到了下一阶段的XR终端更是如此,我们来看看XR阶段有哪些计算需求。

现在到了XR阶段,对计算的需求更加强烈,甚至是过往需求的数百倍。

比如说在XR的场景下就会有三类计算:图形图象计算的挑战、AI计算的挑战、流媒体计算的挑战。图形计算需要始终实现实时的图像生成,AI需要更多,实时对话,实时画面面部表情变化,实时的情绪识别与生成,这将面临巨大的计算增量挑战。除此之外,我们把内容从云端传到用户端,从用户端传到云端的过程中还需要另外一个东西——通信,它需要非常大的带宽以及非常低的延时。

总之,计算力的提升要数百倍,通信的能力的提升也要数百倍。

我们再看一下商业协作的挑战:元宇宙这个新兴产业的技术栈十分复杂,本质上源于其使用了过去几十年人类成熟和正在演进的所有IT技术。这也导致新产业的商业协作链路十分冗长。我们在过去一段时间对产业进行了认真梳理,将产业模型逐渐简化到五个环节,目前绝大多数客户和伙伴都在这五个环节中。前面有一个嘉宾提到,做一个数字人、虚拟空间等要多少钱,这中间最大的问题是大家的协作效率极其低,使其成本很高,效果也并不理想。如何让大家效率提升,同时做出更多有用的东西,这才是我们的亟待要解决的商业协作的问题。

讨论完了商业协作上的挑战,我们来看一下技术问题怎么解决。技术问题前面讲有计算力的挑战,还有一个计算规模的挑战,除此之外还有一个通信的挑战。阿里云过去多年做了神龙计算平台,今天我们升级到CIPU的平台,目的就是为了解决计算性能,通信能力上的技术挑战,除此之外,我们在过去几年GPU实例的计算也增加了百倍来应对AI和图形计算的挑战,GPU计算资源的规模也超过了1700P。

这页可以看下第四代神龙计算平台带来的计算和通信能力的提升表现。

这页来看下现在升级到CIPU之后,带来的规模,稳定性和弹性的巨大优势。

这页是我们去年发布的第七代GPU实例,这个实例在AI计算和视觉计算性能上都有了显著提升,并且支持第二代实时光线追踪引擎,是个非常适合元宇宙业务的计算实例。

虽然看上去技术挑战仍然十分艰巨,但是我们找到了方向,这样实现突破也就相对容易。但是更大的挑战是是商业协作。

商业协作如何打通?大家可能认为云计算厂商就是提供计算力的,实际上我们认为这对云计算厂商来说这远远不够,为什么远远不够?因为云计算有着非常大的优势,连接需求的上下游,能把所有的需求在这里连通,并且帮助大家做得更好。

因此,我们除了把自己的IaaS产品做好之外,还希望把整个产业链前面讲的那五个协作环节高效起来,进而就有了协作体系。这个协作体系主要是分为三层:其中之一是我们会把产业里的共性问题在接口层这里解决掉,比如:提升3D引擎的渲染效率和能力,提升编码和串流的能力等等;进一步地,我们和伙伴合作搭建起来协作平台,我们希望使用这个平台将之前讲到的复杂的协作变得高效起来;最后,我们还面向全行业构建行业编辑器矩阵,或者行业SaaS矩阵,通过低代码的方式让更多行业可以构建自己的元宇宙应用。

这里我们先来简单介绍一下协作平台的两个产品:云3D引擎编辑器平台和云XR平台。

关于协作平台前面很多嘉宾讲到3D引擎,其实3D引擎在这里面起了一个非常枢纽的作用,所有的游戏,元宇宙的应用,3D的应用,都要用3D引擎来开发,用3D引擎的编辑器来开发。但是3D引擎实际上还是有门槛的,无论是技术上的门槛,还是计算力上的门槛,还是整个商业协作环节上的门槛都非常大,可能每一个这种应用都需要带上几百G的素材,也就相当于带上一个非常巨大的计算量。

比如说我们做一个东西,做一个烘焙,可能几十个小时就过去了,开发者就要等几十个小时,效率非常低。我们是希望用云的方式来解决,大家可以在各种类型的终端上进行业务开发,开发环境不受限制,计算资源也不受限制,这样开发效率就大大提升了。

03 云XR平台发布,支持用户高效部署,落点沉浸式应用

那么开发出来的东西部署在哪里呢?其实我们发布了一个云XR平台,这个平台可以支持大家把各自的应用开发出来后直接放到这个平台上,不需要像之前一样开发出来的应用,适配成百上千的这些终端,效率非常高,可能5分钟就可以搭建完成一个云上的元宇宙应用。

关于云XR平台大家可能会比较关注的一些特征,如:OS类型,引擎类型,终端类型的支持情况,我们也完成了对nReal眼镜的支持,欢迎大家试用。

大家可能关心对开发流程的影响,基本上无任何影响,你无论是2D的应用开发还是3D应用开发,都与过去没有太大区别。

最终无论是在云上去创作开发,还是在云上部署,大家环节是没有变的,以及其实我们在云上也落了很多这样沉浸式的应用。

上图是我们客户的一个元宇宙演唱会,作品内容出自我们的合作伙伴。这是在9月4号他们举办的元宇宙演唱会的一些画面的效果,就是在云上实时渲染出来的。

我前面讲了汽车产业,其实这些沉浸式的应用或者是叫视觉计算应用,实际上已经能帮助很多产业来解决问题。

举个例子,现在最热的产业之一:自动驾驶,但是自动驾驶大家会发现有个巨大的问题,它需要上百亿公里的路测,但中国的领先企业,可能只有几千万公里的路测,起步较晚的企业路测里程更短。同时这些路测的成本也非常地高昂,需要买几千上万辆汽车,雇几千上万个司机和安全员去做各种各样的路测,且这个积累的数据量也相当地有限,但是如果我们把它在虚拟世界去做仿真,这个效果将是极其地快速,我们可能说在云上去开数万个GPU实例,用数万片的GPU去渲染出来这样的场景,我们是用数万台虚拟的汽车去跑,而且是24小时不停地跑。

由于虚拟世界的柔性可定义,可以定义出来各种路面,光照和环境,这就是使得检测出来自动驾驶程序的各种bug的概率,比在真实路测的条件下要高很多,这是可以正面提高生产效率的。

除了自动驾驶,健康产业我们同样关注。这是我们一个合作伙伴,他们做了全世界最先进的医学数字人,他们的一大部分的研究方向是研究人体,其实现在很多医学院、医院都需要这样的人体模型,来做术前研究规划,学习等。

我们通过视觉计算的方式,很轻松的就可以把这种服务投递给每个需要的机构或者个人,帮助他们高效实现研究和学习的目的。

用交互技术辅以澎湃的算力带给大家最真实的“沉浸式体验”,打破技术+商业协作的双向挑战,打通产业上下游,助力其实现高效,相信是每一位同仁们的愿景和目标,也希望终有一天,我们能够看到交互技术真正为全产业的全链路带来新的产业机会。

我的分享就到这里,谢谢大家。

点击这里,了解阿里云视觉计算解决方案。

原文链接:https://click.aliyun.com/m/1000358630/

本文为阿里云原创内容,未经允许不得转载。

阿里云张新涛:连接产业上下游,构建XR协作生态的更多相关文章

  1. 阿里云MySQL远程连接不上问题

    解决阿里云MySQL远程连接不上的问题:step1:1.修改user表:MySQL>update user set host = '%' where user = 'root'; 2.授权主机访 ...

  2. 阿里云Windows远程连接出现身份验证错误,要求的函数不正确”的报错。

    最近很多阿里云用户在远程Windows Server的云服务器ECS时出现“身份验证错误,要求的函数不受支持”的报错. 这个问题解决起来非常简单,修改组策略中的一个配置就可以了. 在运行中输入gped ...

  3. 阿里云服务器远程连接错误:由于一个协议错误(代码:0x112f),远程会话将被中断。

    2019年10月,阿里云服务器远程连接忽然无法登录.当时正在清理c盘空间,C盘只剩下30+M,忽然远程桌面掉线,以为断网了,再次远程桌面连接时,就出现一下错误. 解决方案:万能的重启!!!具体错误原因 ...

  4. 阿里云服务器 无法连接svn

    网上所说的在服务器中:1. 配置防火墙 2.svnserve.conf没配置好,3.svn客户端缓存,都进行排查处理,还是连接不上. 最后使用ip add 查看服务器网卡ip命令 发现无法看到当前服务 ...

  5. 阿里云服务器ftp连接后21端口无法使用的问题

    今天在阿里云Centos上搭了一个ftp 服务,开启了20和21端口的权限.但是用工具和ftp命令登录,均超时. ftp命令登录成功后不能使用ls 命令,直接超时. 工具登录成功后 获取根目录失败,也 ...

  6. [转]解决阿里云mysql不能连接,配置mysql远程连接

    默认是不能用客户端远程连接的,阿里云提供的help.docx里面做了设置说明,mysql密码默认存放在/alidata/account.log 首先登录: mysql -u root -h local ...

  7. 阿里云异常网络连接-可疑WebShell通信行为的分析解决办法

    2018年10月27日接到新客户网站服务器被上传了webshell脚本木马后门问题的求助,对此我们sine安全公司针对此阿里云提示的安全问题进行了详细分析,ECS服务器被阿里云提示异常网络连接-可疑W ...

  8. 阿里云serverMySQL无法连接问题解决纪实

    作者:fbysss QQ:溜酒酒吧酒吧吾散 blog:blog.csdn.net/fbysss 声明:本文由fbysss原创,转载请注明出处 背景: 在调试程序的时候,发现数据库訪问相关的环节出现错误 ...

  9. 【阿里云IoT+YF3300】13.阿里云IoT Studio WEB监控界面构建

    Web可视化开发是阿里云IoT Studio中比较重要的一个功能,通过可视化拖拽的方式,方便地将各种图表组件与设备相关的数据源关联,无需编程,即可将物联网平台上接入的设备数据可视化展现. 目前支持的组 ...

  10. 关于阿里云的远程连接和轻型桌面(xfce4)安装

    这里用的阿里云服务器是轻量应用服务器 先通过网页端的远程连接进入服务器,然后 安装xfce4 (1)先安装更新:apt-get update. (2)安装xrdp:输入apt-get install ...

随机推荐

  1. DiagnosticSource DiagnosticListener 无侵入式分布式跟踪

    ASP.NET Core 中的框架中发出大量诊断事件,包括当前请求进入请求完成事件,HttpClient发出收到与响应,EFCore查询等等. 我们可以利用DiagnosticListener来选择性 ...

  2. Python爬虫实战系列2:虎嗅网24小时热门新闻采集

    一.分析页面 打开虎嗅网,点击[24小时] 本次采集,我们以这24小时的热门新闻为案例. 1.1.分析请求 F12打开开发者模式,然后点击Network后点击任意一个请求,Ctrl+F开启搜索,输入标 ...

  3. Android TextView自动缩放能够完整显示出一行

    原文地址: Android TextView自动缩放能够完整显示出一行 - Stars-One的杂货小窝 app开发中,需要TextView可以在不同的屏幕大小要完整显示出文字,而不是显示省略号 可以 ...

  4. Java使用Steam流对数组进行排序

    原文地址:Java使用Steam流对数组进行排序 - Stars-One的杂货小窝 简单记下笔记,不是啥难的东西 sorted()方法里传了一个比较器的接口 File file = new File( ...

  5. Linux查看用户的7个命令

    Linux是中国IT实验室的一个技术频道.包含桌面应用,Linux系统管理,内核研究,嵌入式系统和开源等一些基本分类      在Linux系统里,我们会经常用Linux查看用户的命令,在这里我们一些 ...

  6. dotNet符号文件(pdb),符号包(snupkg)和SourceLink

    前言 本文的主题是 Visual Studio 调试 NuGet 包,以及符号包的概念,如何去发布一个 NuGet 包,让我们的 NuGet 包支持 SouceLink,这些都是我们开发中比较容易忽视 ...

  7. linux查看资源使用情况

    linux查看资源使用情况 top -c # 查看资源使用情况 top 输出如下内容 top - 14:54:21 up 95 days, 20:03, 3 users, load average: ...

  8. KingbaseES数据库分区表添加主键与索引的建议

    一.初始化测试环境 # 数据库版本信息 KingbaseES V008R006C007B0012 on x86_64-pc-linux-gnu, compiled by gcc (GCC) 4.1.2 ...

  9. KingabseES 隐式游标属性值(SQL%attribute)

    隐式游标介绍 Oracle数据库迁移到KingbaseES数据库,不需要将源PL/SQL脚本,大规模修改为KES语法,因为KingbaseES支持大部分PLSQL语法. 1.隐式游标 隐式游标是由 P ...

  10. Linux服务器程序规范化

    Linux日志体系 rsyslogd守护进程既能接收用户进程输出的日志,又能接收内核日志.用户进程是通过调用syslog函数生成系统日志的.该函数将日志输出到一个UNIX本地域socket类型(AF_ ...