玩转云端 | 算力基础设施升级,看天翼云紫金DPU显身手!
数字时代下,算力成为新的核心生产力,传统以CPU为核心的架构难以满足新场景下快速增长的算力需求,具备软硬加速能力的DPU得以出现并快速发展。天翼云凭借领先的技术和丰富的应用实践自研紫金DPU,打造为云而生的全新一代云计算体系结构,助力算力基础设施升级,赋能海量算力高效释放。
传统数据中心里,所有的数据处理都依赖于CPU的通用计算能力,近10年来,数据带宽增长超过10倍,然而因为摩尔定律的失效,CPU的主频几乎没有增长,给算力基础设施的发展带来了极大挑战。
云计算要实现虚拟化管理需要依托众多虚拟化和管理组件,这会大量占据服务器主机的CPU和内存资源,带来巨大的算力消耗,形成高额的算力税。然而即便如此,基于CPU通用计算能力、以纯软件来实现的虚拟化组件,整体性能仍无法满足客户日益增长的数据处理需求。且国产化芯片架构、操作系统种类繁多,复杂的适配工作会耗费大量的人力和时间成本,新型高性能计算架构势在必行。
天翼云作为云服务国家队,积极应对算力挑战,自研紫金DPU,通过虚拟化组件卸载、多种业务硬件加速以及自研三栈合一高性能网络协议,打造高性能、低延时、高可靠性并且可大规模部署的环境,助力算力基础设施升级。
天翼云紫金DPU采用SOC+FPGA架构,依托FPGA强大的处理性能和灵活的可编程能力,对多种应用进行加速。
对于客户使用的虚拟网络和存储设备,其后端都是通过DPU硬件来实现。天翼云紫金DPU通过硬件DMA提供超强性能和超低时延;通过硬件模拟提供数以千计的pvf设备和queue资源,充分满足虚机容器等场景下大量虚拟设备的应用需求。
对于虚拟网络、虚拟存储业务,天翼云实现了DPU卸载加速。虚拟网络的控制面,包括vnet的agent和OVS的控制面,以及数据面Slowpath都运行在DPU的SOC上;慢速路径处理后生成的fastPath,则全部被卸载到DPU的硬件上。除首包需要上送到软件之外,后续报文都可以直接通过硬件处理来进行加速。
对于存储业务,控制面的建链也是通过DPU的SOC来实现的。SOC完成建链后,会将连接信息以及云盘的元数据信息等都更新到FPGA硬件里面,之后的存储IO硬件能够直接处理,无需再通过SOC。除了支持基础的存储IO卸载加速外,紫金DPU还支持部分应用加速,例如EC纠删码计算、数据压缩、存储object hash值计算等操作。通过硬件卸载加速,天翼云的存储业务可以为客户提供极致的性能。
此外,天翼云还开创性的推出三栈合一的传输层网络协议栈,即SF-Stack,Super fusion超融合协议栈,在底层提供统一的传输层接口,支持传输协议的动态选择和切换,上层应用只需要关注业务逻辑,无需关注传输层,做到简单易用、超高性能、超高可靠。AZ内数据传输采用RDMA传输协议,跨AZ的传输首选用户态的TCP协议,实现极致性能,同时该协议还保留了可靠性更高的内核态TCP,作为故障发生时的最后兜底手段。
最后,依托于DPU的物理隔离,天翼云紫金DPU将虚拟化组件和DPU一起作为一个整体,实现了不同算力、不同架构、不同系统即插即用,支持市面上大多数不同架构的主流芯片,真正做到了一云多芯,助推国产算力基础设施生态发展。
依托全新的紫金架构,天翼云实现了服务器虚拟化接近零损耗,助力算力全面释放,推动整个算力基础设施运营效率大幅提升,为客户带来更优的使用体验。
▍在虚拟网络转发方面,通过DPU卸载加速,曾经需要十余个宿主机CPU才能实现的2000万pps提升至4000多万,提升了超100%;
▍在存储方面,通过硬件RDMA加速,配合天翼云自研拥塞控制算法,IOPS能力从60万提升至200万,提升了超200%;
▍在时延方面,紫金DPU使网络时延降到了原来的四分之一。
在数字经济飞速发展的当下,DPU作为新的蓝海赛道,具有巨大的探索空间及应用价值。天翼云将继续坚持科技创新,挖掘DPU的更多潜力与可能,推动数据中心向高效率、高扩展、高带宽、高灵活性发展,为数字中国建设铸牢云底座。
玩转云端 | 算力基础设施升级,看天翼云紫金DPU显身手!的更多相关文章
- 【腾讯云的1001种玩法】几种在腾讯云建立WordPress的方法(Linux)(二)
版权声明:本文由张宁原创文章,转载请注明出处: 文章原文链接:https://www.qcloud.com/community/article/126547001488207964 来源:腾云阁 ht ...
- 通通玩blend美工(3)——可爱的云
原文:通通玩blend美工(3)--可爱的云 好久没有写这个系列的博客了,这里给个电梯吧,照顾新来的同学~~ 通通玩blend美工(1)——荧光Button 通通玩blend美工(2)——时钟 目前我 ...
- 天翼云 RDS数据库操作
1.RDS数据库创建好之后点击RDS实例管理找到已下信息 官方文档 -1:http://www.ctyun.cn/help/qslist/567 官方文档 -2:http://www.ctyun.cn ...
- 天翼云安装jdk(注意有坑)
1.下载jdk8 查看Linux位数,到oracle官网下载对应的jdk ① sudo uname --m 确认32位还是64位 ② https://www.oracle.com/technetwo ...
- 天翼云上新增IP备案具体操作步骤
0.点击右上角的备案,进入到备案中心 1.已备案信息管理 点击左侧的已备案信息管理,右侧出现的页面中找到已备案网站信息,网站负责人后面的操作里有5个图标,点击第三个(变更接入),提交订单,进入到下一步 ...
- AI本质就是“暴力计算”?看华为云如何应对算力挑战
随着AI人工智能技术的飞速发展,相关的AI应用场景已经拓宽至各行各业.你可能想象不到的是,现在大家手上的智能手机的运算能力,甚至比美国航空航天局1969年登月计划中最先进计算机还高出几百上千万倍乃至更 ...
- ESA2GJK1DH1K升级篇: 阿里云物联网平台 OTA: 关于阿里云物联网平台 OTA 的升级流程
前言 鉴于有些用户直接想使用现成的物联网平台实现 OTA 远程升级 我就写一写这系列的文章 注意:首先大家必须把我自建服务器是如何实现的看明白! 我看了下阿里云提供的,实际上流程和咱自建实现的差别不大 ...
- 升级的华为云“GaussDB”还能战否?
摘要:芯片.操作系统.数据库是现代信息技术领域的三大核心基础,做数据库,不仅需要技术和投入,对华为这种做通讯起家的企业,更需要的是一种并非玩票性质的态度. GaussDB,不仅蕴含着华为对数学和科学的 ...
- 2019最新最全HUSTOJ本地及云端服务器搭建(基于腾讯云服务器)
在刚接触ACM的时候,对于那些在线测评的网站很感兴趣,就在网上搜索了一下,在Github上发现了一个有趣的项目,然后在 Github 上获取 了HUST OJ 的开源项目代码,根据网上的教程踩了无数的 ...
- 选择困难症必看!云服务器如何选择操作系统,Windows和Linux哪个更好?
在购买云服务器时,会有一个必选的配置,就是操作系统的选择,如何选择操作系统?操作系统选择错了怎么办?这是不少用户会遇到的问题,今天我们就来教大家如何选择操作系统,以及操作系统选择错了,该怎么切换. W ...
随机推荐
- jmeter 数据库连接
位置:右击添加>配置元件>JDBC Connection Configuration 作用:需要对数据库发起请求查询数据或者对数据库施加压力 3.设置说明 Variable Name(变量 ...
- 【内存管理】ION内存管理器浅析(system heap)(基于linux 4.14)
什么是ION ION具体不知道是什么的缩写,只知道是android系统上google引入的内存管理方式,为了实现用户与内核间数据共享时零拷贝.多用于多媒体,比如camera和display,graph ...
- squad经验总结
啊美丽卡:M1A2 - TANKM2A3 - BLDL/M2A3M1126 - SCKMATV - RWS(电摇),ZCC(手摇)MATV(TOW) - TOW车M989 - 补给卡/运兵卡 俄军 8 ...
- 6.Vue路由
一.路由的基本概念与原理 路由是一个广义与抽象的概念,路由的本质就是对应关系 在开发中,路由分为: (1) 后端路由 (2) 前端路由 1.1 路由 1. 后端路由(根据不同的URL地址分发不同的资源 ...
- mysql-连接路径url参数(随时补充及改错)
1.基本驱动连接url jdbc:mysql://127.0.0.1:3306/demo 2.参数 参数 缺省值 说明 粘贴 useSSL 是否使用ssl加密连接mysql,一般指定false就行,除 ...
- Go_day02
Go基础语法 流程控制 一共有三种:顺序结构,选择结构,循环结构 if语句 /* if与else if的区别: 1:if无论是否满足条件都会向下执行,直到程序结束,else if 满足一个条件就会停止 ...
- NSIS 将一整个文件夹拷贝
在做安装包的时候,有时候需要将文件夹以及文件夹下面所包含的所有文件夹和文件都拷贝到目标文件夹,一下有两种方法可以连同文件夹一起拷贝: 各文件的位置如下: 其中src 文件夹下的文件如下: 一开始dst ...
- laravel whereHas sum & addSelect sum
$users = User::select('id', 'username', 'coins', 'cut') ->when(request()->has('agent_tip_sum') ...
- C#的Event事件
一直不明白事件,今天写了一下,做个笔记吧. 先建一个类,里面有一个方法,返回bool型 public class Subject { public bool IsPass(int x) { Conso ...
- badapple最后一步,讲黑白图转为字符图,然后输出就行了。
from PIL import Image import os char_s = list(" .,-'`:!1+*abcdefghijklmnopqrstuvwxyz<>()\ ...