据记者了解,2013年华为就发布了Hi1610,2014年的Hi1612是ARM64位CPU,2016年的Hi1616是首颗支持多路的ARM处理器,2019年又迎来Hi1620,鲲鹏920则是Hi1620系列的正式品牌和型号。在今年1月7日的发布会上,华为高管表示,鲲鹏920主频可达2.6GHz,单芯片可支持64核。该芯片集成8通道DDR4,内存带宽超出业界主流46%。

Arm中国吴雄昂:从未对华为“断供” 后续架构继续供货

2019
09/25
21:12
第一财经

企鹅号

分享
 
评论
30

在华为的“补洞”计划中,Arm无疑是不可或缺的一环。

今年1月,华为正式对外推出了新一代服务器芯片ARM-based处理器—鲲鹏920(Kunpeng 920),在发布会现场,华为高管并不吝啬地将“业界性能最高”的评价放在了这颗基于ARM架构的新产品身上。而在最新一代的麒麟990芯片中,华为选择的依然是Arm的Cortex-A76芯片微架构。

然而,从早前的“断供”传闻到Arm后续架构的无法使用,几个月间,围绕在华为以及Arm身上的噪音一直没有减少。在9月25的一场媒体沟通会上,Arm中国执行董事长兼CEO吴雄昂首面媒体,明确表示与华为之间的合作正在紧密进行。

“第一,我们从没有断供,一直在支持华为,包括华为产品的发布和持续的出货。第二,我们Arm中国的产品是源于英国的架构。可以看到,我们V8架构以及后续架构也已经明确,这两个产品在合法合规的情况下可以继续向中国的客户包括华为进行供货。”吴雄昂对第一财经记者表示,在实体名单的事件发生以后,内部第一时间驱动了Arm、Arm中国和华为海思的沟通,也很快做出回应,在积极地寻求解决办法。确实,因为情况也很复杂,花了很多时间来厘清整个产品的情况,所以在适当的时期Arm也开始对外说哪些产品是可以正常在做的。

25日,在接受国内媒体采访的同时,Arm中国也将与Arm、海思举行一场闭门会议,主要内容涉及合作方面的一些探讨以及一些新产品计划。在上述活动现场,华为海思CIO刁焱秋出席并对记者表示,“华为也希望向Arm这位长期合作伙伴传递这个信息:我们一直以来投资参与生态建设,Arm是我们长期的投资伙伴。”

“Arm中国是在2018年成立的合资公司,这是一个完全独立运营的实体。Arm中国的目标是做本土的芯片IP公司。Arm中国的使命也是逐步地推动本土研发,目标是全球标准、本土创新,也就是说会沿用并且跟全球先进的Arm技术保持一致的生态和尽量一致的产品规划。”Arm中国市场部负责人梁泉补充道,Arm中国是独立运营的公司,它的产品规划,产品的合作其实有非常大的独立自主权。

算力和算法是插入智能世界的两个楔子,芯片承载着算力的强弱。在多年前,华为就开始了和Arm在芯片领域的合作。

据记者了解,2013年华为就发布了Hi1610,2014年的Hi1612是ARM64位CPU,2016年的Hi1616是首颗支持多路的ARM处理器,2019年又迎来Hi1620,鲲鹏920则是Hi1620系列的正式品牌和型号。在今年1月7日的发布会上,华为高管表示,鲲鹏920主频可达2.6GHz,单芯片可支持64核。该芯片集成8通道DDR4,内存带宽超出业界主流46%。

“每年十几亿的手机处理器芯片都是基于ARM芯片的,在手机上的几百万应用都是基于ARM生态的。ARM在边缘和生态上的优势,会逐渐向数据中心延伸。以前基于ARM的技术,不能在数据中心等地方用,核心的瓶颈是性能。华为今年发布的昇腾910也是兼容ARM的,超越了目前通用主流CPU性能20%左右。”华为Cloud&AI产品与服务副总裁黄瑾说。

在他看来,未来十年将是计算架构创新的黄金十年,计算产业的规模将超过2万亿美元。换言之,与Arm之间的合作将会持续深入。

但同时更大开放的硬件生态软肋意味着力量的分散。英特尔可以说是用开放的工业标准的高性价比处理器打败了所有私有RISC处理器,虽然安腾项目失败,但更高性价比的至强现在完全统治了服务器市场。

此前三星、英伟达、博通、Marvell、高通、华芯通等厂商均大力投入ARM服务器处理器研发,但面对英特尔x86依旧冲击未果。

梁泉对记者表示,这也正好证明了每一个在通用计算领域的生态构建都充满了曲折性。

“因此一定要遵循全球化技术发展的趋势。举个例子,Arm是参与开源非常多的一家公司,服务器上面那么多开源软件,这些开源的生态构建其实决定了在端侧、服务器侧的一些产品未来落地的可能性。如果没有这些生态的构建,很难支撑起一个成熟的或是完整的软件,更不要说最后的产品。目前在服务器或者技术架构这一块,Arm的生态越来越完善。亚马逊也推出了相关的产品,并且在全力投入,华为也是在全力投入。这些互联网巨头、技术架构或计算领域的巨头正一起共建Arm生态。”梁泉对记者表示,Arm在服务器技术架构领域正逐步建立起生态,虽然这是一个非常艰辛的过程。

 
 
 
作者:DEANYE
链接:https://www.zhihu.com/question/308298687/answer/568751021
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

官方宣称SPECint达到了930+,和Marvell的Thunder X2、Ampere的eMAG相比高25%;由于采用7nm制程,比竞品的16nm先进不少,能效高30%;内存带宽、I/O带宽和同为ARM阵营的竞品相比也有不小优势。同时集成了100G RoCE的网卡端口,这在目前基于ARM的Server CPU中是最大的。

<img src="https://pic1.zhimg.com/50/v2-d287bc3809b3866f61ae97615aa15b4a_hd.jpg" data-rawwidth="470" data-rawheight="261" data-size="normal" data-default-watermark-src="https://pic3.zhimg.com/50/v2-093a2d734a17150c73c75ac64d696848_hd.jpg" class="origin_image zh-lightbox-thumb" width="470" data-original="https://pic1.zhimg.com/v2-d287bc3809b3866f61ae97615aa15b4a_r.jpg"/>

值得注意的是,华为表示大部分性能提升来自优化的分支预测算法、增加的OP运算单元和改进的内存子系统架构。这就很厉害了~

<img src="https://pic2.zhimg.com/50/v2-6cc428108721b3e70d17bc52ac4ae7e1_hd.jpg" data-rawwidth="489" data-rawheight="275" data-size="normal" data-default-watermark-src="https://pic2.zhimg.com/50/v2-663c159c0441bc2cb2dc1b0a0f7ffa12_hd.jpg" class="origin_image zh-lightbox-thumb" width="489" data-original="https://pic2.zhimg.com/v2-6cc428108721b3e70d17bc52ac4ae7e1_r.jpg"/>

可以看到,内存带宽、I/O带宽、网络带宽性能相比竞品有较大优势,可以满足未来高吞吐量的需求。

<img src="https://pic2.zhimg.com/50/v2-86249ef54c05567da1d7b825dc8848df_hd.jpg" data-rawwidth="573" data-rawheight="322" data-size="normal" data-default-watermark-src="https://pic4.zhimg.com/50/v2-0529a5b0451b4c787cfbc74ce05b40a4_hd.jpg" class="origin_image zh-lightbox-thumb" width="573" data-original="https://pic2.zhimg.com/v2-86249ef54c05567da1d7b825dc8848df_r.jpg"/>

以下是竞品之一(Marvell Thunder X2)

<img src="https://pic2.zhimg.com/50/v2-e7cf370f4213d4f56a5762f604791df0_hd.jpg" data-rawwidth="654" data-rawheight="679" data-size="normal" data-default-watermark-src="https://pic3.zhimg.com/50/v2-be0eb58e828df8169f332bfbbbfdab73_hd.jpg" class="origin_image zh-lightbox-thumb" width="654" data-original="https://pic2.zhimg.com/v2-e7cf370f4213d4f56a5762f604791df0_r.jpg"/>

以下是竞品之一(Ampere eMAG),联想内存密集型服务器平台有应用这款CPU。

<img src="https://pic4.zhimg.com/50/v2-e976dbdc4c7b51dad472f8e06e54f478_hd.jpg" data-rawwidth="1137" data-rawheight="541" data-size="normal" data-default-watermark-src="https://pic3.zhimg.com/50/v2-68ba05625f8b903d6b7897e2d51e050e_hd.jpg" class="origin_image zh-lightbox-thumb" width="1137" data-original="https://pic4.zhimg.com/v2-e976dbdc4c7b51dad472f8e06e54f478_r.jpg"/>

但是,930+的SPECint成绩和X86架构CPU相比并没有到秒天秒地的程度。

<img src="https://pic4.zhimg.com/50/v2-a0b4b0a40f373aa091ca31fd31935ec8_hd.jpg" data-rawwidth="710" data-rawheight="74" data-size="normal" class="origin_image zh-lightbox-thumb" width="710" data-original="https://pic4.zhimg.com/v2-a0b4b0a40f373aa091ca31fd31935ec8_r.jpg"/>

还有就是,服务器CPU市场基本被X86垄断。X86服务器的生态比ARM好很多,这是华为仅凭一家之力没法改变的。

<img src="https://pic1.zhimg.com/50/v2-f90591f4b34aa924e79f966667f6ba83_hd.jpg" data-rawwidth="660" data-rawheight="466" data-size="normal" data-default-watermark-src="https://pic2.zhimg.com/50/v2-92160159df72334bb4226b60acff7c03_hd.jpg" class="origin_image zh-lightbox-thumb" width="660" data-original="https://pic1.zhimg.com/v2-f90591f4b34aa924e79f966667f6ba83_r.jpg"/>

当然,更准确的说,是被英特尔垄断了(下图注意纵坐标。。。)

<img src="https://pic1.zhimg.com/50/v2-382b4cccefee72af9a591a341fa5fd6c_hd.jpg" data-rawwidth="650" data-rawheight="382" data-size="normal" data-default-watermark-src="https://pic2.zhimg.com/50/v2-5ffbb12509b80399858bbbe421696949_hd.jpg" class="origin_image zh-lightbox-thumb" width="650" data-original="https://pic1.zhimg.com/v2-382b4cccefee72af9a591a341fa5fd6c_r.jpg"/>

综上,鲲鹏920对整个服务器市场来说并没有多大影响,但这是华为发力云业务和服务器市场的重要一环。另外,海思能做出这样的芯片,值得点赞和钦佩!

华为鲲鹏处理器实现商用,Arm服务器又添砝码

摩尔精英集成电路产业发展(合肥)有限公司 ceo
11 人赞同了该文章

来源:本文由公众号半导体行业观察(ID:icbank)原创,谢谢。

近期,沉寂好长一段时间的Arm服务器市场传来了一则消息:浙江移动营业厅前台系统迁移至基于华为鲲鹏处理器的泰山(TaiShan)服务器。这是全球首例基于鲲鹏处理器的商用运营商IT应用系统。

浙江移动将现有大IT中台产品与华为TaiShan服务器成功融合,包括DCOS(数据中心操作系统)、docker、MSP(微服务平台)等组件,通过大IT中台提供的硬件解耦、集群快速切换、故障自动隔离等特性,将营业厅系统的运行环境无缝切换到了华为TaiShan服务器,且系统运行稳定。

据悉,营业厅前台系统是运营商最核心的业务受理系统之一,承载着手机、宽带等核心业务,对系统处理性能、稳定性有较高要求。鲲鹏处理器在这里实现商用,说明其在算力、性能、稳定性等方面已经达到了成熟水平。

今年1月,华为宣布推出了基于ARMv8架构的服务器芯片鲲鹏920(Kunpeng 920),以及三款泰山Arm服务器。

鲲鹏920有64个内核,主频2.6GHz,支持8通道DDR4,以及一对100G RoCE端口,是基于ARMv8指令集研发的高性能服务器处理器,采用台积电7nm制程工艺,号称是最强Arm服务器芯片,比业界标准性能高出25%。据悉,鲲鹏920的大部分性能提升来自优化的分支预测算法、增加的OP运算和改进的内存子系统架构。

时任华为董事会董事、战略Marketing总裁徐文伟表示,鲲鹏920是专为大数据处理和分布式存储等应用而设计的。

据徐文伟介绍,在SPECint基准测试中,鲲鹏920得分超过930分,比行业基准高出近25%,同时,功耗降低了30%。

基于鲲鹏920,华为推出了三款ThaiShan系列服务器,包括TaiShan 22080、Thaishan 5280/5290、ThaiShan X6000,分别面向均衡服务器、存储服务器及高密度服务器市场,主要应用于大数据、分布式存储、Arm原生应用等场景。

目前,华为自研芯片已经覆盖了移动终端、AI人工智能、服务器三大领域,从手机移动终端到PC服务器都有战略性推进,手机芯片麒麟980已经成为华为公司的一面旗帜,而基于鲲鹏处理器的服务器也开始商用了,使其基于Arm架构的服务器发展向前迈了一大步。

艰难前行

在过去的一年里,关于Arm服务器芯片的兴衰一直是业界的一个热点话题,而华为海思也被紧紧地绑定在了这个话题当中。

之所以如此,是因为在去年,业界一直在热议海思的Hi16xx服务器芯片,其正是基于Arm架构的,Hi16xx是海思内部的研发代号,而其终版本Hi1620,正是该公司正式发布的鲲鹏920。实际上,华为之前就有做过基于Arm架构的服务器芯片,但那时的产品不够成熟,并未大规模推广。

相对于手机SoC而言,做服务器芯片的难度和门槛就高得多了,而且是做非x86架构的芯片,在当今的服务器市场,x86系处理器的市场占比超过90%,要想在这样稳固的生态当中夺食,谈何容易。而国内外一批Arm系的厂商正在试图改变这一让很多服务器应用商感到无奈的局面,因为它们在x86系那里鲜有议价能力。

华为在Arm服务器芯片研发方面也积累了多年,弯路自然是难以避免的,初期推出的一些芯片显然不尽如人意,比如基于Cortex-A57架构的32核产品。

在经过多年的研发和市场经验积累后,华为终于在今年年初正式推出了鲲鹏920。

推出鲲鹏920前后,华为一直在做Arm服务器的生态建设工作,因为在强大的x86系生态面前,要想拿到客户订单,绝对不是只靠一两款处理器芯片和两三款服务器产品就可以的,行业组织和平台的渗透与建设、相关硬件和软件的协同等等,都非常重要,同时也是最难做的。不过Arm系服务器厂商有可以依仗的,那就是市场有这个需求,需要打破垄断。

Arm服务器芯片阵营

目前,Arm服务器芯片阵营相对弱小,厂商主要包括国外的Ampere,,Marvell/Cavium(2017年底,Marvell收购了Cavium,这家专注于网络通信领域多核处理器的厂商,也是Arm服务器芯片的代表厂商),APM、富士通、亚马逊等。而我国原本有“三驾马车”在从事Arm服务器芯片的研发工作,分别是华为海思、飞腾和华芯通,但随着华芯通在前一段时间的解体,也只有海思和飞腾能被寄予厚望了。

飞腾方面,其代表产品有FT-1500A和FT2000。

FT2000的代号为“火星”(Mars),性能较为强悍,也比较成熟,可以说是代表了我国Arm服务器芯片的最高水平了。具体来看,FT2000采用28nm工艺,主频2GHz,功耗100W。芯片面积600多平方毫米,集成了64个FTC661 CPU核,共计48亿个晶体管。

根据测试,FT2000的芯片实测成绩相对于模拟器成绩要稍低一些,在2GHz主频下,采用GCC4.8编译器,SPEC2000和SPEC2006测试。其中SPEC CPU2006全芯片测试分值为定点570,浮点482,单线程测试分值为定点12.4,浮点11.3,虽然在单线程性能上和Intel依旧有不小的差距,但就多线程性能而言,足以与Intel Xeon E5-2695v3芯片相媲美。

FT-1500A是FT2000的前一代产品,FT-1500A基于ARMv8指令集的FTC600处理器核,采用28nm制程工艺,支持DDR3-1600内存、PCIe 3.0、两个千兆网口等。

据悉,FT-1500A架构由早期的SPARC转变成了Arm 64位,这与富士通的发展路线非常相似。不过飞腾这一转变还有另外一层因素,就是避免被Intel的Xeon处理器“卡脖子”。然而,FT-1500A大规模商用的情况较为神秘,目前并没有非常明确的资料可查。

耐人寻味的是,作为一款“老”产品,FT-1500A在近期的2019年度国家自然科学奖、国家技术发明奖和国家科学技术进步奖初评通过项目中,,获得了一等奖。

无论是华为,还是飞腾,要想将Arm服务器芯片发展下去,尽快扩大商用规模是当务之急,与此同时,生态建设还得跟上,从最近两年Arm服务器芯片阵营的发展和变化情况来看,未来两三年的时间显得尤为宝贵,抓好了,积极的变数就会出现,抓不好,不利的因素可能会增多。

展望未来

随着大数据、云计算时代的到来,服务器市场将迎来爆发式增长。在当下的数据中心,Intel处理器占据90%以上市场份额,这会使互联网公司和数据中心的运营者在面对Intel时缺乏议价能力。

因此,寻找替代解决方案,实现多供应商是当务之急。如谷歌、百度、阿里等互联网巨头都对Arm服务器非常感兴趣。

由于市场足够大,且一些互联网巨头比较青睐定制版的Arm服务器,这使得Arm阵营能获得一定的市场。

而在中国,虽然华为、飞腾等Arm服务器芯片商无法完全替代市场上的Intel CPU,但攻占一部分原本属于Intel的市场还是值得期待的。

此次,基于华为鲲鹏处理器的TaiShan服务器在浙江移动营业厅前台系统中的商用就是一个很好的契机和开端,为我国的Arm服务器发展注入了一股有生力量

2019年又迎来Hi1620,鲲鹏920则是Hi1620系列的正式品牌和型号的更多相关文章

  1. [百家号]华为:最强ARM服务器芯片,华为鲲鹏920处理器发布

    华为:最强ARM服务器芯片,华为鲲鹏920处理器发布   泡泡网 百家号2019-01-0716:11 https://baijiahao.baidu.com/s?id=162198839753232 ...

  2. [知乎]鲲鹏920对比intel8180

    作者:韩朴宇链接:https://www.zhihu.com/question/308298687/answer/568737742来源:知乎著作权归作者所有.商业转载请联系作者获得授权,非商业转载请 ...

  3. 记一次ARM服务器(鲲鹏920)的PXE批量装机遇到的坑

    由于近期项目需要,在对一批华为鲲鹏920的ARM服务器(型号为天宫TG225 B1)进行批量装机的过程中,遇到了各种各样千奇百怪的bug(换个高情商的说法就是遇到了各种各样和x86服务器不一样的地方) ...

  4. CentOS 7.6 操作系统 安装指导书 (鲲鹏920处理器) 01

    若需要手动调整预留内存大小,请参考如下配置进行调整. 以下以配置crashkernel为512M为例进行操作说明: 命令行执行命令vi /etc/default/grub,配置"crashk ...

  5. 不权威的国产CPU发展历程

    最近进行了一些国产化相关工作 趁着周末有时间,自己整理一下这段时间的学习内容. 毕竟不是处理器和芯片的业内人士,里面多有纰漏,请谅解. 希望可以作为入门学习的简单知识. 1.0 远古时代 unix 世 ...

  6. 华为鲲鹏处理器实现商用,Arm服务器又添砝码

    华为鲲鹏处理器实现商用,Arm服务器又添砝码 鲲鹏920就是华为海思1620 鲲鹏920面向 服务器CPU就是 华为海思162064core 武汉华为PC不是海思1620是另一个cpu 深圳华为PC的 ...

  7. 鲲鹏凌云,并行科技Paramon通过华为云鲲鹏云服务兼容性认证

    随着Cloud2.0时代到来,5G技术开始应用普及,超算云服务需求不断升级,业务多样性.数据多样性不断延伸.2019年7月,华为召开鲲鹏计算产业发展峰会,依托在联接领域坚实的基础,华为未来将着力打造智 ...

  8. 华为ARM64服务器上手体验--不吹不黑,用实际应用来看看TaiShan鲲鹏的表现

    背景 中美贸易冲突以来,相信最大的感受,并不是我对你加多少关税,而是我有,可我不卖给你."禁售"成了市场经济中最大的竞争力. 相信也是因为这个原因,华为"备胎转正&quo ...

  9. 不服跑个分:ARM鲲鹏云服务器实战评测——华为云鲲鹏KC1实例 vs. 阿里云G5实例【华为云技术分享】

    原文链接:https://m.ithome.com/html/444828.htm 今年一月份,华为正式发布了鲲鹏920数据中心高性能处理器,该处理器兼容ARM架构,采用7纳米制造,最高支持64核,主 ...

随机推荐

  1. OO_Unit1_Summary

    经历了十分充实(痛不欲生)的三周不一样的码代码的生活,让我对通宵oo有了新的认识.往届学长学姐诚不欺我 第一次作业 需求分析 第一次需求非常简单(相比较后两次作业而言),仅为简单多项式求导,而且仅包含 ...

  2. kernel base

    基础知识 学习网址:ctfwiki 安全客 Kernel:又称核心 维基百科:在计算机科学中是一个用来管理软件发出的数据I/O(输入与输出)要求的电脑程序,将这些要求转译为数据处理的指令并交由中央处理 ...

  3. 【笔记】《Redis设计与实现》chapter20 Lua脚本

    chapter20 Lua脚本 Redis从2.6版本开始引入对Lua脚本的支持,通过在服务器中嵌入Lua环境,Redis客户端可以使用Lua脚本,直接在服务器端原子地执行多个Redis命令 20.1 ...

  4. Ubuntu20.04安装Redis

    本文介绍了如何在Ubuntu20.04上安装Redis. 安装Redis sudo apt install redis-server 检查服务的状态 安装完成后可以通过以下命令检查服务的状态 sudo ...

  5. 【Feign】Feign ,OpenFeign以及Ribbon之间的区别?

    Ribbon Ribbon 是 Netflix开源的基于HTTP和TCP等协议负载均衡组件 Ribbon 可以用来做客户端负载均衡,调用注册中心的服务 Ribbon的使用需要代码里手动调用目标服务,请 ...

  6. Android Hook学习之ptrace函数的使用

    Synopsis #include <sys/ptrace.h> long ptrace(enum __ptrace_request request, pid_t pid, void *a ...

  7. MD5算法C/C++的实现

    博客链接:http://blog.csdn.net/qq1084283172/article/details/52334027 在逆向程序的时候,经常会碰到加密的算法的问题,前面分析UC的逆向工程师的 ...

  8. Python中的Pexpect模块的简单使用

    Pexpect 是一个用来启动子程序并对其进行自动控制的 Python 模块. Pexpect 可以用来和像 ssh.ftp.passwd.telnet 等命令行程序进行自动交互.以下所有代码都是在K ...

  9. poj2186强联通(牛仰慕)

    题意:       有一群老牛,他们之间有m组敬仰关系,关系可以传递,a仰慕b,b仰慕c,那么a就仰慕c,现在问被所有老牛都仰慕 的有多少? 思路:       想想,是不是一个环中的老牛的关系都是一 ...

  10. POJ2709 染料贪心

    题意:       要搭配出来n种颜料,每种颜料要用mi升,除了这n种颜色还有一个合成灰色的毫升数,灰色是由三种不同的颜色合成的,三种m m m 的不同颜色能合成m升灰色,然后问你满足要求至少要多少盒 ...