日前,飞腾已经完成FT-2000plus服务器CPU的研制工作,飞腾公司的合作伙伴正在积极研发相应的整机产品。FT-2000plus这款芯片是以FT2000为基础的改进版本,虽然在单核性能上和Intel还存在一定差距,但在多核性能上,已经达到Intel服务器CPU E5 主流产品的水平。

  据传,国防科大正在研发的1000P超算天河3号(性能指标是神威太湖之光的8倍),其原型机的CPU或将采用FT-2000或其后继产品作为主控CPU。考虑到在天河2A上,国防科大已经用自主研发的加速器矩阵2000取代Intel的Xeon Phi计算卡。从今往后,天河系列超算也将和神威系列超算一样,彻底告别国外CPU或加速器,实现芯片的全国产化。


  (网传天河3号原型机计算节点,板上有2片FT-2000,业内专家告诉笔者,这是误传)

  FT-2000系列芯片是厚积薄发的结果

  近年来,国内某些企业热衷于“走捷径”,先后与Intel、IBM、ARM、高通等国外芯片巨头技术合作或合资,有的公司把国外的CPU IP授权买回来做集成,就宣传是自主知识产权,甚至还有公司将国外的芯片包装一下变成国产芯片。

  虽然这种走捷径的做法可以在短时间内拿出性能不错的芯片,但由于国外公司始终怀有“教会徒弟、饿死师傅”心理,不会将最先进的技术授权给中国,而且国内单位在拿到国外技术授权后,容易陷入知其然,不知其所以然的困境,不具备技术发展的可持续性,在国外公司开发出下一代产品之后,只能再次引进国外技术。

  相比之下,飞腾选择了较为困难的自主研发道路,虽然发展会慢一些,但更具后劲。早在十多年前,飞腾就基于IA-64指令集设计CPU,之后又以Sparc开源代码为基础设计了FT-1000和FT-1500两款CPU,FT-1000被用于天河1号超算,FT-1500被用于天河2号超算。在2012年前后,飞腾选择了ARM阵营,获得了ARM指令集授权,可以基于ARM 64指令集设计自己的CPU。并在数年时间里先后开发出了FTC660、FTC661两款CPU核,以及FT-1500A/4、FT-1500A/16、FT-2000、FT-2000plus等CPU。

  FT-1500A/4被用于PC和笔记本,采用28nm制造工艺。集成了4个FTC660 CPU核,主频1.5GHz—2.0GHz,集成了2MB二级cache和8MB三级cache,集成了2个DDR3-1600存储控制器,可提供25.6GB/s访存带宽,最大功耗为15W。

  FT-1500A/16被用于服务器,采用28nm制造工艺。集成了16个FTC660 CPU核,主频1.5GHz,集成了8MB二级cache和8MB三级cache,集成了4个DDR3-1600存储控制器,可提供51.2GB/s访存带宽,最大功耗为35W。

  FT-2000采用28nm制造工艺,可被用于超算计算节点和高性能服务器。集成了64个FTC661处理器核。工作主频1.5GHz—2.0GHz。集成了32MB二级cache,扩展支持128MB三级cache。支持16个DDR3-1600存储控制器,可提供204.8GB/s访存带宽。


  最新的FT-2000Plus采用了台积电16nm制造工艺,主频为2.0GHz—2.4GHz,集成了64个FTC661处理器核。为了提高集成度,抛弃了L3cache,将DDR4内存控制器集成到了片内。目前,飞腾系列CPU已经形成了一个家族,可满足党政军多个领域的实际需求。

  足以和Intel主流服务器抗衡 CPU 在国内ARM服务器CPU中处于领跑位置

  根据实际测试FT-2000在2GHz主频下,采用GCC4.8编译器,SPEC2006的测试成绩分别为SPECint_rate2006:570、 SPECfp_rate2006:482,与Intel Xeon E5-2695v3相当。

  而最新的FT-2000Plus因为删除了L3导致在SPEC测试中某些子项分数下降,把集成DDR4等改进带来的提升抹平了,使FT-2000Plus在同主频下与FT-2000的性能相差不大。那飞腾公司为何要这么做呢?原因应该是为了商业化,提高FT-2000plus的集成度可以方便主机厂,降低开发FT-2000plus整机产品的成本。不过,在使用了更好的台积电16nm制造工艺之后主频可以最高稳定到2.4G,使FT-2000plus相对于FT-2000还是有不小的性能提升,能够满足高端服务器和超算主控CPU的性能要求。

  近年来,不少厂家都开始着手开发ARM服务器CPU。在国内,华为和华芯通也在着手开发ARM服务器CPU。不过,就目前而言,飞腾的ARM服务器CPU在性能上处于绝对领先地位。

  华芯通是中国大陆与高通成立的合资公司,从高通手中获得了源码并基于该源码设计自己的CPU。不过,由于华芯通北京研发中心启用时日尚短,正式商用产品问世尚需时日。

  相比之下,华为研发ARM服务器CPU的时间要早得多,而且在北京和美国都有研发中心,已经有产品Hi1612问世。虽然在宣传上,华为声称Hi1612是“自主研发”,“除存储单元外均具有完整知识产品”,但其实上,这款服务器CPU采用台积电16nm制造工艺,其内核是ARM Cortex A57。

  而且Hi1612的性能也比较一般,也许是因为华为缺乏服务器CPU设计经验,这款服务器CPU的性能相对有限,以飞腾的FT2000作参照,华为的这款服务器CPU在制造工艺领先2代的情况下,以FT2000一半的功耗实现了不足FT2000一半的性能。

  不过,据小道消息,华为的下一款ARM服务器正在研发中,而且位于龙芯公司斜对门的华为北京研发中心已经拿ARM Cortex A72修改了至少2个版本(华为有钱,买了ARM的“大礼包”),加上位于美国的研发中心可以提供技术支持,在有ARM Cortex A72为基础的情况下,华为的下一款ARM服务器CPU的性能值得期待。

  结语

  诚然,FT-2000/FT-2000plus还是存在一些短板的,比如单线程性能偏弱。无论是FT2000,还是FT-2000plus,虽然在多线程性能上达到了Intel中高端服务器CPU的性能,但在单线程性能上,还是有不小的差距——即便主频控制在2.5GHz,Intel的服务器CPU的SPECint_base2006的成绩也在25以上,而FT2000的SPECint_base2006只有12.4(@2.0GHz),FT-2000plus预计也只有14+分(@2.4GHz)。

  软件生态也是一个问题,由于飞腾选择了跟随ARM生态的道路,使飞腾的商业化推广很大程度上取决于ARM生态的完善情况。而在服务器生态上,ARM和X86相比差距较大,这也非常不利于FT-2000/FT-2000plus的商业化。

  不过,万事开头难,迄今为止,湖南长城银河公司、湘计海盾公司、航天706所已经推出了基于新一代飞腾微处理器的自主可控产品。


  (飞腾CPU整机产品)

  长城银河公司就开发出了EF111系列计算服务器、智恒AF21B一体机、致翔NF15N笔记本电脑和世恒KF510系列桌面型台式计算机等整机产品。其中,EF111系列计算服务器基于全新一代国产FT2000 Plus 处理器的高性能服务器,可应用于ERP、高性能数据库、虚拟化和商业智能、大数据分析等领域。航天科工二院 706所也推出天玥64核高端机架式服务器。

  根据公开资料显示,天河3号的原型机已经选定FT-2000系列芯片作为其计算节点上使用的CPU。这不仅对天河超算摆脱进口芯片掣肘是一个好消息,对于FT-2000来说,也是一个非常好的广告。

http://laoyaoba.com/ss6/html/97/n-651997.html

中国新超算彻底告别进口CPU 国产芯片已可与国外抗衡的更多相关文章

  1. [转帖]中国新超算彻底告别进口CPU 国产芯片已可与国外抗衡

    中国新超算彻底告别进口CPU 国产芯片已可与国外抗衡 蓝天·2017-10-17·本土IC 来源: 观察者网 https://www.laoyaoba.com/html/news/newsdetail ...

  2. 国产芯片任重道远 国科微SSD主控芯片的“追赶之路”(不能只提供一颗芯片,而是要将芯片、国密算法、固件Firmware、BIOS和操作系统紧密联系在一起,变成完整解决方案交给行业用户,才能真正体现自身的价值)

    集微网消息,“中国芯”战略之路道阻且长,踏入这个赛道的攻坚者们需要十年如一日的技术突破,需要集合产业势能,共同协作,方能建立中国核心技术真正的竞争力. 国产化之路任重道远,SSD芯片初见成效 信息时代 ...

  3. 舌尖上的硬件:CPU/GPU芯片制造解析(高清)(组图)

    一沙一世界,一树一菩提,我们这个世界的深邃全部蕴藏于一个个普通的平凡当中.小小的厨房所容纳的不仅仅是人们对味道的情感,更有推动整个世界前进的动力.要想理解我们的世界,有的时候只需要细细品味一下我们所喜 ...

  4. 中国自主X86处理器工艺跃进:国产28nm升级16nm(上海兆芯)

    提到X86处理器,世人皆知Intel.AMD,殊不知还有个VIA(威盛),在Intel反垄断世纪大战中VIA公司作为Intel霸权的受害者也最终确认了X86授权,不过VIA与前面两家的实力相差太远,X ...

  5. 中国的规模优势,有望帮助AI芯片后来者居上?

    ​芯片一直是个神奇的东西,表面上看是电脑.笔记本.智能手机改变了世界,其实,真正改变世界的硬件内核是芯片,芯片相关的技术才是科技界最实用.最浪漫的基础技术,也正因如此,谁掌握了芯片基础技术,谁就能立于 ...

  6. 新安装的wampserver怎么使用本机已有的mysql作为数据库

    一般在一台没有安装mysql的机器上安装好wamp后,能够直接在wamp的phpMyAdmin中打开集成的mysql并设置用户信息. 而假设之前已经安装配置好mysql(实usernamepasswo ...

  7. WIN8系统中 任务管理器 性能栏 显示CPU利用率(已暂停)怎么回事?

    解决办法: 点上方的 查看--更新速度--普通

  8. 国产芯片选型手册及厂商名录 版本V2019

  9. 国产芯片DP9637-K总线收发器替代L9637D芯片和SI9241

    DP9637可以替代L9637D,低成本解决方案,只需要做简单硬件修改,感兴趣可以留言或者联系小编了解详细资料.   主要特性    电压工作范围 6V≤VBAT≤36V    具有超低休眠电流 ...

随机推荐

  1. 每天一个JavaScript实例-操作元素定位元素

    <!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content ...

  2. BAPC2014 C&amp;&amp;HUNNU11583:Citadel Construction(几何)

    题意: 给出一系列的点,要求寻找最多4个点.使得组成一个面积最大的多边形 思路: 非常显然仅仅有两种情况.要么是三角形,要么是四边形 首先不难想到的是.先要把最外面的点都找出来,事实上就是找凸包 可是 ...

  3. 在windows下远程访问linux服务器

    在网络性能.安全性.可管理性上,Linux有着其他系统无法比拟的强大优势,而服务器对这些方面要求特别高,因此Linux常常被用来做服务器使用.而当我们需要维护linux服务器的时候,就需要远程访问li ...

  4. 【codeforces 754D】Fedor and coupons

    time limit per test4 seconds memory limit per test256 megabytes inputstandard input outputstandard o ...

  5. [React Router v4] Render Catch-All Routes with the Switch Component

    There are many cases where we will need a catch-all route in our web applications. This can include ...

  6. 古语云:工欲善其事必先利其器 --> 最新、最全的 IntelliJ IDEA(2018.3.3) 的介绍、安装、破解、配置与使用

    原文:古语云:工欲善其事必先利其器 --> 最新.最全的 IntelliJ IDEA(2018.3.3) 的介绍.安装.破解.配置与使用 一.IntelliJ IDEA 介绍 -> Ecl ...

  7. 深度学习基础(十二)—— ReLU vs PReLU

    从算法的命名上来说,PReLU 是对 ReLU 的进一步限制,事实上 PReLU(Parametric Rectified Linear Unit),也即 PReLU 是增加了参数修正的 ReLU. ...

  8. 【BZOJ 1007】 [HNOI2008]水平可见直线

    [题目链接]:http://www.lydsy.com/JudgeOnline/problem.php?id=1007 [题意] [题解] 这个人讲得很好 http://blog.csdn.net/o ...

  9. 学习web开发遇到几个细节问题

    1.在jsp中使用jsp表达式在input标签中时,避免直接和结束"/"相连 2.提取input select 标签内的内容,使用...value提取其值 3.form中含有一个o ...

  10. 使用CentOS7卸载自带jdk安装自己的JDK1.8

    不管在什么地方,什么时候,学习是快速提升自己的能力的一种体现!!!!!!!!!!! 关于JDK1.8 与之前的版本相比有哪些变化和新特性我也不在这详细的说明了,毕竟一度娘啥都有了,既然不多说那就直接开 ...