日前,飞腾已经完成FT-2000plus服务器CPU的研制工作,飞腾公司的合作伙伴正在积极研发相应的整机产品。FT-2000plus这款芯片是以FT2000为基础的改进版本,虽然在单核性能上和Intel还存在一定差距,但在多核性能上,已经达到Intel服务器CPU E5 主流产品的水平。

  据传,国防科大正在研发的1000P超算天河3号(性能指标是神威太湖之光的8倍),其原型机的CPU或将采用FT-2000或其后继产品作为主控CPU。考虑到在天河2A上,国防科大已经用自主研发的加速器矩阵2000取代Intel的Xeon Phi计算卡。从今往后,天河系列超算也将和神威系列超算一样,彻底告别国外CPU或加速器,实现芯片的全国产化。


  (网传天河3号原型机计算节点,板上有2片FT-2000,业内专家告诉笔者,这是误传)

  FT-2000系列芯片是厚积薄发的结果

  近年来,国内某些企业热衷于“走捷径”,先后与Intel、IBM、ARM、高通等国外芯片巨头技术合作或合资,有的公司把国外的CPU IP授权买回来做集成,就宣传是自主知识产权,甚至还有公司将国外的芯片包装一下变成国产芯片。

  虽然这种走捷径的做法可以在短时间内拿出性能不错的芯片,但由于国外公司始终怀有“教会徒弟、饿死师傅”心理,不会将最先进的技术授权给中国,而且国内单位在拿到国外技术授权后,容易陷入知其然,不知其所以然的困境,不具备技术发展的可持续性,在国外公司开发出下一代产品之后,只能再次引进国外技术。

  相比之下,飞腾选择了较为困难的自主研发道路,虽然发展会慢一些,但更具后劲。早在十多年前,飞腾就基于IA-64指令集设计CPU,之后又以Sparc开源代码为基础设计了FT-1000和FT-1500两款CPU,FT-1000被用于天河1号超算,FT-1500被用于天河2号超算。在2012年前后,飞腾选择了ARM阵营,获得了ARM指令集授权,可以基于ARM 64指令集设计自己的CPU。并在数年时间里先后开发出了FTC660、FTC661两款CPU核,以及FT-1500A/4、FT-1500A/16、FT-2000、FT-2000plus等CPU。

  FT-1500A/4被用于PC和笔记本,采用28nm制造工艺。集成了4个FTC660 CPU核,主频1.5GHz—2.0GHz,集成了2MB二级cache和8MB三级cache,集成了2个DDR3-1600存储控制器,可提供25.6GB/s访存带宽,最大功耗为15W。

  FT-1500A/16被用于服务器,采用28nm制造工艺。集成了16个FTC660 CPU核,主频1.5GHz,集成了8MB二级cache和8MB三级cache,集成了4个DDR3-1600存储控制器,可提供51.2GB/s访存带宽,最大功耗为35W。

  FT-2000采用28nm制造工艺,可被用于超算计算节点和高性能服务器。集成了64个FTC661处理器核。工作主频1.5GHz—2.0GHz。集成了32MB二级cache,扩展支持128MB三级cache。支持16个DDR3-1600存储控制器,可提供204.8GB/s访存带宽。


  最新的FT-2000Plus采用了台积电16nm制造工艺,主频为2.0GHz—2.4GHz,集成了64个FTC661处理器核。为了提高集成度,抛弃了L3cache,将DDR4内存控制器集成到了片内。目前,飞腾系列CPU已经形成了一个家族,可满足党政军多个领域的实际需求。

  足以和Intel主流服务器抗衡 CPU 在国内ARM服务器CPU中处于领跑位置

  根据实际测试FT-2000在2GHz主频下,采用GCC4.8编译器,SPEC2006的测试成绩分别为SPECint_rate2006:570、 SPECfp_rate2006:482,与Intel Xeon E5-2695v3相当。

  而最新的FT-2000Plus因为删除了L3导致在SPEC测试中某些子项分数下降,把集成DDR4等改进带来的提升抹平了,使FT-2000Plus在同主频下与FT-2000的性能相差不大。那飞腾公司为何要这么做呢?原因应该是为了商业化,提高FT-2000plus的集成度可以方便主机厂,降低开发FT-2000plus整机产品的成本。不过,在使用了更好的台积电16nm制造工艺之后主频可以最高稳定到2.4G,使FT-2000plus相对于FT-2000还是有不小的性能提升,能够满足高端服务器和超算主控CPU的性能要求。

  近年来,不少厂家都开始着手开发ARM服务器CPU。在国内,华为和华芯通也在着手开发ARM服务器CPU。不过,就目前而言,飞腾的ARM服务器CPU在性能上处于绝对领先地位。

  华芯通是中国大陆与高通成立的合资公司,从高通手中获得了源码并基于该源码设计自己的CPU。不过,由于华芯通北京研发中心启用时日尚短,正式商用产品问世尚需时日。

  相比之下,华为研发ARM服务器CPU的时间要早得多,而且在北京和美国都有研发中心,已经有产品Hi1612问世。虽然在宣传上,华为声称Hi1612是“自主研发”,“除存储单元外均具有完整知识产品”,但其实上,这款服务器CPU采用台积电16nm制造工艺,其内核是ARM Cortex A57。

  而且Hi1612的性能也比较一般,也许是因为华为缺乏服务器CPU设计经验,这款服务器CPU的性能相对有限,以飞腾的FT2000作参照,华为的这款服务器CPU在制造工艺领先2代的情况下,以FT2000一半的功耗实现了不足FT2000一半的性能。

  不过,据小道消息,华为的下一款ARM服务器正在研发中,而且位于龙芯公司斜对门的华为北京研发中心已经拿ARM Cortex A72修改了至少2个版本(华为有钱,买了ARM的“大礼包”),加上位于美国的研发中心可以提供技术支持,在有ARM Cortex A72为基础的情况下,华为的下一款ARM服务器CPU的性能值得期待。

  结语

  诚然,FT-2000/FT-2000plus还是存在一些短板的,比如单线程性能偏弱。无论是FT2000,还是FT-2000plus,虽然在多线程性能上达到了Intel中高端服务器CPU的性能,但在单线程性能上,还是有不小的差距——即便主频控制在2.5GHz,Intel的服务器CPU的SPECint_base2006的成绩也在25以上,而FT2000的SPECint_base2006只有12.4(@2.0GHz),FT-2000plus预计也只有14+分(@2.4GHz)。

  软件生态也是一个问题,由于飞腾选择了跟随ARM生态的道路,使飞腾的商业化推广很大程度上取决于ARM生态的完善情况。而在服务器生态上,ARM和X86相比差距较大,这也非常不利于FT-2000/FT-2000plus的商业化。

  不过,万事开头难,迄今为止,湖南长城银河公司、湘计海盾公司、航天706所已经推出了基于新一代飞腾微处理器的自主可控产品。


  (飞腾CPU整机产品)

  长城银河公司就开发出了EF111系列计算服务器、智恒AF21B一体机、致翔NF15N笔记本电脑和世恒KF510系列桌面型台式计算机等整机产品。其中,EF111系列计算服务器基于全新一代国产FT2000 Plus 处理器的高性能服务器,可应用于ERP、高性能数据库、虚拟化和商业智能、大数据分析等领域。航天科工二院 706所也推出天玥64核高端机架式服务器。

  根据公开资料显示,天河3号的原型机已经选定FT-2000系列芯片作为其计算节点上使用的CPU。这不仅对天河超算摆脱进口芯片掣肘是一个好消息,对于FT-2000来说,也是一个非常好的广告。

http://laoyaoba.com/ss6/html/97/n-651997.html

中国新超算彻底告别进口CPU 国产芯片已可与国外抗衡的更多相关文章

  1. [转帖]中国新超算彻底告别进口CPU 国产芯片已可与国外抗衡

    中国新超算彻底告别进口CPU 国产芯片已可与国外抗衡 蓝天·2017-10-17·本土IC 来源: 观察者网 https://www.laoyaoba.com/html/news/newsdetail ...

  2. 国产芯片任重道远 国科微SSD主控芯片的“追赶之路”(不能只提供一颗芯片,而是要将芯片、国密算法、固件Firmware、BIOS和操作系统紧密联系在一起,变成完整解决方案交给行业用户,才能真正体现自身的价值)

    集微网消息,“中国芯”战略之路道阻且长,踏入这个赛道的攻坚者们需要十年如一日的技术突破,需要集合产业势能,共同协作,方能建立中国核心技术真正的竞争力. 国产化之路任重道远,SSD芯片初见成效 信息时代 ...

  3. 舌尖上的硬件:CPU/GPU芯片制造解析(高清)(组图)

    一沙一世界,一树一菩提,我们这个世界的深邃全部蕴藏于一个个普通的平凡当中.小小的厨房所容纳的不仅仅是人们对味道的情感,更有推动整个世界前进的动力.要想理解我们的世界,有的时候只需要细细品味一下我们所喜 ...

  4. 中国自主X86处理器工艺跃进:国产28nm升级16nm(上海兆芯)

    提到X86处理器,世人皆知Intel.AMD,殊不知还有个VIA(威盛),在Intel反垄断世纪大战中VIA公司作为Intel霸权的受害者也最终确认了X86授权,不过VIA与前面两家的实力相差太远,X ...

  5. 中国的规模优势,有望帮助AI芯片后来者居上?

    ​芯片一直是个神奇的东西,表面上看是电脑.笔记本.智能手机改变了世界,其实,真正改变世界的硬件内核是芯片,芯片相关的技术才是科技界最实用.最浪漫的基础技术,也正因如此,谁掌握了芯片基础技术,谁就能立于 ...

  6. 新安装的wampserver怎么使用本机已有的mysql作为数据库

    一般在一台没有安装mysql的机器上安装好wamp后,能够直接在wamp的phpMyAdmin中打开集成的mysql并设置用户信息. 而假设之前已经安装配置好mysql(实usernamepasswo ...

  7. WIN8系统中 任务管理器 性能栏 显示CPU利用率(已暂停)怎么回事?

    解决办法: 点上方的 查看--更新速度--普通

  8. 国产芯片选型手册及厂商名录 版本V2019

  9. 国产芯片DP9637-K总线收发器替代L9637D芯片和SI9241

    DP9637可以替代L9637D,低成本解决方案,只需要做简单硬件修改,感兴趣可以留言或者联系小编了解详细资料.   主要特性    电压工作范围 6V≤VBAT≤36V    具有超低休眠电流 ...

随机推荐

  1. C#+AE实现类似IDentify功能及对高亮显示相关接口的总结

    kenika 原文C#+AE实现类似IDentify功能及对高亮显示相关接口的总结 ArcMap中的Identify功能是有目的查看要素(Feature)属性信息经常使用的工具.ArcMap中的Ide ...

  2. centos 查询DNS

    cat  /etc/resolv.conf

  3. strace跟踪线程调用

    方法一:strace -fp pid , 可以跟踪所有线程, 进程的系统调用. [root@xxxx]strace -p 24091 Process xxx attached - interrupt ...

  4. Java提高:采用异常链传递异常

    一.分析 异常需要封装,但是仅仅封装还是不够的,还需要传递异常.一个系统的友好型的标识,友好的界面功能是一方面,另一方面就是系统出现非预期的情况的处理方式了. 二.场景 比如我们的JEE项目一般都又三 ...

  5. [Elm] Installing and setting up Elm

    Before writing any Elm we need to first install the runtime locally. In this lesson we install the E ...

  6. 【25.64%】【codeforces 570E】Pig and Palindromes

    time limit per test4 seconds memory limit per test256 megabytes inputstandard input outputstandard o ...

  7. js实现金额小写转大写

    function convertCurrency(currencyDigits) { var MAXIMUM_NUMBER = 1000000000000.00; var CN_ZERO = &quo ...

  8. C语言高速入门系列(五)

    C语言高速入门系列(五) C语言指针初涉                                           ------转载请注明出处:coder-pig 本节引言: 上一节我们对C ...

  9. cannot mount database in EXCLUSIVE mode

    http://blog.csdn.net/xyz846/article/details/6684638

  10. AlphaImageLoader用法

    在 IE6 中,能够非常方便地利用 img 的 src 属性,实现本地图片预览,然而在 IE7 中,这样的办法却行不通.须要用 AlphaImageLoader. AlphaImageLoader 说 ...