eFPGA:冉冉升起的新星

eFPGA即嵌入式FPGA(embedded FPGA),是近期兴起的新型电路IP。

随着摩尔定律越来越接近瓶颈,制造ASIC芯片的成本越来越高。因此,设计者会希望ASIC能实现一定的可配置性,同时又不影响性能。在希望能做成可配置的模块中,负责与其他芯片或者总线通信的接口单元又首当其冲。在芯片中,模块间的通信往往使用简单的并行接口或者配合简单的时序逻辑,但是在芯片间通信时为了保证可靠性,必须通过一系列握手(handshake)协议来完成通信接口。设计者往往希望自己的SoC能够与市面上尽可能多的其他芯片通信,然而市场上的芯片通信接口并没有一个统一标准,同时一些通信协议也在随着时间不断更新换代,因此芯片间通信往往需要一些中介(bridge)芯片。事实上,使用FPGA芯片作为芯片间通信的中介已经是很常见的做法,因为FPGA具有可配置性,因此可以作为通用通信中介。例如,Apple在iPhone7中集成了一小块Lattice的FPGA芯片,据推测就是为了实现芯片间的通信中介和可配置互联。然而,在硬件系统中使用额外的通信中介芯片成本较高,而且也不利于维护,那么,有没有集成度更高的方案呢?这时候,eFPGA就应运而生,通过把一小块FPGA电路IP集成到SoC中充当接口握手协议处理单元,可以大大提高SoC接口的灵活性,因此能与不同的其他芯片进行通信。

除此之外,随着目前异构计算架构的兴起,eFPGA又看到了一种新的可能,即在SoC上实现高集成度的异构计算,让eFPGA随着系统的需求在处理不同的应用时配置成不同的模块。这与Intel收购Altera FPGA的终极目标相同,只是Intel收购Altera之后,Altera的FPGA IP只会集成在Intel的芯片上,而eFPGA厂商则可以把IP提供给任何花钱购买的客户。

eASIC概念第一次进入大众视野可以说是2014年,由UCLA的Cheng C. Wang,Fang-Li Yuan和Dejan Markovic等人在ISSCC发表的文章,“A Multi-Granularity FPGA With Hierarchical Interconnects for Efficient and Flexible Mobile Computing”。在这篇文章中,作者们通过创造性地设计互联单元,一举解决了FPGA的功耗、性能和成本受到布线资源限制的问题,从而使得eASIC集成到SoC中真正变为可能,而该论文也因其突出贡献获得了ISSCC Lewis Award。之后,Cheng C. Wang,Fang-Li Yuan和Dejan Markovic就利用该论文中的成果成立了FlexLogix,推广eFPGA的概念,并使其真正能够商用化。

到了今年,eFPGA的概念已经获得了业界的广泛认可,而该领域的公司也在慢慢变多。在前几天举行的ARM TechCon中,我们看到了四家公司,分别是FlexLogix,Achronix,QuickLogic以及Menta。

FlexLogix作为eFPGA的先驱,在本届ARM TechCon上推出的新亮点是用于2.5D封装的小型FPGA芯片。该芯片主要解决的问题是,如果ASIC使用成熟工艺(如65nm)实现,但是eFPGA在65nm上跑不到预期的性能怎么办?使用FlexLogix的小型FPGA芯片,就可以把16nm的eFPGA和65nm的ASIC使用硅载片(silicon interposer)之类的2.5D封装技术集成到一起,从而实现客户所需要系统性能。

Achronix的亮点则是高速eFPGA IP。其最新一代的Speedcore IP将会在TSMC 7nm工艺上实现,从而实现最强的性能。另外,Achronix的Speedster FPGA芯片也在出货中。作为首家eFPGA进入量产芯片的公司,Achronix2016-2017年收入猛增,值得关注。

QuickLogic是老牌FPGA厂商,现在也加入了eFPGA的战场,为我们带来了ArcticPro系列IP。其主要市场是超低功耗SoC市场,例如蓝牙、物联网等等,它的eFPGA将给这些超低功耗SoC带来可配置性,从而实现更好的功耗与成本。另外,QuickLogic的eFPGA支持以性价比高著称的SMIC,也是其一大亮点。

Menta与之前三家相比,其最大的亮点是可移植性最好,因为之前三家公司提供的eFPGA都是GDS硬IP,而Menta能够提供RTL软IP,因此可以轻松移植到不同的工艺上。

FPGA SoC:老树发新枝

如果说eFPGA是往SoC里面加入FPGA的话,那么FPGA SoC的概念就是在FPGA里面加上了处理器。FPGA经过这么多年的发展,已经不只是验证设计的平台,而变成了一种独立的设计实现方式。FPGA可快速重配置的特点使它在许多对灵活性有要求的平台如鱼得水。

为了能从外部方便地控制FPGA,往往需要在FPGA里面实现一个微处理器以运行操作系统以及相关程序,然后把程序中可加速的部分使用FPGA里面的可配置逻辑高效执行。虽然程序中的大部分运算都可以由FPGA加速,但是操作系统部分却可能成为整体实现的瓶颈:在传统FPGA中,微处理器往往会用软核(如MicroBlaze)在FPGA上实现,因此比起用来加速的逻辑部分,微处理器的运行速度会比较慢(时钟频率<100 MHz),从而拖慢了整体系统的效率。有鉴于此,Altera和Xilinx都推出了自己的方案,即在FPGA芯片内集成一个微处理器硬核(如ARM系列处理器)。该硬核不使用FPGA而是由定制逻辑实现,因此可以跑在很高的时钟频率(~1GHz甚至更高)。因此,在FPGA SoC中,处理器性能不再成为瓶颈,从而使整体系统实现更高性能。

目前Xilinx和Altera都已经推出了FPGA SoC相关产品,并且获得了用户的一致认可。然而,FPGA SoC的前景远远不止FPGA+高速处理器硬核。大家知道,FPGA开发生态发展较慢,一个重要原因就是硬件逻辑代码编写的学习曲线非常陡峭,导致开发者敬而远之。为了减少开发者的学习成本并加快开发速度,FPGA厂商纷纷推出高级综合工具(high-level synthesis),可以直接把C语言之类的高级语言翻译成RTL,从而大大简化FPGA硬件开发。而FPGA SoC配合高级综合工具双剑合璧能让整个开发流程更简单:首先开发者用C写传统ARM上能跑的程序代码,之后高级综合工具把代码中能够用FPGA加速的部分转化成RTL并用FPGA硬件实现,而代码的其他部分则跑在FPGA SoC中的ARM硬核上面。这样就让高性能FPGA开发变得非常容易,可望在未来让更多开发者能加入FPGA生态。

eFPGA与FPGA SoC,谁将引领下一代可编程硬件之潮流?

那么,eFPGA IP和FPGA SoC,谁将在未来更受欢迎呢?笔者认为,这两种生态都表明了SoC在摩尔定律遇到瓶颈的今天走向可配置的潮流,只是eFPGA从SoC的角度出发,而FPGA SoC则是从传统FPGA的角度出发。这有点类似之前的微处理器,以Intel代表的传统处理器芯片提供商的技术发展路径是以处理器为本,并在处理器芯片中集成更多多媒体处理单元,例如集成显卡,使得处理器更接近SoC;而以ARM为代表的IP提供商则是提供处理器IP,为ASIC中集成合适的处理器IP成为实用的SoC变得更方便。这两种生态将会同时存在,然后随着市场的发展或许会在某个中间点融合在一起。让我们拭目以待!

eFPGA与FPGA SoC,谁将引领下一代可编程硬件之潮流?|半导体行业观察的更多相关文章

  1. Altera FPGA SoC搭建步骤

    Altera SoC 官方搭建指南: https://rocketboards.org/foswiki/Documentation/EmbeddedLinuxBeginnerSGuide 官方文档中除 ...

  2. 阿里巴巴IPv6应用平台引领下一代互联网

    摘要: 据预测,到2020年底我国IPv6终端设备将达到5亿,正在快速取代IPv4.阿里巴巴网络架构师张先国先生在2018 年GNTC 大会IPv6 专场上分享IPv6应用集团业务(支付宝.淘宝.天猫 ...

  3. 我的 FPGA 学习历程(04)—— 练习 verilog 硬件描述语言

    这篇讲的是使用 verilog 硬件描述语言编写一个 3 - 8 译码器. 3 - 8 译码器是一个简单的组合逻辑,用于实现并转串,其输入输出关系如下: | 输入  |  输出  | -------- ...

  4. FPGA的新变化

    FPGA SoC通过融合FPGA和ASIC两者的元件,跨越了灵活性和性能之间的界限.但随着它们进入高安全性.任务关键型市场,它们也面临着与标准SoC相同的问题,包括在日益复杂的器件中快速传输越来越多的 ...

  5. FPGA最全科普总结

    FPGA最全科普总结   FPGA 是可以先购买再设计的"万能"芯片.FPGA (Field Programmable Gate Array)现场可编程门阵列,是在硅片上预先设计实 ...

  6. [转帖]从光刻机的发展,看懂ASML为何是不可取替

    从光刻机的发展,看懂ASML为何是不可取替 http://mini.eastday.com/mobile/171230223351249.html# 2017-12-30 22:33    来源:半导 ...

  7. More Moore and More than Moore

    More Moore and More than Moore ——基于硅光电子学探讨摩尔定律的延续和发展 1965年4月,<电子学>杂志第114页上刊载了Intel创始人之一戈登·摩尔(G ...

  8. Intel收购半导体设计公司eASIC

    来源:本文由公众号 半导体行业观察(ID:icbank)翻译自「anandtech」,谢谢. 北京时间今天凌晨,Intel宣布收购了半导体设计公司eASIC. eASIC的商业模式介于传统Fables ...

  9. [转帖]DRAM芯片战争,跨越40年的生死搏杀

    DRAM芯片战争,跨越40年的生死搏杀 超级工程一览 ·2017-08-20 12:50·半导体行业观察 阅读:1.4万 来源:内容来自超级工程一览 , 谢谢. DRAM是动态随机存储器的意思,也就是 ...

随机推荐

  1. 832. Flipping an Image (5月22日 )

    解答 class Solution { public: vector<vector<int>> flipAndInvertImage(vector<vector<i ...

  2. linux下安装protobuf及cmake编译

    一.protobuf 安装 protobuf版本:2.6.1 下载地址:https://github.com/google/protobuf/archive/v2.6.1.zip 解压之后进入目录 修 ...

  3. BootStrapValidate 简单使用

    前阵子用了bootstrapvalidate写了一个登录验证,这里小记一笔 首先需要引入 bootstrapValidator.css //可不引入 jquery-2.1.0.min.js boots ...

  4. 【visual studio code 的python开发环境搭建 】

    打开vs code,按按F1或者Ctrl+Shift+P打开命令行,然后输入ext install 输入Python,选第一个,这个用的最多,支持自动补全代码等功能,点击安装按钮,即可安装 下面试着编 ...

  5. Delphi判断某个类是否实现了某个接口

    通过TObject.GetInterface可以获得对象的实例实现某个接口,前提条件是必须实例化对象后才能运行GetInterface 下面的方法可获取类是否实现了某个接口,并返回接口的偏移: fun ...

  6. s3c6410 RomCode文档读后总结

    最近无意中看到一篇关于s3c6410 RomCode的介绍,结合自己的经验,做个总结. 首先贴张图,具体描述下该芯片的启动方式及具体流程. 因为s3c6410的板子多数是从SD或者Nand方式启动,重 ...

  7. 自学tensorflow——1.框架初步了解以及构建简单的计算图计算

    1.初步了解 tensorflow是谷歌的一款开源深度学习框架.运行前,需要先定义好计算图,最后通过会话启动计算图,这么做的目的是为了防止数据在python和c++(tensorflow底层)传输的时 ...

  8. 最短寻道优先算法(SSTF)——磁盘调度管理

    原创 最近操作系统实习,敲了实现最短寻道优先(SSTF)——磁盘调度管理的代码. 题目阐述如下: 设计五:磁盘调度管理 设计目的: 加深对请求磁盘调度管理实现原理的理解,掌握磁盘调度算法. 设计内容: ...

  9. Hive中Join的类型和用法

    关键字:Hive Join.Hive LEFT|RIGTH|FULL OUTER JOIN.Hive LEFT SEMI JOIN.Hive Cross Join Hive中除了支持和传统数据库中一样 ...

  10. Flex4中的拖动技术

    下面列一个最简单的例子,在Flex中,拖动原来如此简单 ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 <?xm ...