摘要:

数据中心网络的需求增长意味着许多组成技术不在研究社区的预算之内。 NETFPGA SUME是基于FPGA的PCI Express板,具有I / O功能,可作为网络接口卡,多端口开关,防火墙或测试和测量环境进行Gbps的操作。 NETFPGA SUME提供了可行的开发环境,既可以重用现有的代码库,又可以启用新的设计。

背景/问题:

数据中心的增长促使采用更快的网络,刺激数据中心内更多计算机的连接,并激发新的网络管理方法。带宽聚合超过100 Gbps到数十Tbps的情况,甚至对于中等程度的机器互连也越来越普遍,灵活、可扩展和可管理的数据中心互连甚至迫使基本链路速率远远超过100 Gbps。因此,基本网络基础结构也被推到了100 Gbps以上,这样的进步为研发Web负载平衡和拒绝服务防御、最小长度的数据包以100 Gbps线速进行入侵检测以及100 Gbps网络测试和捕获带来了挑战。

即使是像OpenFlow这样的灵活交换系统,其后代也将需要适应以100 Gbps端口速度进行常规操作,随着主机板适配器(HBA)扩展到100 Gbps以上,计算挑战也出现了。

实际上,研究人员必须原型化新想法,无论是以100 Gbps的速度查找或分类算法,还是使用性能超过100 Gbps的原型平台在部署中测试更大的结构。为了提供新一代设计,研究人员必须以与现代数据中心部署相当的速度和规模来设计,制造和评估原型。

高速数据中心互连的实际研究社区经验是有限的,通常是由费用引起的,但也受到商品系统的功能和灵活性的限制。研究人员可以选择两种途径:他们可以从少量可重新编程的商品高速硬件产品中进行选择,这些产品是从头开始构建的或提供有限的重用性;或者他们可以使用开源系统,从而实现更大的协作和更高质量的研究,并具有可复制的已发表结果

解决方法:

NetFPGA项目作为开源项目已取得成功。除了简化协作之外,开源还可以加快设计过程,并允许采用可靠的研究方法,从而可以在更广泛的社区中实现可重复性和思想的直接比较。尽管开源软件已成为事实上的标准,但包括硬件在内的完整开源平台仍然稀缺,尤其是对于高带宽解决方案而言。

我们引入了一个新的NetFPGA开源平台——NetFPGA SUME:它的硬件是10 Gbps和40 Gbps应用快速原型制作的理想解决方案,并且是100 Gbps应用的技术支持者,重点关注带宽和吞吐量。它基于Virtex-7现场可编程门阵列(FPGA),以及支持高端设计的外设——PCI Express(PCIe)Gen.3,多个存储器接口和高速扩展接口。

从一开始,该卡旨在为研究和学术界提供适用于各种研究的低成本商品设备,用户可以利用该平台的现有开放源代码设计,并且可以替换任何参考设计中的大部分或最少内容,或者以其他用户的贡献项目为基础。我们讨论了用例,解释了NetFPGA SUME如何在每种情况下提供适当的资源,并比较了几种当前基于FPGA的解决方案,显示了它们在这些方面的优势。

实现细节:

解决方案的背景是NetFPGA项目,该项目提供软件、硬件和社区作为基本基础结构,以简化设计、仿真和测试,并围绕一个开源高速网络平台进行。当前的NetFPGA工作已通过LGPL 2.1许可。除了硬件和软件,NetFPGA项目还得到社区资源的支持,这些资源包括在线论坛、教程、夏令营活动和开发人员研讨会,所有这些均由NetFPGA项目团队提供支持。由于在NetFPGA项目下开发的所有参考项目都是开源的,因此用户可以在项目之间重用构建基块,并比较设计利用率和性能。所有NetFPGA发行版中都包含的参考项目是NIC,交换机和IPv4路由器。过去的经验表明,社区成员会定期增强和重新分配参考和贡献的NetFPGA项目,从而促进良性循环。

NetFPGA SUME:高级架构NetFPGA SUME设计旨在创建一种低成本的PCIe主机适配器卡,该卡可支持40 Gbps和100 Gbps应用。

NetFPGA SUME使用大型FPGA,支持两种标准接口(SFPþ)中提供的10 Gbps或更高的高速串行接口,并且格式允许用户轻松扩展。我们工作的结果就是NetFPGA SUME(见上图a),该板是Digilent生产的具有大型FPGA架构的PCIe适配卡。

该板的核心是Xilinx Virtex-7 690T FPGA器件,五个外围子系统补充了FPGA:

  • 高速串行接口子系统包含30个串行链路,其运行速度高达13.1 Gbps。它们将四个10 GbpsSFPþ以太网接口,两个扩展连接器和一个PCIe边缘连接器直接连接到FPGA。

  • PCIe 3.0子系统用于在卡和主机设备之间建立接口,从而允许寄存器访问和平台与主板之间的数据包传输。

  • 内存子系统结合了SRAM和DRAM设备:SRAM由三个以500 MHz运行的36位QDRII器件设计而成,DRAM包括两个以933 MHz(1866 MT / s)运行的64位DDR3内存模块。

  • 存储子系统允许通过两个串行高级技术附件(SATA)接口同时使用MicroSD卡和外部磁盘。

  • FPGA配置子系统与Flash设备的使用有关,NetFPGA SUME的其他功能支持调试,扩展和同步电路板。

图b显示了该板的框图:该板卡实现为双插槽,全尺寸PCIe适配器,可以作为PCIe主机外部的独立单元运行。

讨论:

SUME是使用基于FPGA的平台来提供灵活性,表1列出了几种基于FPGA的以网络为中心的平台。

尽管商业平台的价格很高,从5,000美元到8,000美元不等,但通过大学会员计划的董事会价格通常不到2,000美元。 如表所示,NetFPGA SUME具有最高端的功能——尽管VC709使用与NetFPGA SUME板相同的FPGA和相同的DRAM接口,但它是非标准尺寸,缺少SRAM接口,并且存储容量有限。 DE5-Net板具有与NetFPGA SUME类似的DRAM访问功能,但是功能集不灵活,没有其他扩展选项。

NetFPGA SUME板具有比任何参考板更多的高速串行接口,使其非常适合高带宽设计。

设想,NetFPGA SUME可以用于研究和教育,可以提供一个平台,以便在适当的情况下快速制作原型,甚至进行有用的部署。

论文阅读:NETFPGA SUME: TOWARD 100 GBPS AS RESEARCH COMMODITY的更多相关文章

  1. 论文阅读 | Region Proposal by Guided Anchoring

    论文阅读 | Region Proposal by Guided Anchoring 相关链接 论文地址:https://arxiv.org/abs/1901.03278 概述 众所周知,anchor ...

  2. 论文阅读:Face Recognition: From Traditional to Deep Learning Methods 《人脸识别综述:从传统方法到深度学习》

     论文阅读:Face Recognition: From Traditional to Deep Learning Methods  <人脸识别综述:从传统方法到深度学习>     一.引 ...

  3. 论文阅读:《Bag of Tricks for Efficient Text Classification》

    论文阅读:<Bag of Tricks for Efficient Text Classification> 2018-04-25 11:22:29 卓寿杰_SoulJoy 阅读数 954 ...

  4. YOLO 论文阅读

    YOLO(You Only Look Once)是一个流行的目标检测方法,和Faster RCNN等state of the art方法比起来,主打检测速度快.截止到目前为止(2017年2月初),YO ...

  5. [论文阅读]阿里DIEN深度兴趣进化网络之总体解读

    [论文阅读]阿里DIEN深度兴趣进化网络之总体解读 目录 [论文阅读]阿里DIEN深度兴趣进化网络之总体解读 0x00 摘要 0x01论文概要 1.1 文章信息 1.2 基本观点 1.2.1 DIN的 ...

  6. [论文阅读] RNN 在阿里DIEN中的应用

    [论文阅读] RNN 在阿里DIEN中的应用 0x00 摘要 本文基于阿里推荐DIEN代码,梳理了下RNN一些概念,以及TensorFlow中的部分源码.本博客旨在帮助小伙伴们详细了解每一步骤以及为什 ...

  7. Action4D:人群和杂物中的在线动作识别:CVPR209论文阅读

    Action4D:人群和杂物中的在线动作识别:CVPR209论文阅读 Action4D: Online Action Recognition in the Crowd and Clutter 论文链接 ...

  8. [论文阅读] ALM-HCS(高对比场景自适应对数映射)

    [论文阅读] ALM-HCS(高对比场景自适应对数映射) 文章: Adaptive Logarithmic Mapping for Displaying High Contrast Scenes 1. ...

  9. 论文阅读(Xiang Bai——【PAMI2017】An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition)

    白翔的CRNN论文阅读 1.  论文题目 Xiang Bai--[PAMI2017]An End-to-End Trainable Neural Network for Image-based Seq ...

随机推荐

  1. 设计模式:备忘录模式(Memento)

    个人比较喜欢玩单机游戏,什么仙剑.古剑.鬼泣.使命召唤.三国无双等等一系列的游戏我都玩过(现在期待凡人修仙传),对于这些游戏除了剧情好.场面大.爽快之外,还可以随时存档,等到下次想玩了又可以从刚开始的 ...

  2. NOIP2017 D2T3 题解

    题面 这种数据范围不是乱搞dfs就是乱搞状压DP 首先应该通过任一方式求出a和b的值: 任意一条抛物线只用两头猪就可以确定,所以我们N^2枚举,并把在这两头猪的抛物线上的猪都存进状态state[i][ ...

  3. # Clion复制提示信息

    Clion复制提示信息 windows: 按着alt 左键点击错误信息(按键点击同时进行) mac:按着option 左键点击错误信息 搞定

  4. Eureka注册中心

    Eureka简介 Eureka是Netflix开发的服务发现框架,本身是一个基于REST的服务,主要用于定位运行在AWS域中的中间层服务,以达到负载均衡和中间层服务故障转移的目的.SpringClou ...

  5. 实现远程线程DLL注入

    ### 32位:远程线程注入 远程线程注入是最常用的一种注入技术,该技术利用的核心API是 `CreateRemoteThread()` 这个API可以运行远程线程,其次通过创建的线程调用 `Load ...

  6. C++ 类类型转换函数explicit 关键字

    标准数据之间会进行  隐式类型安全转换. 转换规则: 隐式类型转换的问题: #include <iostream> #include <string> using namesp ...

  7. 总线(bus)简介

    内容来自于<Computer Organization>,这是我的一篇学习笔记

  8. 日志:slf4j+logback 的配置与使用

    1. 常用日志组件和选择 java开发日志处理是发现和调试bug所 必不可少的,那么现在企业中常用的日志组件有哪些呢,JCL . JUL.  SLF4j.Log4j.  Log4j2 . Logbac ...

  9. python的isocalender()

    isocalender()返回指定日期的年,第几周,周几这三个值. 例子: import date date_time = datetime.date(2019, 5, 9) ret = date_t ...

  10. 利用nethogs查看哪些进程占用网络带宽

    一.安装nethogs centos6版本安装: 1.安装依赖包 [root@hlsms-fensheng- ~]# yum install ncurses* 已加载插件:fastestmirror, ...