HLS后端示例

TVM支持带有SDAccel的Xilinx FPGA板。这是有关如何将TVM部署到AWS F1 FPGA实例的文档。

此功能仍处于试验阶段。暂时无法使用SDAccel部署端到端神经网络。

本文使用两个python脚本。

  • build.py-用于合成FPGA位流的脚本。
  • import tvm
  • from tvm import te
  • tgt_host="llvm"
  • tgt="sdaccel"
  • n = te.var("n")
  • A = te.placeholder((n,), name='A')
  • B = te.placeholder((n,), name='B')
  • C = te.compute(A.shape, lambda i: A[i] + B[i], name="C")
  • s = te.create_schedule(C.op)
  • px, x = s[C].split(C.op.axis[0], nparts=1)
  • s[C].bind(px, tvm.te.thread_axis("pipeline"))
  • fadd = tvm.build(s, [A, B, C], tgt, target_host=tgt_host, name="myadd")
  • fadd.save("myadd.o")
  • fadd.imported_modules[0].save("myadd.xclbin")
  • tvm.contrib.cc.create_shared("myadd.so", ["myadd.o"])
  • run.py-使用FPGA作为加速器的脚本。
  • import tvm
  • import numpy as np
  • import os
  • tgt="sdaccel"
  • fadd = tvm.runtime.load_module("myadd.so")
  • if os.environ.get("XCL_EMULATION_MODE"):
  • fadd_dev = tvm.runtime.load_module("myadd.xclbin")
  • else:
  • fadd_dev = tvm.runtime.load_module("myadd.awsxclbin")
  • fadd.import_module(fadd_dev)
  • ctx = tvm.context(tgt, 0)
  • n = 1024
  • a = tvm.nd.array(np.random.uniform(size=n).astype("float32"), ctx)
  • b = tvm.nd.array(np.random.uniform(size=n).astype("float32"), ctx)
  • c = tvm.nd.array(np.zeros(n, dtype="float32"), ctx)
  • fadd(a, b, c)
  • tvm.testing.assert_allclose(c.asnumpy(), a.asnumpy() + b.asnumpy())

设定

  • 使用FPGA Developer AMI启动实例。不需要F1实例进行仿真和综合,因此建议使用成本较低的实例。
  • 设置AWS FPGA开发套件工具。
  • git clone https://github.com/aws/aws-fpga.git
  • cd aws-fpga
  • source sdaccel_setup.sh
  • source ${XILINX_SDX}/settings64.sh
  • 在启用OpenCL的情况下设置TVM。

仿真

  • 创建emconfig.json进行仿真。
  • emconfigutil --platform ${AWS_PLATFORM} --nd 1
  • 将emconfig.json复制到python二进制目录。当前的Xilinx工具包假定主机二进制文件和emconfig.json文件都在同一路径中。
  • cp emconfig.json $(dirname $(which python))
  • 运行软件仿真
  • export XCL_EMULATION_MODE=1
  • export XCL_TARGET=sw_emu
  • python build.py
  • python run.py
  • 运行硬件仿真
  • export XCL_EMULATION_MODE=1
  • export XCL_TARGET=hw_emu
  • python build.py
  • python run.py

Synthesis

  • 使用以下脚本运行综合。
  • unset XCL_EMULATION_MODE
  • export XCL_TARGET=hw
  • python build.py
  • 创建AWS FPGA映像并将其上传到AWS S3。
  • ${SDACCEL_DIR}/tools/create_sdaccel_afi.sh \
  • -xclbin=myadd.xclbin -o=myadd \
  • -s3_bucket=<bucket-name> -s3_dcp_key=<dcp-folder-name> \
  • -s3_logs_key=<logs-folder-name>

生成awsxclbin文件,对于在F1实例上使用AWS FPGA映像是必需的。

运行

  • 启动Amazon EC2 F1实例。
  • 将myadd.so,myadd.awsxclbin和run.py复制到F1实例。
  • 设置AWS FPGA开发套件。
  • git clone https://github.com/aws/aws-fpga.git
  • cd aws-fpga
  • source sdaccel_setup.sh
  • 在启用OpenCL的情况下设置TVM。
  • 设置root和setup环境变量。
  • sudo sh
  • source ${INSTALL_ROOT}/setup.sh
  • 运行

python run.py

https://tvm.apache.org/docs/deploy/hls.html

HLS后端示例的更多相关文章

  1. iView学习笔记(一):Table基本操作(包含前后端示例代码)

    iView表格操作 1.前端准备工作 首先新建一个项目,然后引入iView插件,配置好router npm安装iView npm install iview --save cnpm install i ...

  2. HLS playlist典型示例

    [时间:2018-06] [状态:Open] [关键词:流媒体,HLS,m3u8,playlist,variant, alternate] 0 引言 本文主要是对apple官网上的echnical N ...

  3. Sentry 开发者贡献指南 - 后端服务(Python/Go/Rust/NodeJS)

    内容整理自官方开发文档 系列 1 分钟快速使用 Docker 上手最新版 Sentry-CLI - 创建版本 快速使用 Docker 上手 Sentry-CLI - 30 秒上手 Source Map ...

  4. 视频直播点播nginx-rtmp开发手册中文版

    2016年8月18日12:42:35 参照官方文档https://github.com/arut/nginx-rtmp-module/wiki/Directives 请注意这个是粗翻译版,仅供参考,不 ...

  5. 使用Visual Studio 2012 开发 Html5 应用

    Visual Studio 一直以来是开发微软旗下应用的利器,只要是开发微软相关的应用无论是Windows程序,WPF,Asp.Net,WinRT Surface,WindowsPhone 等微软旗下 ...

  6. C#微信公众号学习 - (一)测试账号申请

    主要分为两部分: 1.创建C#的项目,并发布, 2.微信填写发布的地址进行开发者验证. 一. VS环境为VS2017,创建项目时,自带的一些东西发布会导致各种错误,无奈,创建了空项目aspx窗体,如下 ...

  7. ABP入门教程14 - 更新多语言

    点这里进入ABP入门教程目录 设置语种 新增语种 数据库操作 打开多语言表AbpLanguages,添加一条记录. 程序操作 在基础设施层(即JD.CRS.EntityFrameworkCore)的\ ...

  8. Flask-wtf导入Regexp规则库验证手机号码合法性(测试通过)

    手机号码在项目有着很重要的地位,保证用户输入的号码准确无误就显得很关键. 废话不多说,现在页面中引入Regexp规则库: from wtforms.validators import Regexp 验 ...

  9. OpenWrt Web 开发 LuCI框架 lua语言

    LuCI作为“FFLuCI”诞生于2008年3月份,目的是为OpenWrt固件从 Whiterussian 到 Kamikaze实现快速配置接口.Lua是一个小巧的脚本语言,很容易嵌入其它语言.轻量级 ...

随机推荐

  1. sqlserver2018 报错恢复

    报错: Description: SQL Server 检测到基于一致性的逻辑 I/O 错误 校验和不正确(应为: 0xb2b1af16,但实际为: 0xac9393a2).在文件 'C:\Progr ...

  2. 绕过CDN查找网站真实ip

    在渗透测试过程中,经常会碰到网站有CDN的情况.CDN即内容分发网络,主要解决因传输距离和不同运营商节点造成的网络速度性能低下的问题.说的简单点,就是一组在不同运营商之间的对接点上的高速缓存服务器,把 ...

  3. Tomcat PUT方法任意文件上传(CVE-2017-12615)

    目录 漏洞复现: 漏洞利用工具: 漏洞环境:当 Tomcat运行在Windows操作系统,且启用了HTTP PUT请求方法(例如,将 readonly 初始化参数由默认值设置为 false),攻击者将 ...

  4. 《前端运维》一、Linux基础--基础命令(1)

    在开始之前,你需要做一些准备工作,去阿里买一台服务器,服务器的具体细节其实并不是十分重要,我也不会在这里一步一步的教大家如何去买一个服务器.百度一下足够了,但是还是要贴一下这篇文章中,我所使用的服务器 ...

  5. Mysql杂项配置:sql_mode

    常用配置: SHOW VARIABLES LIKE 'sql_mode'; SET sql_mode = 'ONLY_FULL_GROUP_BY,STRICT_TRANS_TABLES,NO_ENGI ...

  6. Asp.NetCore Web开发之路由

    接着讲asp.net core web开发,这节讲路由系统(Route). 在asp.net core中通过路由来将请求映射到对应的action,主要用到两个中间件,UseRouting()和UseE ...

  7. 【Azure Developer】使用Microsoft Graph API 如何批量创建用户,用户属性中需要包含自定义字段(如:Store_code,Store_name等)

    Microsoft Graph 是 Microsoft 365 中通往数据和智能的网关. 它提供统一的可编程模型,可用于访问 Microsoft 365.Windows 10 和企业移动性 + 安全性 ...

  8. Vue3能不能用到生产环境?

    最近,有不少朋友问我:"十三,看你写了几个Vue3的项目,你觉得Vue3能用到生产环境了吗?"结合自己的想法和尤大直播说的话,给一点建议. 别问我!没结果,除非花手摇过我. 我不是 ...

  9. 『动善时』JMeter基础 — 15、使用JMeter实现上传文件

    目录 1.用于演示的项目说明 2.测试计划内包含的元件 3.HTTP请求界面内容 4.查看结果 5.总结 6.补充:MIME类型简介 (1)MIME说明 (2)常见类型 在上一篇文章[使用JMeter ...

  10. yiled

    def fib(max): n,a,b = 0,0,1 while n < max: print("hallo") yield b #把函数执行过程冻结在这一步,并且把b的值 ...