自主数据类型:在TVM中启用自定义数据类型探索
自主数据类型:在TVM中启用自定义数据类型探索
介绍
在设计加速器时,一个重要的决定是如何在硬件中近似地表示实数。这个问题有一个长期的行业标准解决方案:IEEE 754浮点标准.1。然而,当试图通过构建高度专业化的设计来最大限度地利用硬件时,使用通用IEEE 754浮点有意义吗?如果知道工作负载的数字需求,是否可以构建一个更小、更快或更省电的数据类型?答案是肯定的!研究人员已经开始在学术和工业加速器设计中尝试新的数据类型。例如,Google的张量处理单元(TPU)使用bfloat类型:一个被截断为16位的单精度IEEE浮点。由于许多深度学习工作负载对数值要求不严格,这种截断通常对模型精度没有影响,同时立即将存储成本降低一半。
然而,在研究人员开始为数据类型构建硬件之前,首先需要确定数据类型在工作负载中的数值行为。这通常需要首先构建其数据类型的软件仿真版本(例如Berkeley SoftFloat或libposit),然后将数据类型直接插入工作负载,以查看工作负载如何使用数据类型执行。更好的方法是将数据类型直接集成到编译器本身中,这样就可以编译许多不同的工作负载来使用该数据类型。这两种路径都可能是乏味的,鉴于现代编译器的规模和复杂性,后一种路径往往变得不可管理。一个来自GitHub的例子显示有人将posit数据类型侵入TensorFlow。结果是237次提交,添加了近6000行代码,并在代码库中处理了200多个文件,这仅仅是添加了一个数据类型!对许多研究人员来说,这样的工作量是令人望而却步的。
为了解决这些问题,提出了自带数据类型框架。该框架允许用户将模拟的数据类型插入TVM,从而可以轻松地在深度学习工作负载中探索新的数据类型。与上面的Tensorflow示例中的positions不同,它支持编译器中的单个新数据类型,而Bring Your Own datatype框架支持各种各样的用户定义类型。
自主数据类型
“自主数据类型”框架的目标是使用户能够使用自定义数据类型运行深入学习的工作负载。在Bring Your Own Datatypes框架中,“datatype”表示标量类型:例如float或uint。不处理像Intel Flexpoint这样复杂的数据块格式(floating point or Intel’s Flexpoint)。此外,只声明支持这些标量数据类型的软件仿真版本;不明确支持在自定义数据类型硬件上编译和运行。
TVM中的每个张量都分配了一个类型代码,它定义了张量中标量的数据类型。这些类型代码在TVM中具有硬编码的含义,映射到诸如int和float之类的常见数据类型。然而,绝大多数类型代码都是未使用的。“自带数据类型”框架允许用户声明这些未使用的类型代码,并在运行时添加自己的新数据类型。
该框架是作为注册表来实现的,它位于TVM的常规数据类型架构上。用户与数据类型注册表交互的主要方式有两种:第一种是数据类型注册,第二种是降低函数注册。这些步骤分别类似于数据类型的声明和实现。
本文中引用的所有代码都基于TVM存储库的主分支提交4cad71d。将使用一个示例posit数据类型,该数据类型位于src/target/datatype/posit/posit-wrapper.cc并且可以在TVM中使用USE_BYODT_POSIT标志进行编译。
Datatype Registration
为了注册数据类型,用户为数据类型分配一个名称和一个类型代码,其中类型代码来自自定义数据类型可用的未使用类型代码范围。
tvm.target.datatype.register('posit', 150)
The above code registers the 'posit' datatype with type code 150. This registration step allows TVM to parse programs which use the custom type:
x = relay.var('x', shape=(3, ), dtype='float32')
y = relay.var('y', shape=(3, ), dtype='float32')
x_posit = relay.cast(x, dtype='custom[posit]16')
y_posit = relay.cast(y, dtype='custom[posit]16')
z_posit = x_posit + y_posit
z = relay.cast(z_posit, dtype='float32')
program = relay.Function([x, y], z)
print(program)
# v0.0.4
# fn (%x: Tensor[(3), float32], %y: Tensor[(3), float32]) {
# %0 = cast(%x, dtype="custom[posit]16");
# %1 = cast(%y, dtype="custom[posit]16");
# %2 = add(%0, %1);
# cast(%2, dtype="float32")
# }
上面的程序将float32输入x和y转换成posits,相加,然后将结果转换回float32。一旦posit类型被注册,TVM就能够解析特殊的dtype语法custom[<typename>],其中<typename>是为类型注册的名称。此语法还支持通常的<bits>x<lanes>格式;这里,使用16来表示每个posite的宽度是16位。(通道数默认为1。)
Lowering Function Registration
虽然TVM可以解析上述程序,但它还不能编译它,因为TVM还不知道如何在posit类型上编译操作。为了编译这些程序,为自定义数据类型注册了降低函数,这有助于TVM将操作转换成它可以理解和编译的内容。
一般来说,用户不需要直接将操作降低到LLVM或CUDA。相反,大多数使用自定义数据类型的代码可以通过一些简单的技巧被简化为不使用自定义数据类型的代码。然后,可以依赖于本机TVM来理解和编译代码。
图1:用户注册的降低函数的预期结果。
降低函数应该将使用自定义数据类型的程序转换为本机TVM可以理解和编译的程序(在本例中,调用外部库,使用两个uint16)。
图1显示了一个通用模式。假设对探索posit类型感兴趣,并选择通过将posit仿真库(例如Stillwater Universal)通过自带的数据类型框架插入TVM来运行一些工作负载。工作量是一个简单的程序,它添加了两个posite输入。Native-TVM不知道如何实现posit加法,但它不需要,因为有一个实现数据类型的库!这个库包含一个正数加法的实现,以及乘法和平方根等其他运算符。为了实现这个posit加法,只想调用库。因此,Add节点应该成为一个调用节点,调用库中的一个函数(称之为position16es2add)。为了将输入位置的位存储在TVM理解的类型中,使用16位无符号整数。生成的程序是TVM可以理解和编译的程序,它只是调用一个外部库函数,取两个无符号整数。
为了实现上述降低,为posit注册了一个降低功能:
tvm.target.datatype.register_op(
tvm.target.datatype.create_lower_func({16: 'Posit16es2Add'}),
'Add', 'llvm', 'posit')
上面的代码为特定运算符(Add)、编译目标(LLVM)、数据类型(posit)和位长度(16)注册了一个降低函数。第一个参数是lowering函数。这可以是任何获取TVM IR节点并返回新TVM IR节点的函数。在例子中,使用了Bring Your Own Datatypes框架提供的helper函数。tvm.target.datatype.create_lower_func({16:'Posit16es2Add'})为上述公共模式创建一个降低函数。结果函数将给定节点的参数转换为uint16_t,然后将节点本身转换为对给定函数名的调用(在本例中,对于位长度为16的position16es2add)。我们传递一个字典来create_lower_func,以便TVM可以根据数据类型的位长度将其分派到适当的函数名。
要实现自定义数据类型,用户将需要为他们希望运行的工作负载中的每个运算符注册一个降低函数。对于像ResNet这样的网络,大约有10个操作符,包括Add、Div、各种类型转换和Max。在测试中,注册一个数据类型和所有的降低函数需要大约40行Python。一旦注册了所有需要的算子,自定义数据类型工作负载就可以像任何其他TVM程序一样轻松运行!
结束
“自带数据类型”框架将用户定义的数据类型引入TVM。希望这将鼓励数据类型研究人员在研究中使用TVM;同样,希望这将激发深度学习社区中对定制数据类型的兴趣。有关“自带数据类型”框架的更多文档,请访问“将自己的数据类型带到TVM开发人员”。
自主数据类型:在TVM中启用自定义数据类型探索的更多相关文章
- 如何在Qt中使用自定义数据类型
这里我们使用下面这个struct来做说明(这里不管是struct还是class都一样): struct Player { int number; QString firstName; QString ...
- QT 信号槽connect中解决自定义数据类型或数组作为函数参数的问题——QT qRegisterMetaType 注册MetaType——关键:注册自定义数据类型或QMap等容器类
一般情况下信号槽直接连接方式不会出现问题,但是如果信号与槽在不同线程或Qt::QueuedConnection方式连接,可能会在连接期间报以下类似问题,如: QObject::connect: Can ...
- TVM自定义数据类型
TVM自定义数据类型 本文将介绍"自定义数据类型"框架,该框架可在TVM中使用自定义数据类型. 介绍 在设计加速器时,关键是如何近似地表示硬件中的实数.这个问题具有长期的行业标准解 ...
- 通过SQL Server自定义数据类型实现导入数据
写在前面 在看同事写的代码时看到了SQL Server中可以自定义数据类型,而且定义的是DataTable类型的数据类型. 后我想起了以前我们导入数据时要么是循环insert写入,要么是SqlBulk ...
- 1. Python中的基本数据类型、运算、变量
本文利用的是Python 3.x版本,建议学习3.x版本 Python中的基本数据类型.运算.变量 1. 基本数据类型 1.1 整数 py可以处理任意大小的整数,例如123,1234567891324 ...
- C 语言中的关键字 - 数据类型、数据修饰符及逻辑结构
C 语言中有 32 个关键字.这是留个编译器用的特殊字符串,用户不可以使用. 特殊关键字 sizeof 和 return 是 C 语言中的两个特殊关键字. sizeof sizeof 用于计算变量所占 ...
- 【C++】自定义数据类型
自定义数据类型 标签:c++ 目录 自定义数据类型 一.结构体 定义方法: 特点: 成员访问方式: 初始化: 结构数组 指针和动态内存分配: 结构变量作为函数参数: 二.联合 定义方法: 特点: 举例 ...
- Mssql中一些常用数据类型的说明和区别
Mssql中一些常用数据类型的说明和区别 1.bigint 占用8个字节的存储空间,取值范围在-2^63 (-9,223,372,036,854,775,808) 到 2^63-1 (9,223,37 ...
- OSG 自定义数据类型 关键帧动画
OSG 自定义数据类型 关键帧动画 转自:http://blog.csdn.net/zhuyingqingfen/article/details/12651017 /* 1.创建一个AnimManag ...
随机推荐
- 0901-生成对抗网络GAN的原理简介
0901-生成对抗网络GAN的原理简介 目录 一.GAN 概述 二.GAN 的网络结构 三.通过一个举例具体化 GAN 四.GAN 的设计细节 pytorch完整教程目录:https://www.cn ...
- 大事件,Java被超越了,2021年5月TIOBE编程语言排行榜出炉
TIOBE 头条 TIOBE 5月编程语言排行榜新鲜出炉.前十榜单中,C.Python.Java三大鳌头仍占据前三榜单.去年11月,Python短时间的挤掉Java跃居至榜单第二名:今年5月,Pyth ...
- 【JavaScript】Leetcode每日一题-矩形区域不超过K的最大值和
[JavaScript]Leetcode每日一题-矩形区域不超过K的最大值和 [题目描述] 给你一个 m x n 的矩阵 matrix 和一个整数 k ,找出并返回矩阵内部矩形区域的不超过 k 的最大 ...
- [LeetCode每日一题]781. 森林中的兔子
[LeetCode每日一题]781. 森林中的兔子 问题 森林中,每个兔子都有颜色.其中一些兔子(可能是全部)告诉你还有多少其他的兔子和自己有相同的颜色.我们将这些回答放在 answers 数组里. ...
- yum makecache: error: argument timer: invalid choice: ‘fast’ (choose from ‘timer’)
这是因为版本问题,centos8没有该参数,解决办法为:去掉fast参数,就可以了 sudo yum makecache
- .NET之WebAPI
介绍 通过一个简单的项目,总结一下常用的几种WebApi编写方式以及请求方式. 本文示例代码环境:vs2019.net5.MySQL 正文前准备 新创建了一个.Net5 WebAPI程序,安装组件 & ...
- InnoDB存储引擎简介
前言: 存储引擎是数据库的核心,对于 MySQL 来说,存储引擎是以插件的形式运行的.虽然 MySQL 支持种类繁多的存储引擎,但最常用的当属 InnoDB 了,本篇文章将主要介绍 InnoDB 存储 ...
- Morgan Stanley Books List:经典金融书籍推荐
一.经济学 1. 中华帝国的专制制度,佛朗索瓦.魁奈 2. 资本论(共3卷),马恩全集 3. 国家竞争优势,麦克尔.波特 4. Essentials of corporate analysis, by ...
- Linux x86_64与i386区别之 —— 内存寻址
毫无疑问,不管是32位,还是64位处理器,所有进程(执行的程序)都必须占用一定数量的内存,它或是用来存放从磁盘载入的程序代码,或是 存放取自用户输入的数据等等.不过进程对这些内存的管理方式因内存用途不 ...
- 【技术博客】使用iview的Tree组件写一棵文件树
本次项目的前端部分使用vue框架+iview组件构建,其中IDE的文件树部分使用了iview的Tree组件,但是Tree组件本身的接口功能极其有限,网上的相关资料也不多,在使用时费了一番功夫才摸索清楚 ...