float16与float32转换

// based on https://gist.github.com/martin-kallman/5049614

// float32

// Martin Kallman

//

// Fast half-precision to single-precision floating point conversion

//  - Supports signed zero and denormals-as-zero (DAZ)

//  - Does not support infinities or NaN

//  - Few, partially pipelinable, non-branching instructions,

//  - Core opreations ~6 clock cycles on modern x86-64

void float32(float *__restrict out, const uint16_t in) {

    uint32_t t1;

    uint32_t t2;

    uint32_t t3;

    t1 = in & 0x7fffu;                       // Non-sign bits

    t2 = in & 0x8000u;                       // Sign bit

    t3 = in & 0x7c00u;                       // Exponent

    t1 <<= 13u;                              // Align mantissa on MSB

    t2 <<= 16u;                              // Shift sign bit into position

    t1 += 0x38000000;                       // Adjust bias

    t1 = (t3 == 0 ? 0 : t1);                // Denormals-as-zero

    t1 |= t2;                               // Re-insert sign bit

    *((uint32_t *) out) = t1;

};

// float16

// Martin Kallman

//

// Fast single-precision to half-precision floating point conversion

//  - Supports signed zero, denormals-as-zero (DAZ), flush-to-zero (FTZ),

//    clamp-to-max

//  - Does not support infinities or NaN

//  - Few, partially pipelinable, non-branching instructions,

//  - Core opreations ~10 clock cycles on modern x86-64

void float16(uint16_t *__restrict out, const float in) {

    uint32_t inu = *((uint32_t * ) & in);

    uint32_t t1;

    uint32_t t2;

    uint32_t t3;

    t1 = inu & 0x7fffffffu;                 // Non-sign bits

    t2 = inu & 0x80000000u;                 // Sign bit

    t3 = inu & 0x7f800000u;                 // Exponent

    t1 >>= 13u;                             // Align mantissa on MSB

    t2 >>= 16u;                             // Shift sign bit into position

    t1 -= 0x1c000;                         // Adjust bias

    t1 = (t3 < 0x38800000u) ? 0 : t1;       // Flush-to-zero

    t1 = (t3 > 0x8e000000u) ? 0x7bff : t1;  // Clamp-to-max

    t1 = (t3 == 0 ? 0 : t1);               // Denormals-as-zero

    t1 |= t2;                              // Re-insert sign bit

    *((uint16_t *) out) = t1;

};

#define ABS(A) ((A) >= 0 ? (A) : -(A))

int main() {

    float original = -42.42f;

    uint16_t small = 0;

    float16(&small, original);

    float quantized = 0.0f;

    float32(&quantized, small);

    float diff = ABS(original - quantized);

    printf("orig %f quantized %f absdiff %f\n", original, quantized, diff);

    assert(diff < 0.1f);

}

引用

float16 to float32

float16与float32转换的更多相关文章

OpenCL中的half与float的转换
在kernel中使用half类型可以在牺牲一定精度的代价下来提升运算速度. 在kernel中, 可以比较方便的对half数据进行计算, 但在host上的, 对half的使用就没那么方便了. 查看cl_ ...
[TF] Architecture - Computational Graphs
阅读笔记: 仅希望对底层有一定必要的感性认识,包括一些基本核心概念. Here只关注Graph相关,因为对编程有益. TF – Kernels模块部分参见:https://mp.weixin.qq.c ...
tenaorflow函数（1）
TensorFlow 将图形定义转换成分布式执行的操作, 以充分利用可用的计算资源(如 CPU 或 GPU.一般你不需要显式指定使用 CPU 还是 GPU, TensorFlow 能自动检测.如果检测 ...
Tensorflow的基本概念与常用函数
Tensorflow一些常用基本概念与函数(一) 1.tensorflow的基本运作为了快速的熟悉TensorFlow编程,下面从一段简单的代码开始: import tensorflow as tf ...
tensorflow和python操作中的笔记
前一段时间做了一些项目,把一些笔记放在了txt中,现分享出来,自己也能够时长预习. 1) 读取文件时,将固定的文件地址,采用数组或者字符串的形式,提前表示出来,后期使用时候采用拼接操作 2) # 得到 ...
Tensorflow一些常用基本概念与函数（二）
1.tensorflow的基本运作为了快速的熟悉TensorFlow编程,下面从一段简单的代码开始: import tensorflow as tf #定义‘符号’变量,也称为占位符 a = tf. ...
Numpy的ndarry：一种多维数组对象
Numpy的ndarry:一种多维数组对象 Numpy最重要的一个特点就是其N维数组对象(即ndarry),该对象是一个快速而灵活的大数据集容器.你可以利用这种数组对整块数据执行一些数学运算,其语法跟 ...
Numpy的ndarry
Numpy的ndarry:一种多维数组对象 Numpy最重要的一个特点就是其N维数组对象(即ndarry),该对象是一个快速而灵活的大数据集容器.你可以利用这种数组对整块数据执行一些数学运算,其语法跟 ...
利用Python进行数据分析_Numpy_基础_2
Numpy数据类型包括: int8.uint8.int16.uint16.int32.uint32.int64.uint64.float16.float32.float64.float128.co ...
实操 | 内存占用减少高达90%，还不用升级硬件？没错，这篇文章教你妙用Pandas轻松处理大规模数据
注:Pandas(Python Data Analysis Library) 是基于 NumPy 的一种工具,该工具是为了解决数据分析任务而创建的.此外,Pandas 纳入了大量库和一些标准的数据模型 ...

随机推荐

Mac_VM_CentOS固定IP总结
参考链接参考链接亲测可用
项目管理构建工具——Maven（基础篇）
项目管理构建工具--Maven(基础篇) 在前面的内容中我们学习了JDBC并且接触到了jar包概念在后面我们的实际开发中会接触到很多jar包,jar包的导入需要到互联网上进行就会导致操作繁琐 Mav ...
新增一个Redis 从节点为什么与主节点的key数量不一样呢？
在日常的 Redis 运维过程中,经常会发生重载 RDB 文件操作,主要情形有: 主从架构如果主库宕机做高可用切换,原从库会挂载新主库重新获取数据主库 QPS 超过10万,需要做读写分离,重新添加从 ...
thinkphp5.1 cookie跨域、thinkphp5.1 session跨域、tp5.1cookie跨域
cookie跨域: //config/cookie.php return [ //... //仅7.3.0及以上适用 'samesite' => 'None', //是否加密cookie值,fa ...
scheduler打印状态到日志
编辑脚本和目录 # 如下步骤每个proxysql节点都需要操作 [root@ss30 opt]# mkdir -p /opt/proxysql/log [root@ss30 opt]# vim /op ...
Kubernetes 监控：Prometheus Operator + Thanos ---实践篇
具体参考网址:https://www.cnblogs.com/sanduzxcvbnm/p/16291296.html 本章用到的yaml文件地址:https://files.cnblogs.com/ ...
7.prometheus监控多个MySQL实例
mysqld_exporter集中部署集中部署,就是说我们将所有的mysqld_exporter部署在同一台服务器上,在这台服务器上对mysqld_exporter进行统一的管理,下面介绍一下集中部 ...
MongoDB 副本集的用户和权限一般操作步骤
步骤总结: 在主节点上添加超管用户,副本集会自动同步按照仲裁者.副本节点.主节点的先后顺序关闭所有节点服务创建副本集认证的key文件,复制到每个服务所在目录修改每个服务的配置文件,增加参数启动 ...
Vue+vant移动端处理弹窗不能滑动问题
自己在做项目开发时,使用vantUI组件,在项目中遇到了弹窗组件里面当内容过多时,会出现滚动卡顿或者不能滚动问题,开始一直以为是自己的样式写的有问题,检查下来才发现并不是,而是弹窗组件的问题,于是找到 ...
Ruoyi字典源码学习
此文章属于ruoyi项目实战系列使用目的什么是字典数据:具体的值(0,1,"Y","N"),对应具体的业务逻辑("男","女& ...

float16与float32转换

float16与float32转换的更多相关文章

随机推荐

热门专题