模型量化 什么是量化 模型的weights数据一般是float32的,量化即将他们转换为int8的.当然其实量化有很多种,主流是int8/fp16量化,其他的还有比如 二进制神经网络:在运行时具有二进制权重和激活的神经网络,以及在训练时计算参数的梯度. 三元权重网络:权重约束为+1,0和-1的神经网络 XNOR网络:过滤器和卷积层的输入是二进制的. XNOR 网络主要使用二进制运算来近似卷积. 现在很多框架或者工具比如nvidia的TensorRT,xilinx的DNNDK,TensorFlow…