前言 NVIDIA TensorRT是一种高性能神经网络推理(Inference)引擎,用于在生产环境中部署深度学习应用程序,应用有 图像分类.分割和目标检测等,可提供最大的推理吞吐量和效率.TensorRT是第一款可编程推理加速器,能加速现 有和未来的网络架构.TensorRT需要CUDA的支持.TensorRT包含一个为优化生产环境中部署的深度学习模型而 创建的库,可获取经过训练的神经网络(通常使用32位或16位数据),并针对降低精度的INT8运算来优化这些网络. 借助CUDA的可编程性,T…