中继TensorRT集成 介绍 NVIDIA TensorRT是用于优化深度学习推理的库.这种集成将使尽可能多的算子从Relay转移到TensorRT,从而无需调整调度,即可在NVIDIA GPU上提高性能. 本文将演示如何安装TensorRT,并在启用TensorRT BYOC和运行时runtime的情况下构建TVM.将提供示例代码,使用TensorRT编译和运行ResNet-18模型,以及如何配置编译和运行时runtime设置.最后,记录支持的算子,以及如何扩展集成,以支持其它算子. 安装T…