Nvidia硬解码总结

1.前言

　　本文的主要目的是对近期进行的nvidia硬件解码工作的记录和总结。至于为什么研究nvidia硬件解码的具体内容，其实主要是为了在项目中能够利用nvidia的硬件解码和编码能力，提高单机的编解码并行能力。截止当前，nvidia的硬件编码官方提供了nvenc的方法，且在ffmpeg中已经增加了对nvenc的编码库。对于硬件解码，官方提供了基于cuda的解码方法，但是ffmpeg中还没有相应的解码库。所以，我的目的就是调研一下这个硬解方案，并将其自定义增加到ffmpeg中。

　　官方提供的资料比较少，只包括一页的视频解码器介绍和示例代码。

　　吐槽一下：官网那个一页的介绍参考量真不大，主要还是参考例程代码。

2.例程介绍

　　官网提供的例程代码解压后如下图所示，因为是调用解码，所以主要参考了"NvDecodeD3D9"和"NvTranscoder"的代码。

　　总的来说，nvidia提供了source, parser, decoder三个基本模块。其中source是用来解析视频文件(例如：纯h.264文件)，parser是用来解析视频并得到一帧帧的数据，decoder就是解码了。

　　这三个模块相辅相成，其主要操作流程如上图所示。source模块输出h264数据，parser解析这些h264数据，并通过3个重要的回调函数（pfnSequenceCallback， pfnDecodePicture， pfnDisplayPicture）完成解码及输出功能。其中，pfnSequenceCallback是parser解析到序列及图像参数信息时的回调函数，其传入的参数是parser解析好的视频参数，可以用于初始化解码器或重置解码器。pfnDecodePicture是parser解析到视频编码数据后的回调函数，其传入的参数parser处理好待解码的视频编码数据，需要在该函数中调用decoder的接口进行解码操作。pfnDisplayPicture是parser对解码后的数据处理的回调函数，可以在该回调中对已解码的数据进行获取（从显存到系统内存）并处理。

3.主要接口说明

　　cuvidCreateVideoSource : 该接口的作用是创建source，主要参数是设置视频文件路径和回调函数。source会去解析指定视频文件，并通过回调函数实现对视频数据的自定义处理。源码中在视频数据回调函数中，调用了cuvidParseVideoData，即向parser中传递数据。

    //init video source

    CUVIDSOURCEPARAMS oVideoSourceParameters;

    memset(&oVideoSourceParameters, 0, sizeof(CUVIDSOURCEPARAMS));

    oVideoSourceParameters.pUserData = this;

    oVideoSourceParameters.pfnVideoDataHandler = HandleVideoData;

    oVideoSourceParameters.pfnAudioDataHandler = NULL;

    oResult = cuvidCreateVideoSource(&m_videoSource, videoPath, &oVideoSourceParameters);

    if (oResult != CUDA_SUCCESS) {

        fprintf(stderr, "cuvidCreateVideoSource failed\n");

        fprintf(stderr, "Please check if the path exists, or the video is a valid H264 file\n");

        exit(-1);

    }

　　cuvidCreateVideoParser : 该接口是用来创建video parser，主要参数是设置三个回调函数，实现对解析出来的数据的处理。

    //init video parser

    CUVIDPARSERPARAMS oVideoParserParameters;

    memset(&oVideoParserParameters, 0, sizeof(CUVIDPARSERPARAMS));

    oVideoParserParameters.CodecType = oVideoDecodeCreateInfo.CodecType;

    oVideoParserParameters.ulMaxNumDecodeSurfaces = oVideoDecodeCreateInfo.ulNumDecodeSurfaces;

    oVideoParserParameters.ulMaxDisplayDelay = 1;

    oVideoParserParameters.pUserData = this;

    oVideoParserParameters.pfnSequenceCallback = HandleVideoSequence;

    oVideoParserParameters.pfnDecodePicture = HandlePictureDecode;

    oVideoParserParameters.pfnDisplayPicture = HandlePictureDisplay;

    oResult = cuvidCreateVideoParser(&m_videoParser, &oVideoParserParameters);

    if (oResult != CUDA_SUCCESS) {

        fprintf(stderr, "cuvidCreateVideoParser failed, error code: %d\n", oResult);

        exit(-1);

    }

　　cuvidParseVideoData : 该接口是用来向parser塞数据，通过不断地塞h.264数据，parser会通过回调接口对解析出来的数据进行处理。在例程中，cuvidParseVideoData是在source的pfnVideoDataHandler回调中被使用的，即source获取到视频数据，就将其传递给parser。

    // the callback of source pfnVideoDataHandler

    static int CUDAAPI HandleVideoData(void* pUserData, CUVIDSOURCEDATAPACKET* pPacket)

    {

        assert(pUserData);

        CudaDecoder* pDecoder = (CudaDecoder*)pUserData;

        CUresult oResult = cuvidParseVideoData(pDecoder->m_videoParser, pPacket);

        if(oResult != CUDA_SUCCESS) {

            printf("error!\n");

        }

        return 1;

    }

　　cuvidCreateDecoder : 该接口是用来创建decoder，通过设置一些解码参数，会返回一个decoder的句柄。这个句柄会在之后的解码接口中被使用。该接口的具体使用方法在例程中有详细的参数设置，这里就繁琐地描述了。

　　cuvidDecodePicture : 该接口就是向解码器传递待解码的数据。需要说明一下，该接口是异步解码，不能通过该接口得到解码后的视频数据，它只是向解码器传数据而已。解码后的数据，是通过parser的pfnDisplayPicture回调得到。

4.技术点说明

库的使用

　　nvidia解码需要使用cuda和nvcuvid两个库(在linux中是libcuda.so和libnvcuvid.so)，使用的时候要加载它们，并使用其中一些接口。主要使用到的接口主要有：

    cuInit

    cuDeviceGetCount

    cuDeviceGet

    cuDeviceGetName

    cuDeviceComputeCapability

    cuCtxCreate

    cuCtxPushCurrent

    cuCtxPopCurrent

    cuCtxDestroy

    cuMemAllocHost

    cuMemFreeHost

    cuStreamCreate

    cuStreamDestroy

    cuMemcpyDtoHAsync

    cuvidCreateDecoder

    cuvidDestroyDecoder

    cuvidDecodePicture

    cuvidCtxLockCreate

    cuvidCtxLockDestroy

    cuvidCtxLock

    cuvidCtxUnlock

    cuvidMapVideoFrame

    cuvidUnmapVideoFrame

    cuvidCreateVideoParser

    cuvidParseVideoData

    cuvidDestroyVideoParser

注意：根据库的版本不同，接口有的需要使用v2版本。例如：cuCtxCreate和cuCtxCreate_v2。

device内存和system内存

　　使用nvidia进行硬件解码需要了解一下device内存（可以叫显存或设备内存）和系统内存的数据处理方法。在解码完成后，视频YUV数据是在device内存中的，所以需要使用nvidia提供的接口把数据弄出来。涉及的接口主要有：cuMemAllocHost, cuMemFreeHost, cuvidMapVideoFrame, cuvidUnmapVideoFrame, cuMemcpyDtoHAsync。其中，cuMemAllocHost是用来创建系统及显卡都可访问的系统内存。cuvidMapVideoFrame可以获取到设备内存中指定的YUV数据地址。最后通过cuMemcpyDtoHAsync将设备内存中指定的数据copy到系统内存中。

【视频开发】Nvidia硬解码总结的更多相关文章

【miscellaneous】硬解码与软解码
在显卡技术日益成熟的今天,一些概念我们都不是很清楚了,那么显卡硬件解码功能是什么意思呢?高清硬解和软件有什么不同呢?显卡配置需不需要考虑硬件解码呢?电脑爱好者为您分析. 什么是硬件解码? 显卡硬件解码 ...
基于FFmpeg的Dxva2硬解码及Direct3D显示（四）
初始化硬解码上下文目录初始化硬解码上下文创建解码数据缓冲区创建IDirectXVideoDecoder视频解码器设置硬解码上下文解码回调函数创建解码数据缓冲区这一步为了得到 LPDIR ...
【Android 直播软件开发：音视频硬解码篇】
开篇炙手可热,望而生畏的音视频开发时至今日,短视频App可谓是如日中天,一片兴兴向荣.随着短视频的兴起,音视频开发也越来越受到重视,但是由于音视频开发涉及知识面比较广,入门门槛相对较高,让许许多多 ...
【视频开发】GPU编解码:GPU硬解码---DXVA
GPU编解码:GPU硬解码---DXVA 一.DXVA介绍 DXVA是微软公司专门定制的视频加速规范,是一种接口规范.DXVA规范制定硬件加速解码可分四级:VLD,控制BitStream;IDCT,反 ...
Android 用MediaCodec实现视频硬解码
http://blog.csdn.net/halleyzhang3/article/details/11473961 http://www.360doc.com/content/14/0119/10/ ...
【计算机视觉】【并行计算与CUDA开发】GPU硬解码---DXVA
前面介绍利用NVIDIA公司提供的CUVID库进行视频硬解码,下面将介绍利用DXVA进行硬解码. 一.DXVA介绍 DXVA是微软公司专门定制的视频加速规范,是一种接口规范.DXVA规范制定硬件加速解 ...
WPF 视频硬解码渲染播放（无空域）（支持4K、8K、高帧率视频）
MediaWPF 基于 .NET 6 实现视频硬解码渲染Demo(无空域问题) 代码实现仅供学习参考本项目视频渲染通过显卡进行视频解码,CPU几乎不参与工作,并且不存在令人烦躁的空域问题. 在播放摄 ...
Android 用MediaCodec实现视频硬解码(转)
本文向你讲述如何用android标准的API (MediaCodec)实现视频的硬件编解码.例程将从摄像头采集视频开始,然后进行H264编码,再解码,然后显示.我将尽量讲得简短而清晰,不展示那些不相 ...
MediaCodec在Android视频硬解码组件的应用
https://yq.aliyun.com/articles/632892 云栖社区> 博客列表> 正文 MediaCodec在Android视频硬解码组件的应用 cheenc 201 ...

随机推荐

项目Alpha冲刺--7/10
项目Alpha冲刺--7/10 作业要求这个作业属于哪个课程软件工程1916-W(福州大学) 这个作业要求在哪里项目Alpha冲刺团队名称基于云的胜利冲锋队项目名称云评:高校学生成绩综合 ...
IIS 使用 web.config 实现从 http 自动301跳转到 https 的方法
现在很多网站为了安全,开启了 SSL 连接,那么开启 SSL 连接之后,如何将对应的 http 访问自动跳转到 https 上呢?之前介绍了 IIS 用 web.config 做域名的301跳转的方法 ...
ThinkPHP远程调用模块的操作方法 URL 参数格式
* 远程调用模块的操作方法 URL 参数格式 [项目://][分组/]模块/操作 * @param string $url 调用地址 * @param string|array $vars 调用参数 ...
Topcoder10566 IncreasingNumber
IncreasingNumber 一个数是Increasing当且仅当它的十进制表示是不降的,$1123579$. 求 $n$ 位不降十进制数中被 $d$ 整除的有多少个. \(n\leq ...
9、Python复杂数据类型（list、tuple、set、dict）
一.列表(list):[a1,a2],可变数据类型 1.序列: 序列是基类类型,序列扩展类型包括:字符串.元组和列表序列都可以进行的操作包括索引,切片,加,乘,检查成员. 此外,Python已经内置 ...
mariadb（mysql）[详解]
本文链接:https://blog.csdn.net/root__oo7/article/details/82817501 安装: [root@bogon ~]# yum install mariad ...
ArrayList 集合：库存管理
import java.util.ArrayList; import java.lang.Integer; import java.util.Scanner; import java.util.Ran ...
二分法python实现
聚会游戏,一个人想一个数,其他人来猜,然后告诉你猜大了还是小了,直到猜到这个数. 二分法和猜数游戏类似,只不过猜的时候一定猜最中间的那个数,折半查找所需内容,就数组来说,数组越长,梯度下降越快,二分查 ...
【00NOIP普及组】计算器的改良（信息学奥赛一本通 1910）（洛谷 1022）
[题目描述] NCL是一家专门从事计算器改良与升级的实验室,最近该实验室收到了某公司所委托的一个任务:需要在该公司某型号的计算器上加上解一元一次方程的功能.实验室将这个任务交给了一个刚进入的新手ZL先 ...
[内网渗透]Cobaltstrike指令大全
0x01 安装 Cobaltstrike是需要java环境才能运行的 linux下终端运行: sudo apt-get install openjdk-8-jdk windows下: 百度一堆配置JA ...

【视频开发】Nvidia硬解码总结