在开始之前，我们需要了解视频文件的格式。视频文件的格式众多，无法三言两语就能详细分析其结构，尽管如此，ffmpeg却很好地提取了各类视频文件的共同特性，并对其进行了抽象描述。

视频文件格式，统称为container。它包含一个描述视频信息的头部，以及内含实际的音视频编码数据的packets。当然，这里的头部以及packet部分只是个抽象描述，实际的视频格式的描述信息可能不是存放在视频文件的起始位置，可能是由分散于视频文件的各个位置的多个部分组成；数据包有可能是由头部以及尾部进行分割的传统数据包形式，也有可能是一大块数据区域，由索引进行各个数据包的分割。

视频文件中的packets最主要的就是视频以及音频packets，demux的过程就是解析container的header来获取视频信息，所得到的视频信息能帮助我们区分packet是音频或者视频。同样属性的packets会被称为stream。

packet中存储的数据就是音视频编码后的数据，通过解码器进行decode后就能得到视频图像或者音频帧。其中需要注意的一点是，一个packet不一定对应一帧，packet的顺序也不一定是实际的播放顺序，而通过ffmpeg解码出来的frame的顺序就是实际的播放顺序。

Demux

首先需要一个用于存储视频文件信息的结构体。

pFormatCtx = avformat_alloc_context();

读取视频文件，并对该文件进行demux，所得到的视频信息存储于刚刚所构建的结构体当中

    if(avformat_open_input(&pFormatCtx, argv[1], NULL, NULL)!=0){

        fprintf(stderr, "open input failed\n");

        return -1;

    }

如果pFormatCtx=NULL，那么avformat_open_input也能自动为pFormatCtx分配存储空间。

对于有些视频格式，单单通过demux并不能获得所有的视频信息，为了获得这些信息，还需要读取并尝试解码该视频几个最前端packets（通常会解码每个stream第一个packet）。所读取的这几个packets会被缓存以供后续处理。

if(avformat_find_stream_info(pFormatCtx, NULL)<0){

        fprintf(stderr, "find stream info failed\n");

        return -1;

    }

从所获得的信息当中得到video stream序号，后续可以通过stream序号来对packet进行筛选。

videoStream = av_find_best_stream(pFormatCtx, AVMEDIA_TYPE_VIDEO, -1, -1, NULL, 0);

Decode

创建一个用于存储以及维护解码信息结构体。

pCodecCtx = avcodec_alloc_context3(NULL);

把demux时所获得的视频相关信息传递到解码结构体中。

if(avcodec_parameters_to_context(pCodecCtx, pFormatCtx->streams[videoStream]->codecpar)<0){

        fprintf(stderr, "copy param from format context to codec context failed\n");

        return -1;

    }

根据解码器id来寻找对应的解码器

pCodec = avcodec_find_decoder(pCodecCtx->codec_id);

    if(pCodec==NULL){

        fprintf(stderr, "Unsupported codec,codec id %d\n", pCodecCtx->codec_id);

        return -1;

    }else{

        fprintf(stdout, "codec id is %d\n", pCodecCtx->codec_id);

    }

打开该解码器，主要目的是对解码器进行初始化

    if(avcodec_open2(pCodecCtx, pCodec, NULL)<0){

        fprintf(stderr, "open codec failed\n");

        return -1;

    }

创建一个用于维护所读取的packet的结构体，一个用于维护解码所得的frame的结构体

    pPacket = av_packet_alloc();

    pFrame = av_frame_alloc();

    if(pFrame == NULL||pPacket == NULL){

        fprintf(stderr, "cannot get buffer of frame or packet\n");

        return -1;

    }

从视频文件中读取packet，如果所读取的packet是video，则进行解码，解码所得的帧由pFrame进行维护。当然，并不是每次调用avcodec_decode_video2都会返回一帧，因为也可能会有需要多个packet才能解码出一帧的情况，因此只有当指示一帧是否解码完成的frameFinished为1才能对这一帧进行后续处理。

    while(av_read_frame(pFormatCtx, pPacket)>=0){

        //Only deal with the video stream of the type "videoStream"

        if(pPacket->stream_index==videoStream){

            //Decode video frame

            avcodec_decode_video2(pCodecCtx, pFrame, &frameFinished, pPacket);

            //fprintf(stdout, "Frame : %d ,pts=%lld, timebase=%lf\n", i, pFrame->pts, av_q2d(pFormatCtx->streams[videoStream]->time_base));

            if(frameFinished){

                if(i>=START_FRAME && i<=END_FRAME){

                    SaveFrame2YUV(pFrame, pCodecCtx->width, pCodecCtx->height, i);

                    i++;

                }else{

                    i++;

                    continue;

                }

            }

        }

        av_packet_unref(pPacket);

    }

当一个packet被解码后就可以调用av_packet_unref来释放该packet所占用的空间了。

Store

视频文件解码出来后通常都是YUV格式，Y、U、V三路分量分别存储在AVFrame的data[0]、data[1]、data[2]所指向的内存区域。linesize[0]、linesize[1]、linesize[2]分别指示了Y、U、V一行所占用的字节数。下面把解码所得的帧保存为YUV Planar格式。

void SaveFrame2YUV(AVFrame *pFrame, int width, int height, int iFrame){

    static FILE *pFile;

    char szFilename[32];

    int y;

    //Open file

    if(iFrame==START_FRAME){

         sprintf(szFilename, "Video.yuv");

        pFile = fopen(szFilename, "wb");

        if(pFile==NULL)

            return;

    }

    //Write YUV Data, Only support YUV420

    //Y

    for(y=0; y<height; y++){

        fwrite(pFrame->data[0]+y*pFrame->linesize[0], 1, pFrame->linesize[0], pFile);

    }

    //U

    for(y=0; y<(height+1)/2; y++){

        fwrite(pFrame->data[1]+y*pFrame->linesize[1], 1, pFrame->linesize[1], pFile);

    }

    //V

    for(y=0; y<(height+1)/2; y++){

        fwrite(pFrame->data[2]+y*pFrame->linesize[2], 1, pFrame->linesize[2], pFile);

    }

    //Close FIle

    if(iFrame==END_FRAME){

        fclose(pFile);

    }

}

最后就是释放内存，关闭decoder，关闭demuxer

    av_free(pPacket);

    av_free(pFrame);

    avcodec_close(pCodecCtx);

    avformat_close_input(&pFormatCtx);

[SimplePlayer] 1. 从视频文件中提取图像的更多相关文章

[SimplePlayer] 4. 从视频文件中提取音频
提取音频,具体点来说就是提取音频帧.提取方法与从视频文件中提取图像的方法基本一样,这里仅列出其中的不同点: 1. 由于目的提取音频,因此在demux的时候需要指定的是提取audio stream Au ...
从ROS bag文件中提取图像
从ROS bag文件中提取图像创建launch文件,如下: export.launch <launch> <node pkg="rosbag" type=&qu ...
（转载）[FFmpeg]使用ffmpeg从各种视频文件中直接截取视频图片
你曾想过从一个视频文件中提取图片吗?在Linux下就可以,在这个教程中我将使用ffmpeg来从视频中获取图片. 什么是ffmpeg?What is ffmpeg? ffmpeg是一个非常有用的命令行程 ...
从视频文件中读入数据-->将数据转换为灰度图-->对图像做canny边缘检测-->将这三个结构显示在一个图像中
//从视频文件中读入数据-->将数据转换为灰度图-->对图像做canny边缘检测-->将这三个结构显示在一个图像中 //作者:sandy //时间:2015-10-10 #inclu ...
利用ROS工具从bag文件中提取图片
bag文件是ROS常用的数据存储格式,因此要从bag文件中提取数据就需要了解一点ROS的背景知识. 1. 什么是ROS及其优势 ROS全称Robot Operating System,是BSD-lic ...
[转]【流媒體】H264—MP4格式及在MP4文件中提取H264的SPS、PPS及码流
[流媒體]H264—MP4格式及在MP4文件中提取H264的SPS.PPS及码流 SkySeraph Apr 1st 2012 Email:skyseraph00@163.com 一.MP4格式基本 ...
使用Python从PDF文件中提取数据
前言数据是数据科学中任何分析的关键,大多数分析中最常用的数据集类型是存储在逗号分隔值(csv)表中的干净数据.然而,由于可移植文档格式(pdf)文件是最常用的文件格式之一,因此每个数据科学家都应该了 ...
[数据科学] 从csv, xls文件中提取数据
在python语言中,用丰富的函数库来从文件中提取数据,这篇博客讲解怎么从csv, xls文件中得到想要的数据. 点击下载数据文件http://seanlahman.com/files/databas ...
JSFinder：一个在js文件中提取URL和子域名的脚本
JSFinder介绍 JSFinder是一款用作快速在网站的js文件中提取URL,子域名的脚本工具. 支持用法简单爬取深度爬取批量指定URL/指定JS 其他参数以往我们子域名多数使用爆破或DN ...

随机推荐

WEB前端 HTML
目录 WEB前端 HTML WEB前端 HTML TOC 什么是html? html的固有结构注释什么是标签? 标签分类什么是标签属性? 适用于大多数HTML标签的属性常用标签常用引用标签 ...
vue安装element-ui和px2rem的细节
1.按需引入element-ui vue脚手架搭建完成之后,可以到element-ui官网进行npm 安装: npm i element-ui -S 如果是完整引入可以按照官网一步一步做即可完成:这里 ...
Dynamics 365执行操作报SQL Server已超时，更改这个超时设置的方法
本人微信公众号:微软动态CRM专家罗勇 ,回复291或者20190110可方便获取本文,同时可以在第一间得到我发布的最新博文信息,follow me!我的网站是 www.luoyong.me . 当执 ...
EntityFramework实体默认值遇到Oracle自增主键
1. Oracle实现主键自动增长一般我们在Oracle实现主键自动增长,通常通过序列加触发器实现. 定义序列用于获取递增数字 CREATE SEQUENCE 序列名 [INCREMENT BY n ...
Linux系统性能分析工具 sar--系统活动情况报告
1.结论: sar 命令是linux系统上,分析系统性能的常用工具,可以查看cpu.内存.磁盘IO.文件读写.系统调用, 2.sar会有一个定时任务,定期记录当前系统信息到 /var/log/sa/ ...
18-10-31 Scrum Meeting 3
1.会议照片 2.每人的工作昨天完成的工作 1 制定配置修改配置查询配置这三个接口 2 3 获取单词对应的中文释义 4 完成测验的部分接口 5 后端对接计划的接口 6 剩余的 ...
Windows WMIC命令使用详解(附实例)
第一次执行WMIC命令时,Windows首先要安装WMIC,然后显示出WMIC的命令行提示符.在WMIC命令行提示符上,命令以交互的方式执行执行“wmic”命令启动WMIC命令行环境.这个命令可以在 ...
第五周课后作业——热门软件创新分析+附加题1&附加题3
鉴于我们寝室都热衷于手游,所以本次热门软件创新分析我就来分析一下几款热门的抽卡型手游. 阴阳师(后文简称YYS)——剧情画风唯美,配音引人入胜作为网易公司研发的一款3D日式和风回合制游戏,YYS ...
局部敏感哈希（LSH）之simhash和minhash
minhash 1. 把文档A分词形成分词向量L 2. 使用K个hash函数,然后每个hash将L里面的分词分别进行hash,然后得到K个被hash过的集合 3. 分别得到K个集合中的最小hash,然 ...
python + PyQt5 实现简易计算器
忽然想起之前一直想写个简单的计算器,今天就写了一下,界面有些简陋,但是基本功能实现没有问题以下是源码: # --*-- coding:utf-8 --*-- import sys from PyQt ...

[SimplePlayer] 1. 从视频文件中提取图像

Demux

Decode

Store

[SimplePlayer] 1. 从视频文件中提取图像的更多相关文章

随机推荐

热门专题