libav(ffmpeg)简明教程（1）

突然发现又有好久没有写技术blog了，主要原因是最近时间都用来研究libav去了(因为api极类似ffmpeg，虽然出自同一份代码的另外一个分支，因项目选用libav，故下文均用libav代替)，其实要从知道这个库的时候已经很久了，早在加入avplayer开源社区的已经略有耳闻，看着他们讨论我却一直不知这个库能具体帮我做到哪些功能，插不上嘴呢，更强迫了我学习它的热情，下面就来一一解惑，希望就能帮到类似几个月前的我那样的同行。

1、提供API解码、编码市面上主流几乎全部的视频、音频格式文件。

2、通用视频转换命令行工具ffmpeg、avconv，可以帮我们快速将媒体文件格式进行转换，且做一些简单的resize或者resample，其工具提供了非常强大的filter，各种变幻根据参数都能实现，没有你想不到的，只有你找不到的。

3、简单的播放器avplay命令，这个播放器支持libav所有能够支持的video codec，算个简单的万能播放器了，虽然seek功能弱爆了，并且还没有pause、stop、显示时间等等功能，不过有些应急时候绝对首选它了。

4、libav还提供avprobe命令，可以让你瞬间了解这个媒体文件其中真实的video/audio编码（不会受到文件扩展名的误导）、拥有哪些stream（一般MP4分为视频、音频、字幕），一目了然。

读到此你一定会很感激我，不像大多数技术博客那样直接贴上很多大段大段的代码一下吓走好多初学者....我不能保证接下来一定不贴代码上来，但是我会尽量克制自己的....

本文主要将以第1点API解码编码的介绍为主。因为libav是基于C实现的，调用习惯全是基于函数式的，这样的优点就是跨平台好吧，缺点就是会使client代码比较臃肿，到处充斥着free、alloc等等。如果你是一个纯面向对象发烧支持者，请不要往下看，以免伤身且药还不能停。

libav提供一个函数avformat_open_input，即打开一个媒体文件，用AVFormatContext指针接受返回结果，代码看起来就是这样：

AVFormatContext* pformat_context = avformat_alloc_context();

if(avformat_open_input(&pformat_context, file.c_str(), nullptr, ) != )

{

     printf("can't open the file %s\n", file.c_str());

     return false;

}

然后你要做的是将所打开的FormatContext读取其中的stream，其中会有各种各样的stream类型，你需要做的事情就是将这个stream的index记录下来。

shared_ptr<AVFormatContext> format_context(pformat_context, [](AVFormatContext*& p){ avformat_close_input(&p); });

    if(avformat_find_stream_info(format_context.get(), nullptr) < )

    {

        printf("can't find suitable codec parameters\n");

        return false;

    }

    // find out the audio and video stream

    int video_stream_index = -, audio_stream_index = -;

    for(unsigned int i = ; i < format_context->nb_streams && (video_stream_index == - || audio_stream_index == -); i++)

    {

        if(format_context->streams[i]->codec->codec_type == AVMEDIA_TYPE_VIDEO)

        {

            video_stream_index = i;

        }

        else if (format_context->streams[i]->codec->codec_type == AVMEDIA_TYPE_AUDIO)

        {

            audio_stream_index = i;

        }

    }

    if(video_stream_index == - && audio_stream_index == -)

    {

        printf("input file contains no video stream or audio stream.\n");

        return false;

    }

对照stream可以使用avprobe命令查看视频文件本身的内容。
获取到stream信息之后，你就需要创建decoder来解码视频啦~ libav提供一个函数avcodec_find_decoder根据你自己找到的video index和audio index去寻找codec_id作为参数得到AVCodec指针，再使用函数avcodec_open2传入这个指针即可。

// open the video decoder

    AVCodecContext* video_codec_context = nullptr;

    if (video_stream_index != -)

    {

        video_codec_context = format_context->streams[video_stream_index]->codec;

        AVCodec* video_codec = avcodec_find_decoder(video_codec_context->codec_id);

        if(video_codec == nullptr)

        {

            printf("can't find suitable video decoder\n");

            return false;

        }

        if(avcodec_open2(video_codec_context, video_codec, nullptr) < )

        {

            printf("can't open the video decoder\n");

            return false;

        }

    }

    // open the audio decoder

    AVCodecContext* audio_codec_context = nullptr;

    if (audio_stream_index != -)

    {

        audio_codec_context = format_context->streams[audio_stream_index]->codec;

        AVCodec* audio_codec = avcodec_find_decoder(audio_codec_context->codec_id);

        if (audio_codec == nullptr)

        {

            printf("can't find suitable audio decoder\n");

            return false;

        }

        if (avcodec_open2(audio_codec_context, audio_codec, nullptr) < )

        {

            printf("can't open the audio decoder\n");

            return false;

        }

    }

注意，open之后一定要调用对应的api close，比方avformat_close_input这些都是必备的，就不全贴出来了。

接下来讲这课程最重要的部分——decode video，先创建用于接收av_read_frame读出来的数据包，

AVPacket packet = {};

av_init_packet(&packet);

然后使用一个循环调用av_read_frame，查注释你会知道return>=0为成功，然后判断packet的stream_index是video_stream_index还是audio_stream_index，从而使用不同的decode函数（avcodec_decode_video2 / avcodec_decode_audio4）做解码，视频如果是MP4将得到AV_PIX_FMT_YUV420P数据，音频将得到原始音频AV_SAMPLE_FMT_FLTP采样数据。

但是我们一般不会使用YUV420P进行图像、视频处理，而是使用bitmap来进行处理，所以需要在这里借助另外一个函数sws_scale，第一个参数查看源码了解到是一个结构体struct，并不需要手动填充它，而且你也没办法手动填充它，libav并不希望你这么做（没有将细节写在include中），因此有一个sws_getContext函数是专门做这件事情的。

struct SwsContext *sws_getContext(

       int srcW, int srcH, enum AVPixelFormat srcFormat,

       int dstW, int dstH, enum AVPixelFormat dstFormat,

       int flags, SwsFilter *srcFilter,

       SwsFilter *dstFilter, const double *param);

看到参数你就能很容易的猜到，你需要提供原视频的尺寸和格式，可以在已打开的视频的codec中获得，目标视频尺寸你自己随便设置都可以，dstFormat可以设置为：AV_PIX_FMT_BGRA，更多可以参见：pixfmt.h 中的 enum AVPixelFormat，如果是BGRA，图片则为32位，包含透明通道，方便之后叠加图层处理。如果读者跟着我的步骤走，应该就能达到连续输出图片的功能了，再加入图像识别的更多功能：脸谱识别、手势识别、车牌识别，就直接可以用了，是不是很激动？

libav(ffmpeg)简明教程（1）的更多相关文章

libav(ffmpeg)简明教程（2）
距离上一次教程又过去了将近一个多月,相信大家已经都将我上节课所说的东西所完全消化掉了. 这节课就来点轻松的,说说libav的命令使用吧. 注:遇到不懂的或者本文没有提到的可以用例如命令后加 --hel ...
2013 duilib入门简明教程 -- 第一个程序 Hello World(3)
小伙伴们有点迫不及待了么,来看一看Hello World吧: 新建一个空的win32项目,新建一个main.cpp文件,将以下代码复制进去: #include <windows.h> #i ...
2013 duilib入门简明教程 -- 部分bug (11)
一.WindowImplBase的bug 在第8个教程[2013 duilib入门简明教程 -- 完整的自绘标题栏(8)]中,可以发现窗口最大化之后有两个问题, 1.最大化按钮的样式 ...
2013 duilib入门简明教程 -- 部分bug 2 (14)
上一个教程中提到了ActiveX的Bug,即如果主窗口直接用变量生成,则关闭窗口时会产生崩溃如果用new的方式生成,则不会崩溃,所以给出一个临时的快速解决方案,即主窗口 ...
2013 duilib入门简明教程 -- 自绘控件 (15)
在[2013 duilib入门简明教程 -- 复杂控件介绍 (13)]中虽然介绍了界面设计器上的所有控件,但是还有一些控件并没有被放到界面设计器上,还有一些常用控件duilib并没有提供(比如 ...
2013 duilib入门简明教程 -- 事件处理和消息响应 (17)
界面的显示方面就都讲完啦,下面来介绍下控件的响应. 前面的教程只讲了按钮和Tab的响应,即在Notify函数里处理.其实duilib还提供了另外一种响应的方法,即消息映射DUI_BEG ...
2013 duilib入门简明教程 -- FAQ (19)
虽然前面的教程几乎把所有的知识点都罗列了,但是有很多问题经常在群里出现,所以这里再次整理一下. 需要注意的是,在下面的问题中,除了加上XML属性外,主窗口必须继承自WindowImpl ...
Mac安装Windows 10的简明教程
每次在Mac上安装Windows都是一件非常痛苦的事情,曾经为了装Win8把整台Mac的硬盘数据都弄丢了,最后通过龟速系统恢复模式恢复了MacOSX(50M电信光纤下载了3天才把系统下载完),相信和我 ...
Docker简明教程
Docker简明教程 [编者的话]使用Docker来写代码更高效并能有效提升自己的技能.Docker能打包你的开发环境,消除包的依赖冲突,并通过集装箱式的应用来减少开发时间和学习时间. Docker作 ...

随机推荐

三层登录——VB.NET版
前言由于下面的机房收费系统重构自己要用VB.NET进行重构,所以在敲三层登录的时候,实践了一份C#版三层登录,接着就是VB.NET版的三层登录.话说还有七层登录,一下子感觉三层又矮小了.万丈高楼平地 ...
51nod1428(优先队列)
题目链接:http://www.51nod.com/onlineJudge/questionCode.html#!problemId=1428 题意:中文题诶- 思路:贪心问最少要多少教室就是求最多 ...
洛谷P3803 【模板】多项式乘法（FFT）
P3803 [模板]多项式乘法(FFT) 题目背景这是一道FFT模板题题目描述给定一个n次多项式F(x),和一个m次多项式G(x). 请求出F(x)和G(x)的卷积. 输入输出格式输入格式: ...
快速枚举的迭代器类NSEnumerator
另外,OC中有一个专门的快速枚举的迭代器类NSEnumerator,这个类的使用方法如下: //得到一个对应的enumerator对象 NSEnumerator * enumerator = [se ...
webpack安装及使用
npm run dev 第一次使用的时候用u盘将某些软件带过去. 所以要找到U盘 2.9.x的版本[推荐] 安装:npm install -g vue-cli 检测版本 vue -V/--versio ...
KMP 串的模式匹配（25 分）
给定两个由英文字母组成的字符串 String 和 Pattern,要求找到 Pattern 在 String 中第一次出现的位置,并将此位置后的 String 的子串输出.如果找不到,则输出“Not ...
devtools实现springboot的热部署
spring-boot-devtools介绍: spring-boot-devtools 是一个为开发者服务的一个模块,其中最重要的功能就是自动应用代码更改到最新的App上面去.原理是在发现代码有更改 ...
UVALive 7511 L - Multiplication Table 数学模拟题，暴力
给定一副表,问其是否合法. 思路:当全部是?的时候,是合法的. 如果不是,那么,就找到一个数字,把它拆成若干个a*b的形式,去判断其它点是否合法即可. 拆分数字的时候,只需要枚举到sqrt(n),因为 ...
UVALive 7500 Boxes and Balls 2015EC final 签到题二分
分析题目后,得到要求的是最接近n的一个数,并且这个数字能写成1+2+3+....+x = ans这种形式. 要求的是最大的值. 这题就直接二分去做吧.二分出一个f(mid)<=n的最大值. 最后 ...
Spring Junit测试（非web，即不包含Controller测试）
使用Spring-Test对Spring框架进行单元测试配置过程: lib加入导入spring-test.jar和junit包或者使用Maven依赖: <dependency> < ...

libav(ffmpeg)简明教程（1）

libav(ffmpeg)简明教程（1）的更多相关文章

随机推荐

热门专题