FFPLAY的原理（一）

概要
电影文件有很多基本的组成部分。首先，文件本身被称为容器Container，容器的类型决定了信息被存放在文件中的位置。AVI和Quicktime就是容器的例子。接着，你有一组流，例如，你经常有的是一个音频流和一个视频流。（一个流只是一种想像出来的词语，用来表示一连串的通过时间来串连的数据元素）。在流中的数据元素被称为帧Frame。每个流是由不同的编码器来编码生成的。编解码器描述了实际的数据是如何被编码Coded和解码DECoded的，因此它的名字叫做CODEC。Divx和 MP3就是编解码器的例子。接着从流中被读出来的叫做包Packets。包是一段数据，它包含了一段可以被解码成方便我们最后在应用程序中操作的原始帧的数据。根据我们的目的，每个包包含了完整的帧或者对于音频来说是许多格式的完整帧。
基本上来说，处理视频和音频流是很容易的：
10 从video.avi文件中打开视频流video_stream
20 从视频流中读取包到帧中
30 如果这个帧还不完整，跳到20
40 对这个帧进行一些操作
50 跳回到20
在这个程序中使用ffmpeg来处理多种媒体是相当容易的，虽然很多程序可能在对帧进行操作的时候非常的复杂。因此在这篇指导中，我们将打开一个文件，读取里面的视频流，而且我们对帧的操作将是把这个帧写到一个PPM文件中。

打开文件
首先，来看一下我们如何打开一个文件。通过ffmpeg，你必需先初始化这个库。（注意在某些系统中必需用<ffmpeg/avcodec.h>和<ffmpeg/avformat.h>来替换）

 AVFormatContext *pFormatCtx;

 // Open video file

 if(av_open_input_file(&pFormatCtx, argv[], NULL, , NULL)!=)

 return -; // Couldn't open file

这里注册了所有的文件格式和编解码器的库，所以它们将被自动的使用在被打开的合适格式的文件上。注意你只需要调用 av_register_all()一次，因此我们在主函数main()中来调用它。如果你喜欢，也可以只注册特定的格式和编解码器，但是通常你没有必要这样做。
现在我们可以真正的打开文件：

 AVFormatContext *pFormatCtx;

 // Open video file

 if(av_open_input_file(&pFormatCtx, argv[], NULL, , NULL)!=)

 return -; // Couldn't open file

我们通过第一个参数来获得文件名。这个函数读取文件的头部并且把信息保存到我们给的AVFormatContext结构体中。最后三个参数用来指定特殊的文件格式，缓冲大小和格式参数，但如果把它们设置为空NULL或者0，libavformat将自动检测这些参数。
这个函数只是检测了文件的头部，所以接着我们需要检查在文件中的流的信息：

 // Dump information about file onto standard error

 dump_format(pFormatCtx, , argv[], );

这个函数为pFormatCtx->streams填充上正确的信息。我们引进一个手工调试的函数来看一下里面有什么：

 // Dump information about file onto standard error

 dump_format(pFormatCtx, , argv[], );

现在pFormatCtx->streams仅仅是一组大小为pFormatCtx->nb_streams的指针，所以让我们先跳过它直到我们找到一个视频流。

 int i;

 AVCodecContext *pCodecCtx;

 // Find the first video stream

 videoStream=-;

 for(i=; i<pFormatCtx->nb_streams; i++)

 if(pFormatCtx->streams[i]->codec->codec_type==CODEC_TYPE_VIDEO) {

 videoStream=i;

 break;

 }

 if(videoStream==-)

 return -; // Didn't find a video stream

 // Get a pointer to the codec context for the video stream

 pCodecCtx=pFormatCtx->streams[videoStream]->codec;

流中关于编解码器的信息就是被我们叫做"codec context"（编解码器上下文）的东西。这里面包含了流中所使用的关于编解码器的所有信息，现在我们有了一个指向他的指针。但是我们必需要找到真正的编解码器并且打开它：

 AVCodec *pCodec;

 // Find the decoder for the video stream

 pCodec=avcodec_find_decoder(pCodecCtx->codec_id);

 if(pCodec==NULL) {

 　　fprintf(stderr, "Unsupported codec!\n");

 　　return -; // Codec not found

 }

 // Open codec

 if(avcodec_open(pCodecCtx, pCodec)<)

 return -; // Could not open codec

有些人可能会从旧的指导中记得有两个关于这些代码其它部分：添加CODEC_FLAG_TRUNCATED到 pCodecCtx->flags和添加一个hack来粗糙的修正帧率。这两个修正已经不在存在于ffplay.c中。因此，我必需假设它们不再必要。我们移除了那些代码后还有一个需要指出的不同点：pCodecCtx->time_base现在已经保存了帧率的信息。time_base是一个结构体，它里面有一个分子和分母 (AVRational)。我们使用分数的方式来表示帧率是因为很多编解码器使用非整数的帧率（例如NTSC使用29.97fps）。

保存数据
现在我们需要找到一个地方来保存帧：

 // Allocate an AVFrame structure

 pFrameRGB=avcodec_alloc_frame();

 if(pFrameRGB==NULL)

 return -;

因为我们准备输出保存24位RGB色的PPM文件，我们必需把帧的格式从原来的转换为RGB。FFMPEG将为我们做这些转换。在大多数项目中（包括我们的这个）我们都想把原始的帧转换成一个特定的格式。让我们先为转换来申请一帧的内存。

 // Allocate an AVFrame structure

 pFrameRGB=avcodec_alloc_frame();

 if(pFrameRGB==NULL)

 return -;

即使我们申请了一帧的内存，当转换的时候，我们仍然需要一个地方来放置原始的数据。我们使用avpicture_get_size来获得我们需要的大小，然后手工申请内存空间：

 uint8_t *buffer;

 int numBytes;

 // Determine required buffer size and allocate buffer

 numBytes=avpicture_get_size(PIX_FMT_RGB24, pCodecCtx->width,

 pCodecCtx->height);

 buffer=(uint8_t *)av_malloc(numBytes*sizeof(uint8_t));

av_malloc是ffmpeg的malloc，用来实现一个简单的malloc的包装，这样来保证内存地址是对齐的（4字节对齐或者2字节对齐）。它并不能保护你不被内存泄漏，重复释放或者其它malloc的问题所困扰。
现在我们使用avpicture_fill来把帧和我们新申请的内存来结合。关于AVPicture的结成：AVPicture结构体是AVFrame结构体的子集――AVFrame结构体的开始部分与AVPicture结构体是一样的。

 // Assign appropriate parts of buffer to image planes in pFrameRGB

 // Note that pFrameRGB is an AVFrame, but AVFrame is a superset

 // of AVPicture

 avpicture_fill((AVPicture *)pFrameRGB, buffer, PIX_FMT_RGB24,

 pCodecCtx->width, pCodecCtx->height);

最后，我们已经准备好来从流中读取数据了。

读取数据
我们将要做的是通过读取包来读取整个视频流，然后把它解码成帧，最好后转换格式并且保存。

 int frameFinished;

 AVPacket packet;

 i=;

 while(av_read_frame(pFormatCtx, &packet)>=) {

 // Is this a packet from the video stream?

 if(packet.stream_index==videoStream) {

 　　// Decode video frame

 　　avcodec_decode_video(pCodecCtx, pFrame, &frameFinished,

 　　packet.data, packet.size);

 　　// Did we get a video frame?

 　　if(frameFinished) {

 　　　　// Convert the image from its native format to RGB

 　　　　img_convert((AVPicture *)pFrameRGB, PIX_FMT_RGB24,

 　　　　(AVPicture*)pFrame, pCodecCtx->pix_fmt,

 　　　　pCodecCtx->width, pCodecCtx->height);

 　　　　// Save the frame to disk

 　　　　if(++i<=)

 　　　　　　SaveFrame(pFrameRGB, pCodecCtx->width,

 　　　　pCodecCtx->height, i);

 　　}

 }

 // Free the packet that was allocated by av_read_frame

 av_free_packet(&packet);

 }

这个循环过程是比较简单的：av_read_frame()读取一个包并且把它保存到AVPacket结构体中。注意我们仅仅申请了一个包的结构体 ――ffmpeg为我们申请了内部的数据的内存并通过packet.data指针来指向它。这些数据可以在后面通过av_free_packet()来释放。函数avcodec_decode_video()把包转换为帧。然而当解码一个包的时候，我们可能没有得到我们需要的关于帧的信息。因此，当我们得到下一帧的时候，avcodec_decode_video()为我们设置了帧结束标志frameFinished。最后，我们使用 img_convert()函数来把帧从原始格式（pCodecCtx->pix_fmt）转换成为RGB格式。要记住，你可以把一个 AVFrame结构体的指针转换为AVPicture结构体的指针。最后，我们把帧和高度宽度信息传递给我们的SaveFrame函数。

FFPLAY的原理（一）的更多相关文章

FFPLAY的原理
概要电影文件有很多基本的组成部分.首先,文件本身被称为容器Container,容器的类型决定了信息被存放在文件中的位置.AVI和Quicktime就是容器的例子.接着,你有一组流,例如,你经常有的是 ...
FFPLAY的原理（六）
显示视频这就是我们的视频线程.现在我们看过了几乎所有的线程除了一个--记得我们调用schedule_refresh()函数吗?让我们看一下实际中是如何做的: static void schedule ...
FFPLAY的原理（三）
播放声音现在我们要来播放声音.SDL也为我们准备了输出声音的方法.函数SDL_OpenAudio()本身就是用来打开声音设备的.它使用一个叫做SDL_AudioSpec结构体作为参数,这个结构体中包 ...
FFPLAY的原理（七）
同步音频现在我们已经有了一个比较像样的播放器.所以让我们看一下还有哪些零碎的东西没处理.上次,我们掩饰了一点同步问题,也就是同步音频到视频而不是其它的同步方式.我们将采用和视频一样的方式:做一个内 ...
FFPLAY的原理（五）
创建线程 Spawning Threads Overview Last time we added audio support by taking advantage of SDL's audio f ...
FFPLAY的原理（四）
意外情况你们将会注意到我们有一个全局变量quit,我们用它来保证还没有设置程序退出的信号(SDL会自动处理TERM类似的信号).否则,这个线程将不停地运行直到我们使用kill -9来结束程序.FF ...
FFPLAY的原理（二）
关于包Packets的注释从技术上讲一个包可以包含部分或者其它的数据,但是ffmpeg的解释器保证了我们得到的包Packets包含的要么是完整的要么是多种完整的帧. 现在我们需要做的是让SaveFr ...
ffmpeg相关资源
FFPLAY的原理(一) http://blog.csdn.net/shenbin1430/article/details/4291893 ubuntu12.04下命令安装ffplay等: sudo ...
ffplay for mfc 代码备忘录
在上传一个开源播放器项目ffplay for mfc.它会ffmpeg工程ffplay媒体播放器(ffplay.c)移植到VC环境,而使用MFC做一套接口.它可以完成一个播放器播放的基本流程的视频:解 ...

随机推荐

python中MySQLdb的使用
先举一例: 一个 Python代码实例: # -*- coding: utf-8 -*- #mysqldb import time, MySQLdb #连接 ...
iOS开发之八：UISlider、UISegmentedControl、UIPageControl的使用
本文的三种控件,用的也非常多,而我也是经常图懒,而去打开原来的项目去拷贝,现在记录一下,就不用去项目中去找这些控件的用法了. 一.UIActivityIndicatorView 的使用 UIActiv ...
ROS_Kinetic_16 ubuntu中安装使用Matlab和ROS
ROS_Kinetic_16 ubuntu(16.04)中安装使用Matlab(2015b)和ROS(kinetic) 参考网址:http://cn.mathworks.com/hardware-su ...
文件I/O实践(1) --基础API
什么是I/O 输入/输出是内存和外设之间拷贝数据的过程: 设备->内存: 输入操作内存->设备: 输出操作高级I/O: ANSI C提供的标准I/O库函数成为高级I/O, 也称为带缓冲 ...
(NO.00001)iOS游戏SpeedBoy Lite成形记(十四)
下面要启用场景的触摸功能,在GameScene.m的didLoadFromCCB方法里添加下面一行: self.userInteractionEnabled = YES; 然后还需要给GameScen ...
学习pthreads，使用属性对象创建结合线程和分离线程
当我们创建了子线程,是让它犹如脱缰之马,信步驰骋,还是如乖巧听话的孩子,时不时教导一下呢?针对这个问题,本文介绍线程的结合和分离,结构分为三个部分,第一部分给出代码示例,第二部分对代码进行讲解,第三部 ...
Android JSON解析库Gson和Fast-json的使用对比和图书列表小案例
Android JSON解析库Gson和Fast-json的使用对比和图书列表小案例继上篇json解析,我用了原生的json解析,但是在有些情况下我们不得不承认,一些优秀的json解析框架确实十分的 ...
ARM Linux内核Input输入子系统浅解
--以触摸屏驱动为例第一章.了解linux input子系统 Linux输入设备总类繁杂,常见的包括有按键.键盘.触摸屏.鼠标.摇杆等等,他们本身就是字符设备,而linux内核将这些 ...
Ext.Net 1.x_Ext.Net.GridPanel 事件
1.行双击事件首先设置选择方式为RowSelectionModel单行选中 [html] view plaincopy <SelectionModel> <ext:RowSelec ...
[Ext.Net]动态生成控件(二)--js动态添加文本框
转自:http://www.ext.net.cn/forum.php?mod=viewthread&tid=11931 点击一个按钮就出现一行控件,点击删除控件就可将一行控件删除,这是不是你一 ...

FFPLAY的原理（一）

FFPLAY的原理（一）的更多相关文章

随机推荐

热门专题