Android在MediaMuxer和MediaCodec用例

在Android多媒体类，MediaMuxer和MediaCodec这是一个相对年轻，他们是JB 4.1和JB 4.3据介绍。

前者被用来产生一个混合的音频和视频的多媒体文件。的缺点是，现在可以只支持一个audio track而一个video track，而唯一支持mp4出口。然是新生事物，相信之后的版本号应该会有大的改进。MediaCodec用于将音视频进行压缩编码，它有个比較牛X的地方是能够对Surface内容进行编码，如KK 4.4中屏幕录像功能就是用它实现的。

注意它们和其他一些多媒体相关类的关系和差别：MediaExtractor用于音视频分路，和MediaMuxer正好是反过程。MediaFormat用于描写叙述多媒体数据的格式。MediaRecorder用于录像+压缩编码。生成编码好的文件如mp4, 3gpp，视频主要是用于录制Camera preview。MediaPlayer用于播放压缩编码后的音视频文件。

AudioRecord用于录制PCM数据。AudioTrack用于播放PCM数据。PCM即原始音频採样数据。能够用如vlc播放器播放。

当然了，通道採样率之类的要自己设。由于原始採样数据是没有文件头的，如：

vlc --demux=rawaud --rawaud-channels 2 --rawaud-samplerate 44100 audio.pcm

回到MediaMuxer和MediaCodec这两个类，它们的參考文档见http://developer.android.com/reference/android/media/MediaMuxer.html和http://developer.android.com/reference/android/media/MediaCodec.html。里边有使用的框架。这个组合能够实现非常多功能，比方音视频文件的编辑（结合MediaExtractor），用OpenGL绘制Surface并生成mp4文件，屏幕录像以及类似Camera
app里的录像功能（尽管这个用MediaRecorder更合适）等。

这里以一个非常无聊的功能为例，就是在一个Surface上绘图编码生成视频。同一时候用MIC录音编码生成音频，然后将音视频混合生成mp4文件。

程序本身没什么用。可是演示样例了MediaMuxer和MediaCodec的基本使用方法。本程序主要是基于两个測试程序：一个是Grafika中的SoftInputSurfaceActivity和HWEncoderExperiments。它们一个是生成视频，一个生成音频，这里把它们结合一下，同一时候生成音频和视频。基本框架和流程例如以下：

首先是录音线程，主要參考HWEncoderExperiments。

通过AudioRecord类接收来自麦克风的採样数据，然后丢给Encoder准备编码：

AudioRecord audio_recorder;

audio_recorder = new AudioRecord(MediaRecorder.AudioSource.MIC,

        SAMPLE_RATE, CHANNEL_CONFIG, AUDIO_FORMAT, buffer_size);

// ...

audio_recorder.startRecording();

while (is_recording) {

    byte[] this_buffer = new byte[frame_buffer_size];

    read_result = audio_recorder.read(this_buffer, 0, frame_buffer_size); // read audio raw data

    // …

    presentationTimeStamp = System.nanoTime() / 1000;

    audioEncoder.offerAudioEncoder(this_buffer.clone(), presentationTimeStamp);  // feed to audio encoder

}

这里也能够设置AudioRecord的回调（通过setRecordPositionUpdateListener()）来触发音频数据的读取。offerAudioEncoder()里主要是把audio採样数据送入音频MediaCodec的InputBuffer进行编码：

ByteBuffer[] inputBuffers = mAudioEncoder.getInputBuffers();

int inputBufferIndex = mAudioEncoder.dequeueInputBuffer(-1);

if (inputBufferIndex >= 0) {

    ByteBuffer inputBuffer = inputBuffers[inputBufferIndex];

    inputBuffer.clear();

    inputBuffer.put(this_buffer);

    ...

    mAudioEncoder.queueInputBuffer(inputBufferIndex, 0, this_buffer.length, presentationTimeStamp, 0);

}

以下，參考Grafika-SoftInputSurfaceActivity，并增加音频处理。

主循环大体分四部分：

try {

    // Part 1

    prepareEncoder(outputFile);

    ...

    // Part 2

    for (int i = 0; i < NUM_FRAMES; i++) {

        generateFrame(i);

        drainVideoEncoder(false);

        drainAudioEncoder(false);

    }

    // Part 3

    ...

    drainVideoEncoder(true);

    drainAudioEncoder(true);

}  catch (IOException ioe) {

    throw new RuntimeException(ioe);

} finally {

    // Part 4

    releaseEncoder();

}

第1部分是准备工作。除了video的MediaCodec，这里还初始化了audio的MediaCodec：

MediaFormat audioFormat = new MediaFormat();

audioFormat.setInteger(MediaFormat.KEY_SAMPLE_RATE, 44100);

audioFormat.setInteger(MediaFormat.KEY_CHANNEL_COUNT, 1);

...

mAudioEncoder = MediaCodec.createEncoderByType(AUDIO_MIME_TYPE);

mAudioEncoder.configure(audioFormat, null, null, MediaCodec.CONFIGURE_FLAG_ENCODE);

mAudioEncoder.start();

第2部分进入主循环，app在Surface上直接画图，因为这个Surface是从MediaCodec中用createInputSurface()申请来的，所以画完后不用显式用queueInputBuffer()交给Encoder。

drainVideoEncoder()和drainAudioEncoder()分别将编码好的音视频从buffer中拿出来（通过dequeueOutputBuffer()），然后交由MediaMuxer进行混合（通过writeSampleData()）。

注意音视频通过PTS（Presentation
time stamp。决定了某一帧的音视频数据何时显示或播放）来同步，音频的time stamp需在AudioRecord从MIC採集到数据时获取并放到对应的bufferInfo中，视频因为是在Surface上画，因此直接用dequeueOutputBuffer()出来的bufferInfo中的即可，最后将编码好的数据送去MediaMuxer进行多路混合。

注意这里Muxer要等把audio track和video track都增加了再開始。

MediaCodec在一開始调用dequeueOutputBuffer()时会返回一次INFO_OUTPUT_FORMAT_CHANGED消息。

我们仅仅需在这里获取该MediaCodec的format，并注冊到MediaMuxer里。

接着推断当前audio track和video track是否都已就绪，假设是的话就启动Muxer。

总结来说，drainVideoEncoder()的主逻辑大致例如以下，drainAudioEncoder也是类似的。仅仅是把video的MediaCodec换成audio的MediaCodec就可以。

while(true) {

    int encoderStatus = mVideoEncoder.dequeueOutputBuffer(mBufferInfo, TIMEOUT_USEC);

    if (encoderStatus == MediaCodec.INFO_TRY_AGAIN_LATER) {

        ...

    } else if (encoderStatus == MediaCodec.INFO_OUTPUT_BUFFERS_CHANGED) {

        encoderOutputBuffers = mVideoEncoder.getOutputBuffers();

    } else if (encoderStatus == MediaCodec.INFO_OUTPUT_FORMAT_CHANGED) {

        MediaFormat newFormat = mAudioEncoder.getOutputFormat();

        mAudioTrackIndex = mMuxer.addTrack(newFormat);

        mNumTracksAdded++;

        if (mNumTracksAdded == TOTAL_NUM_TRACKS) {

            mMuxer.start();

        }

    } else if (encoderStatus < 0) {

        ...

    } else {

        ByteBuffer encodedData = encoderOutputBuffers[encoderStatus];

        ...

        if (mBufferInfo.size != 0) {

            mMuxer.writeSampleData(mVideoTrackIndex, encodedData, mBufferInfo);

        }

        mVideoEncoder.releaseOutputBuffer(encoderStatus, false);

        if ((mBufferInfo.flags & MediaCodec.BUFFER_FLAG_END_OF_STREAM) != 0) {

            break;

        }

    }

}

第3部分是结束录制。发送EOS信息。这样在drainVideoEncoder()和drainAudioEncoder中就能够依据EOS退出内循环。

第4部分为清理工作。

把audio和video的MediaCodec，MediaCodec用的Surface及MediaMuxer对象释放。

最后几点注意：

1. 在AndroidManifest.xml里加上录音权限，否则创建AudioRecord对象时铁定失败：

<uses-permission android:name="android.permission.RECORD_AUDIO"/>

2. 音视频通过PTS同步，两个的单位要一致。

3. MediaMuxer的使用要依照Constructor -> addTrack -> start -> writeSampleData -> stop 的顺序。假设既有音频又有视频，在stop前两个都要writeSampleData()过。

Code references：

Grafika: https://github.com/google/grafika

Bigflake: http://bigflake.com/mediacodec/

HWEncoderExperiments：https://github.com/OnlyInAmerica/HWEncoderExperiments/tree/audioonly/HWEncoderExperiments/src/main/java/net/openwatch/hwencoderexperiments

Android test：http://androidxref.com/4.4.2_r2/xref/cts/tests/tests/media/src/android/media/cts/

http://androidxref.com/4.4.2_r2/xref/pdk/apps/TestingCamera2/src/com/android/testingcamera2/CameraRecordingStream.java

Android在MediaMuxer和MediaCodec用例 - audio+video的更多相关文章

android 原生 MediaPlayer 和 MediaCodec 的区别和联系（三）
目录: (4)Android 官方网站对 MediaCodec的介绍注:编解码器特定数据(Code-specific Data,简写为csd) 部分结合网上资料加入了补充和个人理解.请悉知 ...
Android BottomSheet：以选取图片为例（2）
Android BottomSheet:以选取图片为例(2) 附录文章5简单介绍了常见的分享面板在BottomSheet中的具体应用.本文再以常见的选取图片为例写一个例子. 布局文件: < ...
使用HTML5抓取 Audio & Video
原文地址: http://www.html5rocks.com/en/tutorials/getusermedia/intro/ 本地化的文章: http://www.html5rocks.com/z ...
[jPlayer] HTML5 Audio & Video for jQuery
---------------------------------------------------------------------------------------------------- ...
The jQuery HTML5 Audio / Video Library (jQuery jPlayer插件给你的站点增加视频和音频功能)
http://jplayer.org/ The jQuery HTML5 Audio / Video Library jPlayer is the completely free and open s ...
HTML5 Audio/Video 标签,属性,方法,事件汇总
HTML5 Audio/Video 标签,属性,方法,事件汇总 (转) 2011-06-28 13:16:48 <audio> 标签属性:src:音乐的URLpreload:预加载au ...
Capturing Audio & Video in HTML5
使用HTML5抓取 Audio & Video 原文地址: http://www.html5rocks.com/en/tutorials/getusermedia/intro/ 本地化的文章: ...
[转载]HTML5 Audio/Video 标签,属性,方法,事件汇总
<audio> 标签属性: src:音乐的URL preload:预加载 autoplay:自动播放 loop:循环播放 controls:浏览器自带的控制条 <audio id=& ...
如何让windows版Safari支持H5 audio/video?
今天在windows版Safari上看效果的时候惊奇地发现它竟然不支持HTML5的audio/video, 这样的话就无法复现不少ios上出现的问题. 在同事提醒下, 发现Safari HTML5 A ...

随机推荐

纯干货，Spring-data-jpa详解，全方位介绍
本篇进行Spring-data-jpa的介绍,几乎涵盖该框架的所有方面,在日常的开发当中,基本上能满足所有需求.这里不讲解JPA和Spring-data-jpa单独使用,所有的内容都是在和Spring ...
disabled
http://blog.csdn.net/dinglang_2009/article/details/6974887 如果把页面viewstate设为disabled 那么 ispost就一直为fal ...
java.lang和java.lang.annotation中实现Annotation的类小结
加了注解,等于打上了某种标记,没加,则等于没有某种标记,以后,其他程序可以用反射来了解你的类上面有无何种标记,看你有什么标记,就去干相应的事.标记可以加在类,方法,字段,包上,方法的参数上. (1) ...
HDU4612 Warm up 边双（重边）缩点+树的直径
题意:一个连通无向图,问你增加一条边后,让原图桥边最少分析:先边双缩点,因为连通,所以消环变树,每一个树边都是桥,现在让你增加一条边,让桥变少(即形成环) 所以我们选择一条树上最长的路径,连接两端, ...
lightoj 1016
水题,排个序直接搞. #include<cstdio> #include<string> #include<cstring> #include<iostrea ...
【ruby on rail 项目之 VPS下载机】
[idea] 感觉互联网上国内难以下载资源的资源,通过VPS下载后再拖回来,想做个集成功能的.这里定个计划.打算开始做,项目会在github上同步更新. [start]
树-伸展树(Splay Tree)
伸展树概念伸展树(Splay Tree)是一种二叉排序树,它能在O(log n)内完成插入.查找和删除操作.它由Daniel Sleator和Robert Tarjan创造. (01) 伸展树属于二 ...
uva11732 strcmp() Anyone?
题意:给出多个字符串,两两配对,求总配对次数. 思路:如果两个字符串一样,ans=strlen(字符串)*2+2,如果不同,ans=公共前缀长度*2+1:用左儿子右兄弟建字典树.插入一个字符计算一次. ...
Android 数据存储相关
Application使用总结:http://www.tuicool.com/articles/JVBja2 枚举 Map<>
Redhat Enterprise Linux 6.4图形界面的中文问题
一.界面中文,但Windows中的中文文件名上传到linux后乱码. .bashrc文件: export LANG=zh_CN.UTF-8 /etc/sysconfig/i18n文件: LANG=&q ...

Android在MediaMuxer和MediaCodec用例 - audio+video

Android在MediaMuxer和MediaCodec用例 - audio+video的更多相关文章

随机推荐

热门专题