IOS 实现录音PCM转MP3格式(边录音边转码)
最近做的一个项目,项目中有个录音功能,采用的录音方法是IOS下的AVAudioRecorder。录音效果不错,但是录制的原生.pcm文件太大,每分钟大约10M左右。
找了下相关的音频压缩方法,用speex的比较多。按照speex的示例文档折腾了半天,实现了转码压缩。speex压缩率还蛮高的,但是压缩之后的pcm文件不能播放,
需要解码回来,可是按照示例代码解码之后的pcm文件依旧不能播放。百思不得解,遂google之,未果。得到只言片语,说是没有添加wav头云云。个人感觉录音得
到的pcm文件是有wav头的,因为录制好的文件由AVAudioPlayer播放的时候并不受文件后缀名影响。由于不了解speex的编码原理,也没时间继续深究,只好寻求其他办法。
下了一个比较靠谱的speex转码demo,仔细研究了一下。感觉蛮复杂的(对于我这个音频编解码门外汉来说),大致是先要跳过pcm里的wav头,获取到单纯的
pcm文件之后再行编解码,中间需要分析pcm祯什么的,反正我是弄不来这个,看着头都大了。
继续寻找更简单的解决办法。。。看到一篇介绍使用lame来转码到mp3文件的博客(http://ikinglai.blog.51cto.com/6220785/1228309),感觉比较靠谱,从lame官网下了库文
件,在命令行里打包了.o文件,(如果不知道怎么打包,试试http://download.csdn.net/download/ixfly/4440512)导入到工程里,按照demo试了下,果然好使!编码实现非常简
单,得到的mp3文件大小大概是pcm文件的1/10左右。
接下来就是实现边录边转码了。上面博客里提供的demo实际上就是采用了边录边转码的实现。但是有两个问题,一个问题是编译通不过(把工程里lame相关的库文件都移除,
导入刚才打包的.o文件,在.o文件同目录下要有lame.h和lame.c文件,但是不要导入这两个文件,否则编译错误,具体原因还得再查一下)。另一个问题是这个demo的录音
功能不是基于AVAudioRecorder实现的,用的是AVAudioQueue,基于数据缓冲实现的,可以实时获取录音的buffer数据,做边录边转码很方便。而AVAudioRecorder则不能
实时获得录音数据。
于是只能是对AVAudioRecorder生成的pcm文件读取来实现实时转码了。主要的思路是:录音开始后开启转码线程,转码线程读取pcm文件,设定每次转码的frame大小,当
读入的文件小于frame大小,就等待,当文件大于这个值时,则读取frame大小的文件,并转码,添加至data中。直到录音停止。
- -(void)main
- {
- //mp3压缩参数
- lame = lame_init();
- lame_set_num_channels(lame, 2);
- lame_set_in_samplerate(lame, 88200);
- lame_set_brate(lame, 88);
- lame_set_mode(lame, 1);
- lame_set_quality(lame, 2);
- lame_init_params(lame);
- //这种方式初始化的NSData不需要手动释放
- NSMutableData *mp3Data = [[NSMutableData alloc] init];
- NSLog(@"record path: %@",_filePath);
- NSLog(@"out path: %@", _outFile);
- FILEFILE *fp;
- fp = fopen([_filePath cStringUsingEncoding:NSASCIIStringEncoding], "rb");
- long curpos;
- //if(fp) 这句得补上,但是还不确定是否有问题
- while (true)
- {
- //需要手动释放
- NSData *audioData = nil;
- curpos = ftell(fp);
- long startPos = ftell(fp);//文件当前读到的位置
- fseek(fp, 0, SEEK_END);
- long endPos = ftell(fp);//文件末尾位置
- long length = endPos - startPos;//剩下未读入文件长度
- fseek(fp, curpos, SEEK_SET);//把文件指针重新置回
- charchar *buff[frameSize] = {0};
- if(length > frameSize)
- {
- fread(buff, 1, frameSize, fp);
- audioData = [NSData dataWithBytes:buff length:frameSize];
- shortshort *recordingData = (shortshort *)audioData.bytes;
- int pcmLen = audioData.length;
- int nsamples = pcmLen / 2;
- unsigned char buffer[pcmLen];
- //执行encode
- int recvLen = lame_encode_buffer(lame, recordingData, recordingData, nsamples, buffer, pcmLen);
- [mp3Data appendBytes:buffer length:recvLen];
- }
- else
- {
- if (_setToStopped)
- {
- fread(buff, 1, length, fp);
- audioData = [NSData dataWithBytes:buff length:length];
- shortshort *recordingData = (shortshort *)audioData.bytes;
- int pcmLen = audioData.length;
- int nsamples = pcmLen / 2;
- unsigned char buffer[pcmLen];
- //执行encode
- int recvLen = lame_encode_buffer(lame, recordingData, recordingData, nsamples, buffer, pcmLen);
- [mp3Data appendBytes:buffer length:recvLen];
- break;
- }
- else
- {
- [NSThread sleepForTimeInterval:0.05];
- }
- }
- }
- //写入文件
- [mp3Data writeToFile:_outFile atomically:YES];
- //释放lame
- lame_close(lame);
- }
现在是一个初步的代码,好多东西没有优化,只是实现了功能。相关代码文件之后补上。
IOS 实现录音PCM转MP3格式(边录音边转码)的更多相关文章
- iOS: lame框架将PCM录音转成MP3格式
lame框架将PCM录音转成MP3格式 1.lame下载地址:https://github.com/rbrito/lame,它是一个不可执行的文件,需要借助build-lame.sh脚本将其编译成.a ...
- 在java中使用ffmpeg将amr格式的语音转为mp3格式
ffmpeg是一个非常强大的音视频处理工具,官网是:http://ffmpeg.org/. 由于ffmpeg在windows上和linux系统上的执行文件不一样(Windows上不需要安装ffmpeg ...
- lame,把ios录音转换为mp3格式
在ios设备中进行录音,录音文件的格式为caf.但这种格式在很多设备中没法播放.为了适应终端的播放功能,特将caf转换为mp3格式文件来使用. 在录制caf文件时,需要使用双通道,否则在转换为MP3格 ...
- Swift iOS实现把PCM语音转成MP3格式
最近折腾了swift的语音录制识别和转码,这块还是比较坑的,由于语音识别的准确度实测大概也就80%左右,所以还是需要上传录音文件啊.首先是用讯飞语音SDK实现语音录制和识别(语音听写),第一个坑是讯飞 ...
- 微信录音文件上传到服务器以及amr转化成MP3格式
微信公众号音频接口开发 根据业务需求,我们可能需要将微信录音保存到服务器,而通过微信上传语音接口上传到微信服务器的语音文件的有效期只有3天,所以需要将文件下载到我们自己的服务器. 上传语音接口 wx. ...
- jav音频格式转换 ffmpeg 微信录音amr转mp3
项目背景: 之前公司开发了一个微信公众号,要求把js-sdk录音文件在web网页也能播放.众所周知,html的<audio>标签ogg,mp3,wav,也有所说苹果safari支持m4a格 ...
- 微信录音文件上传到服务器以及amr转化成MP3格式,linux上转换简单方法
微信公众号音频接口开发 根据业务需求,我们可能需要将微信录音保存到服务器,而通过微信上传语音接口上传到微信服务器的语音文件的有效期只有3天,所以需要将文件下载到我们自己的服务器. 上传语音接口 wx. ...
- Electron-vue中通过WebAudioApi实现录音功能,并转换为mp3格式,实时监测音频设备变化
实现以下功能: 1.检测当前音频环境,是否支持录音(WebAudio Api): 2.获取输入.输出设备列表,获取电脑默认的音频设备: 3.试音功能,通过分析录音样本数据,判断是否录到声音: 4.实时 ...
- python进行mp3格式判断
python进行mp3格式判断 项目中使用mp3格式进行音效播放,遇到一个mp3文件在程序中死活播不出声音,最后发现它是wav格式的文件,却以mp3结尾.要对资源进行mp3格式判断,那么如何判断呢,用 ...
随机推荐
- zuul(springboot)设置静态资源代理和默认首页代码一例
直接上代码: public class StaticResourcesConfig extends WebMvcConfigurerAdapter { private static final Log ...
- Java微信分享接口开发
发布时间:2018-11-07 技术:springboot+maven 概述 微信JS-SDK实现自定义分享功能,分享给朋友,分享到朋友圈 详细 代码下载:http://www.demodas ...
- 腾讯alloyteam团队前端代码规范
来源于:http://alloyteam.github.io/CodeGuide/ 命名规则 项目命名 全部采用小写方式, 以下划线分隔. 例:my_project_name 目录命名 参照项目命名规 ...
- uri.js的用法事例
来源于:http://smoothprogramming.com/tutorials/get-set-query-string-values-from-url-using-uri-js/ Get or ...
- ios中VRGCalendarView日历控件
http://pan.baidu.com/share/link?shareid=4166002480&uk=923776187 官网 https://github.com/TjeerdVuri ...
- android开发学习---基础知识学习、如何导入已有项目和开发一个电话拨号器
一.基础知识点学习 1.Android体系结构 如图所示,android 架构分为三层: (1)最底层是linux内核,主要是各种硬件的驱动,如相机驱动(Camera Driver),闪存驱动(Fl ...
- JavaScript escape() unescape() decodeURI()函数对字符串进行编码解码
定义和用法 escape() 函数可对字符串进行编码,这样就可以在所有的计算机上读取该字符串. 语法 escape(string) 参数 描述 string 必需.要被转义或编码的字符串. 返回值 已 ...
- 自动化部署必备技能—定制化RPM包
回顾下安装软件的三种方式: 1.编译安装软件,优点是可以定制化安装目录.按需开启功能等,缺点是需要查找并实验出适合的编译参数,诸如MySQL之类的软件编译耗时过长. 2.yum安装软件,优点是全自动化 ...
- ROS学习(十)—— 使用rosed编辑ROS中的文件
一.rosed 1.作用: 直接编辑一个文件而不需要打开完整路径名 2.语法: rosed [package_name] [filename] 3.如果不知道编译哪个文件名,可以使用tab进行查询 r ...
- 【Android】Android实现监听返回键,主键(HOME),菜单键
目录结构: contents structure [+] 简介 监听 返回键 监听 主键(Home键) 监听 菜单键 一.简介 本篇文章介绍如何在Android中实现监听返回键,主键,菜单键.一般情况 ...