用WaveX实现音频文件的录音

　　原文地址：https://blog.csdn.net/gongluck93/article/details/53096013

　　1、WaveInOpen

waveInOpen
MMRESULT waveInOpen(
LPHWAVEIN phwi, // phwi是返回的句柄存放地址
UINT uDeviceID, // uDeviceID是要打开的音频设备ID号，一般都指定为WAVE_MAPPER
LPWAVEFORMATEX pwfx,
DWORD dwCallback, // dwCallback则为指定的回调函数或线程,窗口等的地址
DWORD dwCallbackInstance, // dwCallbackInstance为需要向回调函数或线程送入的用户参数
DWORD fdwOpen // fdwOpen指定回调方式：CALLBACK_FUNCTION, CALLBACK_THREAD和CALLBACK_WINDOW
);

　　2、至于pwfx，则比较关键，它指定了要以什么音频格式打开音频输入设备，它是一个结构WAVEFORMATEX：

typedef struct {
WORD wFormatTag; //可以在wFormatTag中指定一些压缩的音频格式，如G723.1，TURE DSP，等之类。不过一般都是选用WAVEFORMAT_PCM格式，
//即未压缩的音频格式，至于压缩，可以在录完后调用下面将要谈到的ACM单独进行。
WORD nChannels; //nChannels为声道数，1或者2。
DWORD nSamplesPerSec; //nSamplesPerSec为每秒采样数，8000、11025、22050、44100为几个标准值。
DWORD nAvgBytesPerSec; //每秒平均的字节数，在PCM方式中就等于nChannels*nSamplesPerSec*wBitsPerSample/8，
//但对于其它的压缩的音频格式，由于很多压缩方式是按时间片进行的，如G723.1，就是以30ms为一个压缩单位，
//这样，nAvgBytesPerSec只是一个大概的数字，并不准确，程序中的计算是不应该以这个量为准的。
//这一点在下面的压缩音频输出和ACM音频压缩中非常重要。
WORD nBlockAlign; //nBlockAlign是一个比较特殊的值，表示对音频处理时的最小处理单位，对于PCM非压缩，它就是wBitsPerSample*nChannels/8，
//而对于非压缩格式，则表示压缩/解压处理的最小单位了，如G723.1，就是30ms的数据大小（20bytes或者24bytes）。
WORD wBitsPerSample; //wBitsPerSample就是每采样值的位数，8或者16。
WORD cbSize; //cbSize则是表示该WAVEFORMATEX的结构在标准的头部之后还有多少字节数，对于很多非PCM的音频格式，
//有一些自己的定义格式参数，这些就紧跟在标准的WAVEFORMATEX后面，其大小就由cbSize指定。对于PCM格式而言，为0，或者忽略不检查。
} WAVEFORMATEX;

　　1）从声卡获取的数据格式一般设置为WAVE_FORMAT_PCM，得到的是一种最原始的音频数值。采样率，采样位宽和采样通道数比较重要，尤其采样位宽--1此采样数据量的大小，这里采用16bits。

　　2）录音得到的数据是存放在自己设定的内存块处的，为了录音的连续，通常是用多个内存数据块。当一块数据内存满了之后，是通过消息响应的方式给指定的窗口或者回调函数。在回调函数中处理这些数据。

　　开启录音的代码段如下：

 //启动录音

 BOOL CAudioRec::StartRec()

 {

     BOOL bRet = FALSE;

     //启动线程

     if(!StartThread())

     {

         goto Exit;

     }

     //打开音频设备

     if(!OpenDev())

     {

         goto Exit1;

     }

     //准备缓存

     if(!PrepareBuffer())

     {

         goto Exit2;

     }

     //开始录音

     if(!OpenRecord())

     {

         goto Exit3;

     }

     bRet = TRUE;

     goto Exit;

 Exit3:

     //释放缓存

     FreeBuffer();

 Exit2:

     //关闭录音设备

     CloseDev();

 Exit1:

     //停止线程

     StopThread();

 Exit:

     return bRet;

 }

　　停止录音的代码段如下：

 //终止录音

 BOOL CAudioRec::StopRec()

 {

     //停止录音

     if(!CloseRecord())

     {

         return FALSE;

     }

     //暂停一会

     Sleep();

     //停止线程

     if(!StopThread())

     {

         return FALSE;

     }

     //释放录音分配内存

     if(!FreeBuffer())

     {

         return FALSE;

     }

     //关闭设备

     if(!CloseDev())

     {

         return FALSE;

     }

     return TRUE;

 }

　　线程内数据处理的代码如下：

 //线程回调函数

 DWORD WINAPI CAudioRec::AudioInThreadProc(LPVOID lpParameter)

 {

     CAudioRec *pAudioRec = (CAudioRec *)lpParameter;

 //    char buffer[1024];

     MSG msg;

     while(GetMessage(&msg,,,))

     {

         switch(msg.message)

         {

         //打开音频设备

         case MM_WIM_OPEN:

             break;

         //关闭录音设备

         case MM_WIM_CLOSE:

             break;

         //录音设备返回数据

         case MM_WIM_DATA:

             WAVEHDR *pWH = (WAVEHDR *)msg.lParam;

             waveInUnprepareHeader((HWAVEIN)msg.wParam,pWH,sizeof(WAVEHDR));

             //dwBytesRecord表示此缓存中已有的数据大小

             if(pWH->dwBytesRecorded != AUDIO_BUF_SIZE)

                 break;

             if(pAudioRec->m_pCallBackProc != NULL)

             pAudioRec->m_pCallBackProc((BYTE *)pWH->lpData,AUDIO_BUF_SIZE,pAudioRec->m_dwUser);

             //获得的数据就在pWH->lpData,长度为pWH->dwBytesRecord

             waveInPrepareHeader((HWAVEIN)msg.wParam,pWH,sizeof(WAVEHDR));

             waveInAddBuffer((HWAVEIN)msg.wParam,pWH,sizeof(WAVEHDR));

         }

     }

     return msg.wParam;

 }

　　其实数据处理的关键语句只有下面这一条：pAudioRec->m_pCallBackProc((BYTE *)pWH->lpData,AUDIO_BUF_SIZE,pAudioRec->m_dwUser);

　　它利用了一个函数指针，由调用者指定相应的处理函数。

　　今天下午调试了半天，卡在结束录音这个地方。其中语句的执行顺序很重要。

　　1）先停止录音即调用waveInStop()函数 2）停止线程StopThread() 3)释放为录音准备的缓存 4）关闭录音设备

　　我自己写的时候将关闭录音设备放在了停止线程的前面，在这里结束录音总是出错。

　　2018/4/28日增加以下内容：

　　封装更好的示例参见github项目，nadernt/whistle-recognizer,github地址：https://github.com/nadernt/whistle-recognizer/tree/7bfab2839150b0df7404886a4cf60db1b7be866b

　　参见此项目中WaveIOLib文件夹内容。

用WaveX实现音频文件的录音的更多相关文章

C# NAudio录音和播放音频文件及实时绘制音频波形图（从音频流数据获取，而非设备获取）
下午写了一篇关于NAudio的录音.播放和波形图的博客,不太满意,感觉写的太乱,又总结了下 NAudio是个相对成熟.开源的C#音频开发工具,它包含录音.播放录音.格式转换.混音调整等功能.本次介绍主 ...
iOS开发系列--音频播放、录音、视频播放、拍照、视频录制
--iOS多媒体概览随着移动互联网的发展,如今的手机早已不是打电话.发短信那么简单了,播放音乐.视频.录音.拍照等都是很常用的功能.在iOS中对于多媒体的支持是非常强大的,无论是音视频播放.录制, ...
iOS开发----音频播放、录音、视频播放、拍照、视频录制
随着移动互联网的发展,如今的手机早已不是打电话.发短信那么简单了,播放音乐.视频.录音.拍照等都是很常用的功能.在iOS中对于多媒体的支持是非常强大的,无论是音视频播放.录制,还是对麦克风.摄像头的操 ...
音频播放、录音、视频播放、拍照、视频录制-b
随着移动互联网的发展,如今的手机早已不是打电话.发短信那么简单了,播放音乐.视频.录音.拍照等都是很常用的功能.在iOS中对于多媒体的支持是非常强大的,无论是音视频播放.录制,还是对麦克风.摄像头的操 ...
(原创)speex与wav格式音频文件的互相转换
我们的司信项目又有了新的需求,就是要做会议室.然而需求却很纠结,要继续按照原来发语音消息那样的形式来实现这个会议的功能,还要实现语音播放的计时,暂停,语音的拼接,还要绘制频谱图等等. 如果是wav,m ...
S3C2416裸机开发系列19_Fatfs播放录像wav音频文件
S3C2416裸机开发系列19 Fatfs播放录像wav音频文件国际象棋男孩 1048272975 多媒体资源,一般都是以文件的形式存储在固化存储器中.Fatfs所支持的fat32为windo ...
iOS音频播放、录音、视频播放、拍照、视频录制
随着移动互联网的发展,如今的手机早已不是打电话.发短信那么简单了,播放音乐.视频.录音.拍照等都是很常用的功能.在iOS中对于多媒体的支持是非常强大的,无论是音视频播放.录制,还是对麦克风.摄像头的操 ...
DxPackNet 3.音频捕捉（录音）
用DxpackNet捕捉音频其实很简单 1.初始化控件 IDxMicrophCapture microphone; private void Form1_Load(object sender, Eve ...
IOS音频1:之采用四种方式播放音频文件（一）AudioToolbox AVFoundation OpenAL AUDIO QUEUE
本文转载至 http://blog.csdn.net/u014011807/article/details/40187737 在本卷你可以学到什么? 采用四种方法设计应用于各种场合的音频播放器: 基于 ...

随机推荐

【Luogu】P3052摩天大楼里的奶牛（遗传算法乱搞）
一道状压题,但今天闲来无事又用遗传乱搞了一下. 设了一个DNA数组,DNA[i]记录第i个物品放在哪个组里.适应度是n-这个生物的组数+1. 交配选用的是轮盘赌和单亲繁殖——0.3的几率单点变异.(事 ...
uva 11798 相对运动的最小最大距离
C Dog Distance Input Standard Input Output Standard Output Two dogs, Ranga and Banga, are running ra ...
美丽的大树（codevs 2124）
题目描述 Description 平江路是苏州最美丽的道路,路中间的绿化带上种了两行漂亮的大树,每行50棵,一共100棵大树,这些大树被编上了号,编号方式如下: 1 3 5 7 ………… 45 47 ...
KS103超声波测距模块
max232:电平转换芯片,将电脑的RS-232标准串口(高+12V,低-12V)转换为(高+5V,低0V). 电脑串口(RS -232) => 单片机串口(TTL串口) SIPEX SP323 ...
网络安全(超级详细)零基础带你一步一步走进缓冲区溢出漏洞和shellcode编写！
零基础带你走进缓冲区溢出,编写shellcode. 写在前面的话:本人是以一个零基础者角度来带着大家去理解缓冲区溢出漏洞,当然如果你是开发者更好. 注:如果有转载请注明出处!创作不易.谢谢合作. 0. ...
解决Eclipse中SVN版本信息不显示的问题
eclipse 中使用 svn 插件,原本正常,未作任何更改,最近几天突然eclipse 中查看文件时,文件后面的版本号 . 文件的状态图标等等都不见了.以为有插件冲突,卸载了好多其他的相关的插 ...
基于R-Tree的最近邻查询
转自基于R-Tree的最近邻查询 BAB(Branch．and．Band)算法是由Nick Roussopoulousnl等人于1995年提出的,是最早的基于R．树的静态最近邻查询算法.该算法使用MI ...
从头认识java-15.5 使用LinkedHashSet须要注意的地方
再接着上一个章节.我们来聊一下使用LinkedHashSet须要注意的地方. LinkedHashSet特点: (1)元素是有顺序的 (2)元素是不反复的 (3)底层数据结构是依照链表的结构存储的 ( ...
Oracle db中禁止使用sqlplus的方法
先记录下来: How to Disable a SQL*Plus Connection for a User (文档 ID 124121.1)
DASH----Desktop and mobile Architecture for System Hardware----桌面和移动系统硬件架构(DASH)计划
http://baike.baidu.com/subview/813787/11301142.htm http://sites.amd.com/cn/business/it-solutions/man ...

用WaveX实现音频文件的录音

用WaveX实现音频文件的录音的更多相关文章

随机推荐

热门专题