音频操作所需头文件和链接库

#include<mmsystem.h>
#include<mmreg.h>
#pragma  comment(lib, "winmm.lib")

由于音频采集过程是一个持续过程,所以建议为它们各自分配一个线程,而使用MFC的 CWinThread 类是一个不错的选择,笔者就是利用CWinThread类将这两个功能封装成了两个独立的类,为以后的使用提供了很大的便利性。笔者在此为读者提供本人写好的一个工程,此工程为视频语音采集的不完善版,目前实现语音本地采集与播放,VFW视频采集与显示(视频不清晰),在后续章节会将VFW视频采集进行总结,敬请期待。。。。。

工程下载地址:http://pan.baidu.com/share/link?shareid=190628&uk=2735225556 中选择  VideoPlay.rar 下载,此项目是用vs2010编译

一、音频采集

操作步骤:

1、分配数据buffer,通过WAVEHDR结构体保存,准备存储采集到的音频数据,此处应该根据采集频率设置足量的buffer

void CRecodeSound::PreCreateHeader()
{
    for(int i=0;i<MAXRECBUFFER;i++)
        m_RecHead[i]=CreateWaveHeader();
    m_IsAllocated = 1;
}
LPWAVEHDR  CRecodeSound::CreateWaveHeader()
{
    LPWAVEHDR lpHdr = new WAVEHDR;

if(lpHdr==NULL)
    {
        m_RecodeLog.WriteString(TEXT("\n Unable to allocate the memory"));
        return NULL;
    }

ZeroMemory(lpHdr, sizeof(WAVEHDR));
    char* lpByte = new char[RECBUFFER];//m_WaveFormatEx.nBlockAlign*SOUNDSAMPLES)];

if(lpByte==NULL)
    {
        m_RecodeLog.WriteString(TEXT("\n Unable to allocate the memory"));
        return NULL;
    }
    lpHdr->lpData =  lpByte;
    lpHdr->dwBufferLength =RECBUFFER;   // (m_WaveFormatEx.nBlockAlign*SOUNDSAMPLES);
    return lpHdr;

}

2、初始化音频格式结构体 WAVEFORMATEX。

memset(&m_WaveFormatEx, 0, sizeof(m_WaveFormatEx));
m_WaveFormatEx.wFormatTag = WAVE_FORMAT_PCM;//声音格式为PCM        
m_WaveFormatEx.nChannels = 1;    //采样声道数,对于单声道音频设置为1,立体声设置为2
m_WaveFormatEx.wBitsPerSample = 8;//采样比特  8bits/次
m_WaveFormatEx.cbSize = 0;//一般为0
m_WaveFormatEx.nSamplesPerSec = 8000; //采样率 16000 次/秒
m_WaveFormatEx.nBlockAlign = 1; //一个块的大小,采样bit的字节数乘以声道数
m_WaveFormatEx.nAvgBytesPerSec = 8000; //每秒的数据率,就是每秒能采集多少字节的数据

3、waveInOpen打开音频输入设备准备开始采集

//开启音频采集
MMRESULT mmReturn = ::waveInOpen( &m_hRecord, WAVE_MAPPER,
    &m_WaveFormatEx, ::GetCurrentThreadId(), 0, CALLBACK_THREAD);

//Error has occured while opening device

if(mmReturn != MMSYSERR_NOERROR ) //打开采集失败
{
    displayError(mmReturn,"Open");
    return ;//FALSE;
}

4、waveInPrepareHeader 和 waveInAddBuffer 配合将准备好的buffer提供给设备

//将准备好的buffer提供给音频输入设备
for(int i=0; i < MAXRECBUFFER ; i++)
{
    //准备一个bufrer给输入设备
    mmReturn = ::waveInPrepareHeader(m_hRecord,m_RecHead[i], sizeof(WAVEHDR));
    //发送一个buffer给指定的输入设备,当buffer填满将会通知程序
    mmReturn = ::waveInAddBuffer(m_hRecord, m_RecHead[i], sizeof(WAVEHDR));
}

5、waveInStart正式开始采集

//开启指定的输入采集设备
mmReturn = ::waveInStart(m_hRecord);

if(mmReturn!=MMSYSERR_NOERROR )  //开始采集失败
    displayError(mmReturn,"Start");
else
    m_IsRecoding = TRUE;

6、每当一个buffer数据填满时,会触发 MM_WIM_DATA 消息,在程序中捕获此消息,通过消息传递过来的 lParam,为指向数据buffer的WAVEHDR指针。采集到此数据时可以根据程序需要对其做相应的处理。本程序是直接将采集到的数据提供给播放线程直接播放,你也可以通过socket发送到远端在播放,就可以网络语音了。

void CRecodeSound::OnSoundData(WPARAM wParam, LPARAM lParam)
{
    m_RecodeLog.WriteString(TEXT("\nIn the onsound data"));

if(m_IsRecoding==FALSE) //如果当前不在采集状态
        return ;//FALSE;

LPWAVEHDR lpHdr = (LPWAVEHDR) lParam;

if(lpHdr->dwBytesRecorded==0 || lpHdr==NULL)
        return ;//ERROR_SUCCESS;

//使采集过程,知道此buffer已经沾满,不能再填充
    ::waveInUnprepareHeader(m_hRecord, lpHdr, sizeof(WAVEHDR));

//将采集到的声音发送给播放线程
    ((CVideoPlayDlg *)m_pDlg)->m_pPlaySound->PostThreadMessage(WM_PLAYSOUND_PLAYBLOCK, lpHdr->dwBytesRecorded, (LPARAM)lpHdr->lpData);
    
    // Send recorded audio to remote host…
    /*
    if(lpHdr->lpData!=NULL )
        ( (CVideoNetDlg*) dlg )->daudio.SendAudioData((unsigned char *)lpHdr->lpData,lpHdr->dwBytesRecorded);
    */

if(m_IsRecoding)
    {
        //重新将buffer恢复到准备填充状态
        ::waveInPrepareHeader(m_hRecord, lpHdr, sizeof(WAVEHDR));
        ::waveInAddBuffer(m_hRecord, lpHdr, sizeof(WAVEHDR));
    }
}

7、在要停止采集是使用waveInStop停止采集数据。

mmReturn = ::waveInStop(m_hRecord);

8、停止采集成功,立即waveInReset重置设备,重置设备将会导致所有的采集buffer反馈给程序。

if(!mmReturn) //停止采集成功,立即重置设备,重置设备将会导致所有的buffer反馈给程序
{
    m_IsRecoding = FALSE;
    mmReturn = ::waveInReset(m_hRecord);  //重置设备
}

9、延时一段时间,等待所有的数据buffer都被程序处理完成

Sleep(500); //等待一段时间,使buffer反馈完成

10、waveInClose关闭设备

if(!mmReturn) //重置设备成功,立即关闭设备
        mmReturn = ::waveInClose(m_hRecord); //关闭设备

二、音频播放

操作步骤:

1、初始化音频数据格式结构体 WAVEFORMATEX

//初始化音频格式结构体
memset(&m_WaveFormatEx, 0, sizeof(m_WaveFormatEx));
m_WaveFormatEx.wFormatTag = WAVE_FORMAT_PCM;
m_WaveFormatEx.nChannels = 1;
m_WaveFormatEx.wBitsPerSample = 8;
m_WaveFormatEx.cbSize = 0;
m_WaveFormatEx.nSamplesPerSec = 8000;
m_WaveFormatEx.nAvgBytesPerSec = 8000 ;
m_WaveFormatEx.nBlockAlign = 1;

2、打开音频输出设备

//打开音频输出设备
    mmReturn = ::waveOutOpen( &m_hPlay, WAVE_MAPPER,
        &m_WaveFormatEx, ::GetCurrentThreadId(), 0, CALLBACK_THREAD);

3、设置音频输出音量

if(mmReturn) //打开设备失败
    displayError(mmReturn,"PlayStart");    
else
{    
    m_IsPlaying = TRUE;
    DWORD volume = 0xffffffff;
    waveOutSetVolume(m_hPlay, volume);//设置输出设备的输出量
}

4、等待要输出的数据,通过waveOutPrepareHeader将数据提交给设备准备输出,通过waveOutWrite将提交给设备的数据输出。

void CPlaySound::OnWriteSoundData(WPARAM wParam, LPARAM lParam)
{
    MMRESULT mmResult = 0;
    int length=(int) wParam;
    
    if(m_IsPlaying == FALSE)
        return ; //FALSE;

m_PlayLog.WriteString(TEXT("\nplaying sound data…."));

// Prepare wave header for playing 
    WAVEHDR *lpHdr=new WAVEHDR;
    memset(lpHdr,0,sizeof(WAVEHDR));
    lpHdr->lpData=(char *)lParam;
    lpHdr->dwBufferLength=length;

//将要输出的数据写入buffer
    mmResult = ::waveOutPrepareHeader(m_hPlay, lpHdr, sizeof(WAVEHDR));

if(mmResult)
    {
        m_PlayLog.WriteString(TEXT("\nError while preparing header"));
        return ;//ERROR_SUCCESS;
    }

//将输出数据发送给输出设备
    mmResult = ::waveOutWrite(m_hPlay, lpHdr, sizeof(WAVEHDR));

if(mmResult)
    {
        m_PlayLog.WriteString(TEXT("\nError while writing to device"));
        return ;//ERROR_SUCCESS;                
    }
    return ;//ERROR_SUCCESS;
}

5、当提交给设备的数据输出结束,设备会发送一条MM_WOM_DONE消息反馈给设备,设备应该用waveOutUnprepareHeader将提交给设备输出的数据清除。

void CPlaySound::OnEndPlaySoundData(WPARAM wParam, LPARAM lParam)
{
    LPWAVEHDR lpHdr = (LPWAVEHDR) lParam;

if(lpHdr)
    {
        ::waveOutUnprepareHeader(m_hPlay, lpHdr, sizeof(WAVEHDR));//音频输出结束,清空buffer
    }
    return ;//ERROR_SUCCESS;
}

6、结束输出前先用waveOutReset重置输出设备,重置能够使输出设备全部buffer输出结束,所以在waveOutReset后要延迟一段时间,然后调用waveOutClose关闭设备。

void CPlaySound::OnStopPlaying(WPARAM wParam, LPARAM lParam)
{

MMRESULT mmReturn = 0;

if(m_IsPlaying == FALSE)
        return;// FALSE;

m_PlayLog.WriteString(TEXT("\n Stopped  playing"));

mmReturn = ::waveOutReset(m_hPlay);//重置输出设备,重置能够使输出设备全部buffer输出结束

if(!mmReturn)
    {
        m_IsPlaying = FALSE;
        Sleep(500); //等待所有buffer输出完成
        mmReturn = ::waveOutClose(m_hPlay);//关闭设备
    }
}

from:http://xzben.com/windows-%E4%B8%8B%E9%9F%B3%E9%A2%91%E6%95%B0%E6%8D%AE%E9%87%87%E9%9B%86%E5%92%8C%E6%92%AD%E6%94%BE/

 

Windows 下音频数据采集和播放的更多相关文章

  1. Windows PCM音频捕获与播放实现

    在WINDOWS下,音频函数有多种类型,如MCI.多媒体OLE控制.高级音频等,使用方法都比较简单.但如果想编写一个功能较强大的音频处理程序,那就必须使用低级音频函数和多媒体文件I/O来控制音频设备的 ...

  2. windows下使用waveout函数族播放wav文件

    要使用waveout函数组,族,首先要知道几个数据结构,首先是这个 typedef struct tWAVEFORMATEX { WORD wFormatTag; /* 格式的类型 */ WORD n ...

  3. < python音频库:Windows下pydub安装配置、过程出现的问题及常用API >

    < python音频库:Windows下pydub安装配置.过程出现的问题及常用API > 背景 刚从B站上看过倒放挑战之后也想体验下,心血来潮一个晚上完成了基本的实现.其中倒放与播放部分 ...

  4. windows下Qt播放flash

    Qt  版本:5.1.0 32bit 代码部分,参考1即可.配置发行时,需要将NPSWF32放在项目的plugins\目录中. 否则,可能找不到,导致无法运行. QWebSettings *setti ...

  5. 一步步实现windows版ijkplayer系列文章之四——windows下编译ijkplyer版ffmpeg

    一步步实现windows版ijkplayer系列文章之一--Windows10平台编译ffmpeg 4.0.2,生成ffplay 一步步实现windows版ijkplayer系列文章之二--Ijkpl ...

  6. java实现windows下amr转换为mp3(可实现微信语音和qq语音转换)

    最近做一个项目需要将微信的语音文件放在页面进行播放,查了好多资料发现,web页面直接播放并没有一个好的解决方案,于是就想到了先将amr文件转换成易于在页面播放的mp3文件,然后在进行播放,现在将amr ...

  7. Windows下Visual studio 2013 编译 Audacity

    编译的Audacity版本为2.1.2,由于实在windows下编译,其源代码可以从Github上取得 git clone https://github.com/audacity/audacity. ...

  8. Live555流媒体服务器编译(Windows下)

    最近在回顾之前做过的相关项目,其中包括live555流媒体服务器相关,今天先把live555开源框架在Windows下的编译方法记录一下. live555是一套使用使用开放的标准协议(RTP/RTCP ...

  9. WINDOWS下如何安装GCC(转载http://nirvana.cublog.cn;作者:北斗星君(黄庠魁))

    第一章 在视窗操作系统下的GCC 第一节 GCC家族概览 GCC 是一个原本用于 Unix-like 系统下编程的编译器.不过,现在 GCC 也有了许多 Win32 下的移植版本.所以,也许对于许多 ...

随机推荐

  1. 用hibernate自动创建mysql表,添加失败org.hibernate.exception.SQLGrammarException

    今天遇到了一个很坑人的问题,从昨晚一直搞到今天早上,终于发现了,先整理下: [背景]:利用hibernate自动给mysql创建一个表,然后为表里面添加一行记录,非常的简单(当然其中还涉及到sprin ...

  2. 0环境设置 - AUTOTRACE设置

    Autotrace是sqlplus的一个工具,用来显示所执行查询的查询计划 设置步骤 • cd [ORACLE_HOME]/rdbms/admin• log into SQL*Plus as SYST ...

  3. Rockethon 2015

    A Game题意:A,B各自拥有两堆石子,数目分别为n1, n2,每次至少取1个,最多分别取k1,k2个, A先取,最后谁会赢. 分析:显然每次取一个是最优的,n1 > n2时,先手赢. 代码: ...

  4. cojs 白树黑 黑树白 题解报告

    黑树白 首先如果不是强制在线,这个题用莫队+树状数组就可以在O(n*sqrt(n)*log(n))的时间内搞定 如果没有修改操作,可以直接上主席树就可以辣 我们考虑修改操作,某一个修改操作对于某一个查 ...

  5. leetcode:两个数的和||

    两个数的和|| 给定一个排序数组,求出其中两个数的和等于指定target时,这两个数在原始数组中的下标,返回的下标从1开始 解题 原始数组已经是升序的,找出其中两个数的和等于target 定义两个指针 ...

  6. python自省指南

    深入python中对自省的定义: python的众多强大功能之一,自省,正如你所知道的,python中万物皆对象,自省是指代码可以查看内存中以对象形式存在的其他模块和函数,获取它们的信息,并对它们进行 ...

  7. TCL语言笔记:TCL中的数学函数

    一.TCL数学函数列表 函数名 说明 举例 abs(arg) 取绝对值 set a –10  ; #a=-10 set a [expr abs($a)]; # a=10 acos(arg) 反余弦 s ...

  8. 2014-9-17二班----6 web project

    部署  加载 到 Tomcat 6.0 服务器上 web.xml           <welcome>index.jsp </welcome>   <welcome&g ...

  9. Android:EditText 常用属性

    属性 作用 android:hint="输入邮箱/用户名" 提示信息 android:inputType="textPassword" 设置文本的类型 andr ...

  10. PowerDesigner模型设计

    原文:PowerDesigner模型设计 绪论 Sybase PowerDesigner(简称PD)是最强大的数据库建模工具,市场占有率第一,功能也确实十分强大,现在最新版本是15.1,已经支持最新的 ...