从Vista开始,windows底层的音频架构发生了改变:原本是底层API的waveXXX、mixerXXX等都在Core Audio APIs的基础上进行了重构,上升为了高层API;底层API变为Core Audio API。 由于这个原因,在利用遗留音频技术(waveXXX、mixerXXX等)进行开发的时候,在WinXp和其他系统上的表现会不太一致。

但是如果要在Xp上进行开发的话,就必须要使用这些老旧的技术,没得选。

Xp下音频开发选择

在Xp下进行开发,大概只有DirectX、waveXXX和mixerXXX可选了。 这里我们简单描述它们的优缺点:

优点:

  • DirectX: 功能强大、灵活。
  • waveXXX: 使用简单,对于输入音频设备,应用中的大部分功能需求都支持。
  • mixerXXX: 完全底层的音频控制。

缺点:

  • DirectX: 概念多、不容易上手(灵活的代价)。
  • waveXXX: 对输入音频的控制处于应用层,无法控制系统层的音频输入(输出设备未测试)。
  • mixerXXX: 概念多并且比较抽象,API的使用很晦涩。

Xp下输入音频开发实例

我们选择waveXXX api来实现这个开发实例,因为waveXXX相对来说比较好用,这样我们不用花费过多的时间去了解其他概念上的细节。

1. 设备枚举及打开

先调用waveInGetNumDevs()获取设备总数,然后传入设备序号(0 ~ 总数-1),并选择设备支持的PCM数据格式中的一种打开设备,获取到设备句柄:

auto inputAudioDeviceNum = waveInGetNumDevs();
for (int i = 0; i < inputAudioDeviceNum; ++i) {
WAVEINCAPS waveInCaps;
auto returnValue = waveInGetDevCaps(i, &waveInCaps, sizeof(waveInCaps)) ; ...... WAVEFORMATEX waveFormatEx = chooseAppropriateFormat();
auto returnValue = waveInOpen((LPHWAVEIN)&deviceInfo.handle, index, &waveFormatEx,
(DWORD_PTR)CoreAudioHelper::waveInProc,
(DWORD_PTR)this,
CALLBACK_FUNCTION);
......
}

2. 获取输入音频数据

为了获取音频数据,我们需要准备一个Buffer,并将这个Buffer添加到你想要获取数据的音频设备上,然后开始这个设备的音频捕获:

bool CoreAudioHelper::startPeakGetter()
{
Q_ASSERT(m_currentDeviceIndex >= 0 && m_currentDeviceIndex < m_infos.size());
auto& deviceInfo = m_infos[m_currentDeviceIndex]; ZeroMemory(m_buffer, sizeof(m_buffer));
m_waveHdr.dwFlags = 0;
m_waveHdr.lpData = (LPSTR)m_buffer;
m_waveHdr.dwBufferLength = sizeof(m_buffer); auto returnValue = waveInPrepareHeader(deviceInfo.handle, &m_waveHdr, sizeof(m_waveHdr));
CHECK_RETURN(returnValue); returnValue = waveInAddBuffer(deviceInfo.handle, &m_waveHdr, sizeof(m_waveHdr));
CHECK_RETURN(returnValue); returnValue = waveInStart(deviceInfo.handle);
CHECK_RETURN(returnValue); deviceInfo.started = true;
return true;
}

当这个Buffer被数据填满的时候,系统就会通知你,这时候我们需要先调用waveInUnprepareHeader()来取消先前准备的Buffer,然后就可以对数据进行操作了(这里我们计算了音频的音量大小)。在之前打开设备的时候,你可以选择多种通知方式:回调、窗口消息、事件或者线程,这里我选择使用回调方法。如果要连续的获取捕获到的数据,我们就要在Buffer被填满的时候不断添加新的Buffer。注意因为在回调中基本上不可以调用任何系统api,所以我们需要另一个线程来添加新Buffer,并利用信号量来进行同步

void CoreAudioHelper::waveInProc(HWAVEIN hwi, UINT uMsg, DWORD_PTR dwInstance, DWORD_PTR dwParam1, DWORD_PTR dwParam2)
{
switch (uMsg) {
case WIM_OPEN:
break;
case WIM_CLOSE:
{
......
}
case WIM_DATA:
{
......
break;
}
default:
Q_ASSERT(false && "never receive other msg!");
} } // non-qt thread have no qt event loop which causing signal/slot not working,
// we use a queue to keep the value and a semaphore to notify the internal thread
// to emit the signal.
void CoreAudioHelper::appendPeakValue(qint16 value)
{
m_peakValueQueue.push(value);
// cannot call Win32 api inside a callback, so we notify the buffer waiter thread
m_bufferFilled.release(1);
} void CoreAudioHelper::BufferWaiterThread::run()
{
while (true) {
m_helper->m_bufferFilled.acquire(1); m_helper->unprepareBuffer(); if (m_helper->m_stopThread)
break;
if (m_helper->m_emitUnplugged) {
emit m_helper->currentDeviceUnplugged();
m_helper->m_emitUnplugged = false;
break;
}
m_helper->emitPeakLevelAndContinue();
}
} bool CoreAudioHelper::unprepareBuffer()
{
auto deviceInfo = m_infos.at(m_currentDeviceIndex);
auto returnValue = waveInUnprepareHeader(deviceInfo.handle, &m_waveHdr, sizeof(m_waveHdr));
CHECK_RETURN(returnValue);
return true;
}

3. 音量大小计算

根据PCM数据是8位还是16位,我们把Buffer中的比特数据转换成合适的变量并计算保存最小值和最大值。因为实际音频波形是以0点为水平上下波动的,

  • 8位PCM: 无符号数据,范围0~255, 水平值127。
  • 16位PCM: 有符号数据,范围-32767~32767,水平值0。

我们只需要把最大波动值除以上限值就可以获得音量大小了(具体见下一小节)。

//  buffer already filled with input audio data
CoreAudioHelper* helper = reinterpret_cast<CoreAudioHelper*>(dwInstance);
Q_ASSERT(helper->m_waveHdr.dwFlags & WHDR_DONE); qint32 peakMin = 255;
qint32 peakMax = 0;
for (char* ptr = helper->m_buffer; ptr < &helper->m_buffer[16]; ) {
qint32 dataValue;
if (helper->m_is8BitsSample) {
dataValue = *(unsigned char*)ptr;
ptr++;
} else {
dataValue = *(qint16*)ptr;
ptr += 2;
}
if (dataValue < peakMin) peakMin = dataValue;
if (dataValue > peakMax) peakMax = dataValue;
} helper->appendPeakValue(max(-peakMin, peakMax));

4. 音量设置和静音

waveXXX API只提供了音频数据捕获,因此我们需要自己来模拟音量和静音的控制,这里我们把这些控制应用在获取到的音量大小上:

void CoreAudioHelper::emitPeakLevelAndContinue()
{
if (!m_peakValueQueue.empty()) {
qint32 peakValue = m_peakValueQueue.front();
m_peakValueQueue.pop(); if (!m_infos.at(m_currentDeviceIndex).muted) {
if (m_is8BitsSample) {
// when 8-bit sample, the range is 0--255, the silence data value is 127
emit peakChanged(qint32(abs(peakValue - 127) / 1.27) *
m_infos.at(m_currentDeviceIndex).volumeFilterPercent);
}
else {
// when 16-bit sample, the range is -32767--32767, the silence data value is 0
emit peakChanged(qint32(abs(peakValue) / 327.67) *
m_infos.at(m_currentDeviceIndex).volumeFilterPercent);
}
startPeakGetter();
}
}
}

5. 运行结果

结果就是这样啦,完整代码见此处

Xp下麦克风设备及音量检测的更多相关文章

  1. Linux下usb设备驱动详解

    USB驱动分为两块,一块是USB的bus驱动,这个东西,Linux内核已经做好了,我们可以不管,我们只需要了解它的功能.形象的说,USB的bus驱动相当于铺出一条路来,让所有的信息都可以通过这条USB ...

  2. 在XP下基于VHD版XP 2003 win7制作的RAMOS心得

    在XP下基于VHD版win7制作的RAMOS心得1.用DiskGenius创建1.85G的VHD固定磁盘文件,以win7prosen.vhd为例,然后进行分区格式化,格式化时启用NTFS压缩.2.为了 ...

  3. ubuntu 在XP下硬盘安装

    以下选择在XP下用 grub4dos 安装 ubuntu 12.04版本 需要下载两个文件:一个是grub4dos,另一个是 ubutuntu 镜像文件 grub4dos下载地址:http://dow ...

  4. Windows XP下安装WinCE6.0开发环境

    Windows下怎样编译WinCE6.0及开发应用程序.以下介绍(安装之前必须保证C盘有足够的空间!20g左右!主要是由于在安装程序在安装过程中要解压): 在Visual Studio 2005之前, ...

  5. Node.js 操作 OSX 系统麦克风、扬声器音量

    最近几年 Electron 很火,公司也正好有个项目想做跨平台客户端,大家研究了一下就选择了 Electron,第一次做 js 的项目遇到了不少坑,不过也都一点点解决了. 因为项目中需要对用户录音,H ...

  6. 【DSP开发】【Linux开发】Linux下PCI设备驱动程序开发

    PCI是一种广泛采用的总线标准,它提供了许多优于其它总线标准(如EISA)的新特性,目前已经成为计算机系统中应用最为广泛,并且最为通用的总线标准.Linux的内核能较好地支持PCI总线,本文以Inte ...

  7. xp 下查看进程指令

    xp 下快速查看进程及关联 exe 的指令,刚发现,还没有测试 win7 和 win10 支持不支持. wmic process where creationclassname="win32 ...

  8. 【求助】WPF 在XP下 有的Textbox光标会消失

    最近做个项目,一直有一个问题没有解决,就是在XP下,有的Textbox里在文本框里没有东西的时候,会没有光标.不同的XP机器,失去光标的Textbox也不一样. 各位大师看下面的三张图,当Textbo ...

  9. 使用Windbg在XP下Heap追踪失败的原因

    1.故事背景      最近同事的代码中碰到一个bug会导致奔溃的bug,从dump上看是由于某个对象的堆内存指针被释放了,但代码仍调用了该对象指针的虚函数,从而引起内存访问违法崩溃,由于该类被大量使 ...

随机推荐

  1. grunt之connect、watch

    先说下这两个插件配合的用处,简单的说,它们可以拯救你的F5.connect用于建立一个静态服务器,watch监听文件的修改并自动实时刷新浏览器的页面. 还是options走起. connect(V0. ...

  2. ★浅谈Spanking情节

  3. make: Nothing to be done for 'all' 解决方法

    make: Nothing to be done for 'all' 解决方法 1.这句提示是说明你已经编译好了,而且没有对代码进行任何改动. 若想重新编译,可以先删除以前编译产生的目标文件:make ...

  4. 201521123038 《Java程序设计》 第七周学习总结

    201521123038 <Java程序设计> 第七周学习总结 1. 本周学习总结 2. 书面作业 1.ArrayList代码分析 1.1 解释ArrayList的contains源代码 ...

  5. Spring REST API + OAuth2 + AngularJS

    http://www.baeldung.com/rest-api-spring-oauth2-angularjs 作者:Eugen Paraschiv 译者:http://oopsguy.com 1. ...

  6. Spring第七篇【Spring的JDBC模块】

    前言 上一篇Spring博文主要讲解了如何使用Spring来实现AOP编程,本博文主要讲解Spring的对JDBC的支持- 对于JDBC而言,我们肯定不会陌生,我们在初学的时候肯定写过非常非常多的JD ...

  7. Java中数组的概念

    1.什么是二维数组?有几种表达方式?分别是什么? 答:多维数组即数组的数组,即数组的元素也是数组. 例:int[] [] a = {{1},{1,2},{1,2,3}}; 有三种方式 1).int [ ...

  8. php多态

    多态性是指相同的操作或函数.过程可作用于多种类型的对象上并获得不同的结果.不同的对象,收到同一消息将可以产生不同的结果,这种现象称为多态性. 多态性允许每个对象以适合自身的方式去响应共同的消息.多态性 ...

  9. 走进Node.js 之 HTTP实现分析

    作者:正龙(沪江Web前端开发工程师) 本文为原创文章,转载请注明作者及出处 上文"走进Node.js启动过程"中我们算是成功入门了.既然Node.js的强项是处理网络请求,那我们 ...

  10. WEP无线加密破解

    工具:Aircrack套件(airmon-ng.airodump-ng.aireplay-ng) 带有套件的操作系统:KaLi Linux.BackTrack.Beini(奶瓶)...等 1.开启无线 ...