使用 DirectSound 录制麦克风音频

本文所有代码均可在以下仓库找到

https://gitcode.net/PeaZomboss/learnaudios

目录是demo/dscapture

之前那篇文章简单介绍了DirectSound，并用其实现了对WAV格式文件的播放操作，本文将继续聚焦于DirectSound，但目标变成了用其实现对麦克风音频的录制，并将其保存为WAV格式的文件。

DirectSound录制的方法和播放的方法其实差不多，都是使用循环+多缓冲的方法，在实际写代码的过程中没有什么很大的不同，也无需过多解释，所以本文主要就是展示一些关键代码。

关于IDirectSoundCapture等接口的具体定义还是建议直接看文档就行了。

https://docs.microsoft.com/en-us/previous-versions/windows/desktop/ee416960(v=vs.85)

接口定义

接口和播放器的非常相似，仅有部分小改动

// 参数1：缓冲区指针

// 参数2：缓冲区大小（单位字节）

// 参数3：用户自定义指针

typedef void (*CopyBufCallback)(void *, int, void *);

DWord WINAPI copy_thread(void *parameter);

class Recorder

{

private:

    IDirectSoundCapture *dsc;

    IDirectSoundCaptureBuffer *dscb;

    CopyBufCallback copybuf_func;

    void *copybuf_ctx;

    WAVEFORMATEX fmtex;

    DWord block_size;

    DWord buf_size;

    HANDLE events[3];

    HANDLE h_copy_thread; // copy_thread线程句柄

    bool recording; // 录制中（包括暂停）

    bool suspended; // 是否挂起，用于暂停

    void copy_buf(void *ptr, int len); // 方便调用

public:

    friend DWord WINAPI copy_thread(void *parameter);

    Recorder();

    Recorder(GUID *device);

    ~Recorder();

    void set_block_size(DWord bs);

    void set_fmt(const WAVEFORMATEX &fmtex);

    void set_copy_buf_callback(CopyBufCallback copy, void *ctx);

    void start();

    void stop();

    void pause();

    void resume();

};

具体实现

对于录制功能的实现，使用简单的双缓冲即可，目前暂未发现一些问题。

线程实现如下：

DWord WINAPI copy_thread(void *parameter)

{

    Recorder *recorder = (Recorder *)parameter;

    void *ptr;

    DWord len;

    while (true) {

        DWORD res = WaitForMultipleObjects(3, &recorder->events[0], FALSE, INFINITE);

        if (res == 0) { // 录制第一段缓冲区时保存第二段

            recorder->dscb->Lock(recorder->buf_size, recorder->buf_size, &ptr, &len, NULL, NULL, 0);

            recorder->copy_buf(ptr, len);

            recorder->dscb->Unlock(ptr, len, NULL, 0);

        }

        else if (res == 1) { // 同理保存第一段

            recorder->dscb->Lock(0, recorder->buf_size, &ptr, &len, NULL, NULL, 0);

            recorder->copy_buf(ptr, len);

            recorder->dscb->Unlock(ptr, len, NULL, 0);

        }

        else { // 保存剩下部分

            DWord pos;

            recorder->dscb->Stop();

            recorder->dscb->GetCurrentPosition(&pos, NULL);

            // 根据当前录制位置确定是在第一段还是第二段缓冲区

            if (pos > recorder->buf_size)

                recorder->dscb->Lock(recorder->buf_size, pos - recorder->buf_size, &ptr, &len, NULL, NULL, 0);

            else

                recorder->dscb->Lock(0, pos, &ptr, &len, NULL, NULL, 0);

            recorder->copy_buf(ptr, len);

            recorder->dscb->Unlock(ptr, len, NULL, 0);

            break;

        }

    }

    printf("Recording thread end.\n");

    return 0;

}

然后是start()的实现：

void Recorder::start()

{

    if (dscb || recording) return;

    buf_size = block_size * fmtex.nBlockAlign;

    DSCBUFFERDESC dscbd;

    memset(&dscbd, 0, sizeof(DSCBUFFERDESC));

    dscbd.dwSize = sizeof(DSCBUFFERDESC);

    dscbd.dwBufferBytes = buf_size * 2; // 使用双缓冲

    dscbd.lpwfxFormat = &fmtex;

    HRESULT hr = dsc->CreateCaptureBuffer(&dscbd, &dscb, NULL);

    if (FAILED(hr)) {

        printf("Can not create capture buffer\n");

        return;

    }

    void *ptr;

    DWord len;

    dscb->Lock(0, 0, &ptr, &len, NULL, NULL, DSCBLOCK_ENTIREBUFFER);

    memset(ptr, 0, len); // 清空整个缓冲区

    dscb->Unlock(ptr, len, NULL, 0);

    IDirectSoundNotify *dsn;

    hr = dscb->QueryInterface(_iid_IDirectSoundNotify, (void **)&dsn);

    if (FAILED(hr)) {

        printf("Can not query direct sound notify\n");

        return;

    }

    DSBPOSITIONNOTIFY dsbpn[2];

    dsbpn[0].dwOffset = 0;

    dsbpn[0].hEventNotify = events[0];

    dsbpn[1].dwOffset = buf_size;

    dsbpn[1].hEventNotify = events[1];

    dsn->SetNotificationPositions(2, &dsbpn[0]); // 设置通知位置

    dsn->Release();

    recording = true;

    dscb->Start(DSCBSTART_LOOPING);

    printf("Recording ...\n");

    DWord copy_thread_id = 0;

    h_copy_thread = CreateThread(NULL, 0, copy_thread, this, 0, &copy_thread_id);

    printf("Record thread handle: %d, thread id: %d\n", h_copy_thread, copy_thread_id);

    suspended = false;

}

stop()，pause()，resume()的实现：

void Recorder::stop()

{

    if (recording) {

        printf("Stopping...\n");

        SetEvent(events[2]);

        WaitForSingleObject(h_copy_thread, 1000); // 等待线程结束

        dscb->Release();

        dscb = NULL;

        recording = false;

        printf("Done...\n");

    }

}

void Recorder::pause()

{

    if (recording && !suspended) {

        dscb->Stop();

        suspended = true;

        printf("pause\n");

    }

}

void Recorder::resume()

{

    if (recording && suspended) {

        dscb->Start(DSCBSTART_LOOPING);

        suspended = false;

        printf("resume\n");

    }

}

主程序

为了方便将数据写入文件，使用全局变量如下：

FILE *fp;

DWord total_len = 0; // 保存实际写入的数据长度（单位字节）

然后是保存缓冲区数据的方法：

void copy_buf(void *buf, int len, void *ctx)

{

    int wt_size = fwrite(buf, 1, len, fp);

    total_len += wt_size; // 累加写入的长度

}

然后就是主函数：

int main()

{

    char fn[256];

    SYSTEMTIME st;

    GetLocalTime(&st); // 获取当前时间

    // 根据时间生成文件名

    sprintf(fn, "%d-%d-%d_%02d%02d%02d.wav", st.wYear, st.wMonth, st.wDay, st.wHour, st.wMinute, st.wSecond);

    fp = fopen(fn, "wb");

    RIFFHeader rh;

    strncpy(rh.id.chr, "RIFF", 4);

    rh.size = 0; // 暂时填零

    strncpy(rh.type.chr, "WAVE", 4);

    fwrite(&rh, sizeof(RIFFHeader), 1, fp); // 写入RIFF头

    RIFFChunkHeader rch;

    strncpy(rch.id.chr, "fmt ", 4);

    rch.size = sizeof(WAVEFORMATEX) - sizeof(WORD); // 不要多余的cbSize字段

    fwrite(&rch, sizeof(RIFFChunkHeader), 1, fp); // 写入fmt头

    WAVEFORMATEX fmtex;

    fmtex.wFormatTag = 1;

    fmtex.nChannels = 2;

    fmtex.nSamplesPerSec = 16000;

    fmtex.wBitsPerSample = 16;

    fmtex.nBlockAlign = 4;

    fmtex.nAvgBytesPerSec = 16000 * 4;

    fmtex.cbSize = 0;

    fwrite(&fmtex, sizeof(WAVEFORMATEX) - sizeof(WORD), 1, fp); // 写入fmt内容

    strncpy(rch.id.chr, "data", 4);

    rch.size = 0; // 同理

    fwrite(&rch, sizeof(RIFFChunkHeader), 1, fp); // 写入data头

    Recorder recorder;

    recorder.set_fmt(fmtex);

    recorder.set_copy_buf_callback(copy_buf, NULL);

    recorder.start();

    int command = 0;

    printf("Input 'q' to quit, 'p' to pause, 'r' to resume\n");

    do {

        command = getchar();

        if (command == 'p')

            recorder.pause();

        else if (command == 'r')

            recorder.resume();

    } while (command != 'q');

    recorder.stop();

    printf("Total got %d (bytes) data\n", total_len);

    // 回到文件头写入实际的大小信息

    DWord riff_size = total_len + 44 - 8; // 头部共占用44字节内容

    fseek(fp, 4, SEEK_SET); // 此处使用硬编码，实际使用不推荐

    fwrite(&riff_size, 4, 1, fp); // 重新写入实际的大小

    fseek(fp, 40, SEEK_SET); // 同上

    fwrite(&total_len, 4, 1, fp);

    fclose(fp);

    printf("Saved to file \"%s\", size: %d\n", fn, riff_size + 8);

}

使用 DirectSound 录制麦克风音频的更多相关文章

javaCV开发详解之5：录制音频(录制麦克风)到本地文件/流媒体服务器(基于javax.sound、javaCV-FFMPEG)
javaCV系列文章: javacv开发详解之1:调用本机摄像头视频 javaCV开发详解之2:推流器实现,推本地摄像头视频到流媒体服务器以及摄像头录制视频功能实现(基于javaCV-FFMPEG.j ...
如何用FFmpeg API采集摄像头视频和麦克风音频，并实现录制文件的功能
之前一直用Directshow技术采集摄像头数据,但是觉得涉及的细节比较多,要开发者比较了解Directshow的框架知识,学习起来有一点点难度.最近发现很多人问怎么用FFmpeg采集摄像头图像,事实 ...
Windows Phone 8初学者开发—第20部分：录制Wav音频文件
原文 Windows Phone 8初学者开发—第20部分:录制Wav音频文件原文地址:http://channel9.msdn.com/Series/Windows-Phone-8-Develop ...
公布一个软件，轻新视频录播程序，H264/AAC录制视音频，保存FLV，支持RTMP直播
已经上传到CSDN,下载地址:http://download.csdn.net/detail/avsuper/7421647,不要钱滴,嘿嘿... 本程序能够把摄像头视频和麦克风音频,录制为FLV文件 ...
html5 录制mp3音频，支持采样率和比特率设置
13年的时候做过html5录音,一个问题是保存的wav格式文件很大,当初用了一个迂回的方式,上传到服务器后调用 lame 编码器转换,但由于文件大,上传较慢.不得不说,前端技术发展真是日新月异,有人实 ...
Android OpenSL ES 开发：Android OpenSL 录制 PCM 音频数据
一.实现说明 OpenSL ES的录音要比播放简单一些,在创建好引擎后,再创建好录音接口基本就可以录音了.在这里我们做的是流式录音,所以需要用至少2个buffer来缓存录制好的PCM数据,这里我们可以 ...
Kubuntu麦克风音频无声音
前段时间买了新本,装了双系统,win8和kubuntu 14.04,使用的过程感觉都不错,因为平时玩游戏看视频是用win8,但最近打算在kubuntu上听音乐时,发现音频没有声音,麦克风也没有声音,这 ...
wp8 自定义相机+nokia滤镜+录制amr音频
demo截图: 代码量有点多,就不贴出来了. 备注: 1.自定义相机主要横竖屏时,对相机进行旋转. 2.播放amr格式可以在页面中直接添加MediaElement控件进行播放,或者使用Bac ...
使用FlashWavRecorder实现浏览器录制wav音频和上传音频文件，兼容IE8以上浏览器
前言:本项目基于github开源插件实现,该插件使用flash实现,兼容IE8以上浏览器感谢michalstocki的分享该项目,github项目地址:https://github.com/mich ...
Android MediaRecorder录制播放音频
1.请求录制音频权限 <user-permission android:name="android.permission.RECORD_AUDIO"/> RECORD_ ...

随机推荐

【云原生 · Kubernetes】Kubernetes运维
(1)Node的隔离与恢复在硬件升级.硬件维护等情况下,需要将某些Node隔离.使用kubectl cordon <node_name>命令可禁止Pod调度到该节点上,在其上运行的Pod ...
[排序算法] 堆排序 (C++)
堆排序解释什么是堆堆 heap 是一种近似完全二叉树的数据结构,其满足一下两个性质 1. 堆中某个结点的值总是不大于(或不小于)其父结点的值: 2. 堆总是一棵完全二叉树将根结点最大的堆叫做大根 ...
ValueError: Detected newline in header value. This is a potential security problem
原因 flask框架进行重定向的url中包含换行符\n或\r 解决方法使用 strip() 函数去除行首或行尾的换行符(如果你url中间包含这些符号replace函数替换, 但是如果中间包含只能说 ...
移动 VR 开发时要避免的 PC 渲染技术
更新:本文是为 Quest 1 开发人员编写的.虽然 Quest 2 建立在相同的架构上,但现在更容易为阴影贴图(以及其他需要从先前渲染过程中生成的纹理读取的简单技术)做预算. 尽管移动芯片组可以支持 ...
Fastjsonfan反序列化(1)
前言之前只是对FastJson漏洞有简单的一个认知,虽然由于网上fastjson漏洞调试的文章很多,但是真正有着自己的理解并能清楚的讲述出来的文章少之又少.大多文章都是对已知的漏洞调用流程做了大量分 ...
【文档资料】Linux、Vi/Vim常用命令、文件夹和文件介绍
一.Linux 1.系统信息[左1] 查看磁盘空间使用情况:df+参数查看当前指定文件或目录的大小:du 查看不同硬件信息:cat/proc/xxx 查看系统和空闲内存:free +参数 SSH退出 ...
Doris安装部署
下载安装 Doris运行在Linux环境中,推荐 CentOS 7.x 或者 Ubuntu 16.04 以上版本,同时你需要安装 Java 运行环境(JDK最低版本要求是8) 1.下载安装包下载地址 ...
分布式计算MapReduce究竟是怎么一回事？
前言如果要对文件中的内容进行统计,大家觉得怎么做呢?一般的思路都是将不同地方的文件数据读取到内存中,最后集中进行统计.如果数据量少还好,但是面对海量数据.大数据的场景这样真的合适吗?不合适的话,那有 ...
06.python闭包
python闭包什么样的函数是闭包函数 ? 满足以下条件: 闭:外层函数嵌套了一个内层函数. 包:内层函数调用外层函数命名空间内的名字. 举例如下: def out_func(): # 外层函数 ...
P1314 聪明的质监员（题解）
题目小 T 是一名质量监督员,最近负责检验一批矿产的质量.这批矿产共有 \(n\) 个矿石,从 \(1\) 到 \(n\) 逐一编号,每个矿石都有自己的重量 \(w_i\) 以及价值 \(v_i\) ...

使用 DirectSound 录制麦克风音频

使用 DirectSound 录制麦克风音频

接口定义

具体实现

主程序

使用 DirectSound 录制麦克风音频的更多相关文章

随机推荐

热门专题