DirectSound只支持Wav格式的音频文件,在创建次缓冲区之前需要先确定播放的Wav音频数据的格式。如果是从本地Wav文件播放,则需要先读出它的数据格式。

1. Wav音频格式布局

Wav是WAVE音频格式文件的后缀名,WAVE音频格式全称是Waveform Audio File Format,又叫波形文件。这是一种微软和IBM合理推出的音频比特流文件格式,是RIFF(Resource Interchange File Format)文件格式的一种特殊应用。

RIFF使用一种叫做Chunk的数据块来存储各种信息,主要分为两部分:RIFF ChunkOther Chunk

RIFF Chunk:

  • Chunk id: chunk标识符,值为FOURCC('R', 'I', 'F', 'F')组成的一个32位的无符号整数。
  • file size: 4字节大小,file typedata部分的数据大小总和。
  • file type: 用FOURCC标识的文件类型,对于Wav文件来说值为FOURCC('W', 'A', 'V', 'E')。
  • data: 该部分包含剩余的chunk块。

Other Chunk按顺序包含3个部分:

  • Chunk id:这是每个chunk的标识符,是由4个字符组成一个FOURCC。
  • Chunk size:4字节值,表明该chunk块数据部分的大小。
  • Chunk data:数据部分,该数据可能为空,并且实际的数据会被填充到2字节边界

对于Wav音频文件来说,常见并被称为标准格式的Wav格式的只包含“RIFF”、“fmt”和“data” chunk 块(今天我们不讨论格式标准,因此不深入探讨这方面),只有“data”子块中的data部分包含实际的音频数据,可以被用来播放。实际上整个RIFF文件只由一个“RIFF”块组成,而该“RIFF”又包含其他子块(例如“fmt”、“data”块)。由于Wav文件可能包含其他子块,因此在解析的时候不能假定这些字块的顺序。

2.Wav音频数据格式

Wav音频的数据格式信息包含在“fmt”块中,“fmt”字块的data部分就包含数据的格式信息。Wav文件多包含的是PCM( Pulse -code modulation)原始音频数据,即未经压缩的数据,但其实它可以包含多种数据格式,包括原始的和经过压缩的:

  • PCM

  • ADPCM

  • GSM

  • MP3

  • CELP

  • SBC

  • Truespeech

我们这里只处理PCM原始数据,因为DirectSound只支持它。我们看下图:

在Windows平台上开发时,系统已经为我们定义好了数据格式用来存储Wav格式信息WAVEFORMATEX,可以看到这个结构体的字段除cbSize以外都是按顺序和“fmt”块中data部分的格式信息字段一一对应的,这极大地方便了我们对格式信息的处理。

3. 读取Wav音频格式信息

HMMIO mmioOpen(LPTSTR szFilename, LPMMIOINFO lpmmioinfo, DWORD dwOpenFlags);

MMRESULT mmioAscend(HMMIO hmmio, LPMMCKINFO lpck, UINT wFlags);

MMRESULT mmioDescend(HMMIO hmmio, LPMMCKINFO lpck, LPMMCKINFO lpckParent, UINT wFlags);

LONG mmioRead(HMMIO hmmio, HPSTR pch, LONG cch);

...

微软提供了mmio系列的函数来帮助我们操作RIFF文件,首先我们调用mmioOpen打开一个Wav文件并防止被其他程序写入:

HMMIO mmioHandle = mmioOpenW(tempFilePath, NULL,
MMIO_READ |
MMIO_DENYWRITE |
MMIO_ALLOCBUF);
if (mmioHandle == NULL) {
throw std::exception("mmioOpon error!");
}

然后我们调用mmioDescend函数下降到RIFF块,通过在MMCKINFO结构体中设置file type为FOURCC('W', 'A', 'V', 'E'),我们表明我们想下降到的RIFF块里的文件类型是“WAVE”:

MMCKINFO riffChunkInfo;
riffChunkInfo.fccType = mmioFOURCC('W', 'A', 'V', 'E');
DWORD as;
if ((as = mmioDescend(mmioHandle, &riffChunkInfo, NULL, MMIO_FINDRIFF))
!=
MMSYSERR_NOERROR) { throw std::exception("mmioDescend error!");
}

因为“fmt”块是RIFF的子块,因此我们紧接着下降到“fmt”子块:

MMCKINFO fmtSubChunkInfo;
fmtSubChunkInfo.ckid = mmioFOURCC('f', 'm', 't', ' ');
if (mmioDescend(mmioHandle, &fmtSubChunkInfo, &riffChunkInfo, MMIO_FINDCHUNK)
!=
MMSYSERR_NOERROR) { throw std::exception("mmioDescend error!");
}

然后我们调用mmioRead函数来读取格式信息到一个WAVEFORMATEX结构体中。调用mmioRead时,我们需要自己提供存放读取信息的地址,像这里我们提供的是一个栈上的变量地址:

//  `fmt` chunk contains wave audio format described by WAVEFORMAT or WAVEFORMATEX
if (mmioRead(mmioHandle, (HPSTR)&m_waveFormat, fmtSubChunkInfo.cksize)
<= 0) { throw std::exception("mmioRead read fmt chunk error!");
}

4. 运行结果

完整代码见链接

MMIO----Wav格式文件解析的更多相关文章

  1. WAV格式文件无损合并&帧头数据体解析(python)(原创)

    一,百度百科 WAV为微软公司(Microsoft)开发的一种声音文件格式,它符合RIFF(Resource Interchange File Format)文件规范,用于保存Windows平台的音频 ...

  2. 将PCM格式存储成WAV格式文件

    将PCM格式存储成WAV格式文件 WAV比PCM多44个字节(在文件头位置多) 摘自:https://blog.csdn.net/u012173922/article/details/78849076 ...

  3. Android音频: 怎样使用AudioTrack播放一个WAV格式文件?

    翻译 By Long Luo 原文链接:Android Audio: Play a WAV file on an AudioTrack 译者注: 1. 因为这是技术文章,所以有些词句使用原文,表达更准 ...

  4. wav格式文件、pcm数据

    wav格式文件是常见的录音文件,是声音波形文件格式之一,wav 文件由文件头和数据体两部分组成. 文件头是我们在做录音保存到文件的时候,要存储的文件的说明信息,播放器要通过文件头的相关信息去读取数据播 ...

  5. Dicom格式文件解析器[转]

    Dicom格式文件解析器   Dicom全称是医学数字图像与通讯,这里讲的暂不涉及通讯那方面的问题 只讲*.dcm 也就是diocm格式文件的读取,读取本身是没啥难度的 无非就是字节码数据流处理.只不 ...

  6. Dicom格式文件解析器

    转自:http://www.cnblogs.com/assassinx/archive/2013/01/09/dicomViewer.html Dicom全称是医学数字图像与通讯,这里讲的暂不涉及通讯 ...

  7. 音频文件解析(一):WAV格式文件头部解析

    WAV为微软公司(Microsoft)开发的一种声音文件格式,它符合RIFF(Resource Interchange File Format)文件规范,用于保存Windows平台的音频信息资源. 文 ...

  8. [VB.NET][C#]WAV格式文件头部解析

    简介 WAV 为微软开发的一种声音文件格式,它符合 RIFF(Resource Interchange File Format)文件规范,用于保存 Windows 平台的音频信息资源. 第一节 文件头 ...

  9. 音频文件解析(二):WAV格式文件波形绘制

    解析WAV头部信息后,接下来就可以根据相关参数和DATA块数据绘制波形. 1.重新编码(转换为8bits,单声道数据) Public Function GetFormatData(ByVal pDat ...

随机推荐

  1. 版本管理(一)之Git和GitHub的区别(优点和缺点)

    Git 简介 https://www.yiibai.com/git/getting-started-git-basics.html Git 是一个开源的分布式版本控制系统,用于敏捷高效地处理任何或小或 ...

  2. 长沙.NET社区之光

    奈何万事开头难 迎着改革开放四十年带来的春风,长沙的互联网生态环境以唐胡子俱乐部为首的一众互联网社群讲长沙互联网的环境推上了一个新的台阶.年底,我与有幸一起共事的溪源兄,下班后一起闲聊,觉着长沙的.N ...

  3. C# 在项目中配置Log4net

    我们介绍一下在项目中配置log4net,是Apache基金会旗下的. 无论在什么环境中,配置log4net的逻辑都一样. 1)文件配置 首先在项目加载文件中,配置log4net加载项. 在Web项目中 ...

  4. [android] 新闻客户端主界面部分

    当我们使用activity加fragment的时候,每个界面都要建立一个fragment,每个fragment里面都要重写onCreate(),onCreateView(),onActivityCre ...

  5. 深入理解读写锁ReentrantReadWriteLock

    1.读写锁的介绍 在并发场景中用于解决线程安全的问题,我们几乎会提供高频率的使用到独占式锁,通常使用java提供的关键字synchronized(关于synchronized可以看这篇文章)或者con ...

  6. Java异常捕获之一道try-catch-finally语句题

    今天,学习了try-catch-finally语句,本来觉得蛮简单.易懂的.搜了一道相关类型的题.结果信心被泼了盆冷水.先把题Mark一下,出去透透风. public class TestEx { p ...

  7. 撩课-Web大前端每天5道面试题-Day27

    1.浏览器缓存? 浏览器缓存分为强缓存和协商缓存.当客户端请求某个资源时,获取缓存的流程如下: 先根据这个资源的一些 http header 判断它是否命中强缓存, 如果命中,则直接从本地获取缓存资源 ...

  8. bind(port)与.localAddress(new InetSocketAddress(port))区别

    两者并没有什么区别,最后都会调用AbstractBootstrap这个抽象类的bind()方法.

  9. 模版方法模式(Template Method)

    1.概念 在模板模式(Template Pattern)中,一个抽象类公开定义了执行它的方法的方式/模板.它的子类可以按需要重写方法实现,但调用将以抽象类中定义的方式进行.这种类型的设计模式属于行为型 ...

  10. HDU4280(KB11-G 最大流)

    Island Transport Time Limit: 20000/10000 MS (Java/Others)    Memory Limit: 65536/65536 K (Java/Other ...