音频信号的读写、播放及录音

　　python已经支持WAV格式的书写，而实时的声音输入输出需要安装pyAudio(http://people.csail.mit.edu/hubert/pyaudio)。最后我们还将使用pyMedia(http://pymedia.org)进行Mp3的解码和播放。

　　音频信号是模拟信号，我们需要将其保存为数字信号，才能对语音进行算法操作，WAV是Microsoft开发的一种声音文件格式，通常被用来保存未压缩的声音数据。

语音信号有四个重要的参数：声道数、采样频率、量化位数(位深)和比特率。

声道数：可以是单声道、双声道 ...
采样频率（Sample rate）：每秒内对声音信号采样样本的总数目，44100Hz采样频率意味着每秒钟信号被分解成44100份。换句话说，每隔144100144100秒就会存储一次，如果采样率高，那么媒体播放音频时会感觉信号是连续的。
量化位数（Bit depth）：也称为“位深”，每个采样点中信息的比特(bit)数。1 byte等于8 bit。通常有8bit、16bit、24bit、32bit...
比特率（Bit rate）:每秒处理多少个Bit。比如一个单声道，用44.1KHz/16Bit的配置来说，它的比特率就为44100*16*1=705600，单位是bit/s(或者bps)，因为通常计算出来的数字都比较大，大家就用kbit/s了，也就是705.6kbit/s。在对音频进行压缩时，比特率就成为了我们的一个要选的选项了，越高的比特率，其音质也就越好。一些常用的比特率有：
- 32kbit/s：一般只适用于语音
- 96kbit/s：一般用于语音或低质量流媒体
- 128或160kbit/s：中等比特率质量
- 192kbit/s：中等质量比特率
- 256kbit/s：常用的高质量比特率
- 320kbit/s： MP3标准支持的最高水平

　　如果你需要自己录制和编辑声音文件，推荐使用Audacity，它是一款开源的、跨平台、多声道的录音编辑软件。在我的工作中经常使用Audacity进行声音信号的录制，然后再输出成WAV文件供Python程序处理。

　　如果想要快速看语音波形和语谱图，推荐使用Adobe Audition，他是Adobe公司开发专门处理音频的专业软件，微博关注vposy，下载地址见置顶。他破解了很多adobe公司的软件，包括PS、PR...

音频格式

WAV

　　WAV格式是微软公司开发的一种无损声音文件格式，也称为波形声音文件，WAV格式支持多种压缩算法、音频位数、采样频率和声道。

　　WAV 符合 RIFF(Resource Interchange File Format) 规范，所有的WAV都由 44字节头文件 和 PCM文件 组成，这个文件头包含语音信号的所有参数信息(声道数、采样率、量化位数、比特率....)

　　 44个字节的头文件由 3个区块组成：

RIFF chunk：WAV文件标识
Format chunk：声道数、采样率、量化位数、等信息
Data chunk：存放数据

　　相反的，在PCM文件头部添加44个字节的WAV文件头，就可以生成WAV格式文件

RIFF区块

规范的WAVE格式遵循RIFF头

名称	字节数	内容
ChunkID	4	"RIFF" 标识符
ChunkSize	4	表示从下个地址开始到文件尾的总字节数更准确的说：等于整个wav文件大小-8
Format	4	"WAVE" 标识符

FORMAT区块

描述声音数据的格式

名称	字节数	内容
Subchunk1ID	4	"fmt " 标识符，最后一位是空格
Subchunk1Size	4	该区块数据的长度（不包含该区块ID和Size的长度）
AudioFormat	2	音频格式，PCM音频数据的值为1
NumChannels	2	通道数
SampleRate	4	采样率
ByteRate	4	每秒数据字节数 = SampleRate * NumChannels * BitsPerSample / 8
BlockAlign	2	每个采样点所需的字节数 = NumChannels * BitsPerSample / 8
BitsPerSample	2	量化位数(bit)

DATA区块

包含数据的大小和实际声音

名称	字节数	内容
Subchunk2ID	4	"data" 标识符
Subchunk2Size	4	该区块数据的长度，（不包含该区块ID和Size的长度），也就是PCM字节数
Data	*	音频数据

文件实例：

RIFF区块

ChunkID(4字节 52 49 46 46)：对应ASCII中的 RIFF，这里是ASCII码对照表。
ChunkSize(4字节 76 01 03 00)：表示WAV文件的大小，不包含了前面8个字节，所以真正的大小等于文件总字节减去8。76 01 03 00 对应的正序16进制为 00 03 01 76大小为196982
Format(4字节 57 41 56 45)：对应ASCII中的WAVE

FORMAT区块

Subchunkl ID(4字节 66 6d 74 20)：对应ASCII中的fmt
Subchunkl Size(4字节 10 00 00 00)：正序16进制 00 00 00 10 对应16
AudioFormat(2字节 01 00)：正序16进制 00 01，对应数字1，表示编码格式“WAVE_FORMAT_PCM”
NumChannels(2字节 01 00)：正序16进制 00 01，对应数字1，表示声道数为1
SampleRate(4字节 80 bb 00 00)：正序16进制 00 00 bb 80，表示采样率为48000
ByteRate(4字节 00 77 01 00)：正序16进制 00 01 77 00，表示传输速率为96000
BlockAlign(2字节 02 00)：正序16进制 00 02，每个采样所需的2字节数
BitsPerSample(2字节 10 00)：正序16进制 00 10，采样大小为16 Bits

DATA区块

Subchunk2ID(4字节 64 61 74 61)：表示为ASCII的data，开始数据区
Subchunk2 Size(4字节 52 01 03 00)：正序16进制 00 03 01 52，PCM字节数，大小为196946
wav文件(wav字节-44字节)：pcm音频数据

WAV转PCM

　　因为wav比pcm多44个字节的文件头，也就是说44字节后的信息，就是pcm数据

#include <stdio.h>

/**

 * wav2pcm ***.wav **.pcm

 * @param argc 命令行参数的长度

 * @param argv 命令行参数，argv[0]是程序名称

 * @return

 */

int main(int argc, char *argv[]) {

    FILE *wavfile;

    FILE *pcmfile;

    char buf[1024];

    int read_len;

    if (argc != 3) {

        printf("usage:\n"

               "\t wav2pcm ***.wav **.pcm\n");

    }

    wavfile = fopen(argv[1], "rb");

    if (wavfile == NULL) {

        printf("!Error: Can't open wavfile.\n");

        return 1;

    }

    pcmfile = fopen(argv[2], "wb");

    if (pcmfile == NULL) {

        printf("!Error: Can't open pcmfile.\n");

        return 1;

    }

    fseek(wavfile, 44, SEEK_SET);        // 将文件指针移动到文件开头，后移44字节

    while ((read_len = fread(buf, 1, sizeof(buf), wavfile)) != 0) {

        fwrite(buf, 1, read_len, pcmfile);

    }

    fclose(pcmfile);

    fclose(wavfile);

    return 0;

}

wav2pcm.c

dd if=1.wav of=1.pcm bs=1 skip=44

wav2pcm.sh

def wav2pcm(wavfile, pcmfile, data_type=np.int16):

    f = open(wavfile, "rb")

    f.seek(0)

    f.read(44)

    data = np.fromfile(f, dtype=data_type)

    data.tofile(pcmfile)

wav2pcm.py

还有一个github开源代码：wavutils

当我们读取pcm数据的时候，我们需要弄清楚语音每个采样点的位深是多少bit，一般来说是16bit，那么我们去pcm数据的时候就应该2个字节的去取，应该创建short的buf。

#include <stdio.h>

int main() {

    FILE *pcmfile;

    int frame_len = 480;     // 帧长

    short buf[frame_len];   // 每个采样点2字节

    int read_len;

    char pcmpath[]="../p225_001.pcm";

    pcmfile = fopen(pcmpath, "rb");

    if (pcmfile == NULL) {

        printf("!Error: Can't open wavfile.\n");

        return 1;

    }

    while (feof(pcmfile)==0){

        read_len = fread(buf, sizeof(short), frame_len, pcmfile);

        for (int i = 0; i < read_len; i++) {

            printf("%d ", buf[i]);

        }

    }

    fclose(pcmfile);

    return 0;

}

读取pcm数据

RAW、PCM、SAM

　　RAW、PCM(Pulse Code Modulation)、SAM 都是一种存储原始数据的音频文件格式，未经过任何编码和压缩处理，他们的本质一样，只是文件扩展名不同，也可以没有扩展名。与WAV或AIFF的大小相比，这音频文件不包含任何标题信息（采样率、位深度、通道数）。

　　如果在PCM文件的前面添加WAV文件头，就可以生成WAV格式文件。

如果是16位的话，pcm每个采样点的值在0~$2^{15}-1$，因为第一位是符号位。所以我们有时候用librosa读取的音频每个采样点都是0~1之间的，如果该音频是16bit的，如果想将他换成short型应该乘以$2^{15}$。

pcm转wav

版本一：代码参考自：https://github.com/pliu6/pcm2wav

/**

 * https://github.com/pliu6/pcm2wav

 */

#include <stdlib.h>

#include <string.h>

#include <stdio.h>

typedef struct {

    unsigned char chunk_id[4];     /*{'R', 'I', 'F', 'F'}*/

    unsigned int chunk_size;

    unsigned char format[4];

} FIFFChunk;

typedef struct {

    unsigned char chunk_id[4];  /* {'f', 'm', 't', ' '} */

    unsigned int chunk_size;

    unsigned short audio_format;            // 2字节

    unsigned short channels;             // 4字节

    unsigned int sample_rate;       // 4字节

    unsigned int byte_rate;      // 4字节

    unsigned short block_align;           // 2字节

    unsigned short bits_per_sample;        // 2字节

} FormatChunk;

typedef struct {

    unsigned char chunk_id[4];  /* {'d', 'a', 't', 'a'}  */

    unsigned int chunk_size;

} DataChunk;

// pcm2wav ***.pcm ***.wav 通道 采样率 量化位数

int main(int argc, char *argv[]) {

    FILE *pcmfile, *wavfile;

    long pcmfile_size;

    FIFFChunk fiffchunk;

    FormatChunk formatchunk;

    DataChunk datachunk;

    int read_len;

    char buf[1024];

    if (argc != 6) {

        printf("usage:\n"

               "\t%s pcmfile wavfile channel samplerate bitspersample\n", argv[0]);

        return 1;

    }

    pcmfile = fopen(argv[1], "rb");

    if (pcmfile == NULL) {

        printf("!Error: Can't open pcmfile.\n");

        return 1;

    }

    fseek(pcmfile, 0, SEEK_END);        // 将文件指针移动到文件最后

    pcmfile_size = ftell(pcmfile);          // 返回给定流 stream 的当前文件位置(字节)

    fseek(pcmfile, 0, SEEK_SET);        // 将文件指针移动到文件开头

    wavfile = fopen(argv[2], "wb");

    if (wavfile == NULL) {

        printf("!Error: Can't create wavfile.\n");

        return 1;

    }

    /* *********** RIFF区块  ********************* */

    strncpy(fiffchunk.chunk_id,"RIFF", 4);

    fiffchunk.chunk_size = pcmfile_size+36;

    strncpy(fiffchunk.format,"WAVE",4);

    fwrite(&fiffchunk, sizeof(fiffchunk), 1, wavfile);

    /* *********** FORMAT区块  ********************* */

    strncpy(formatchunk.chunk_id,"fmt ", 4);

    formatchunk.chunk_size = sizeof(FormatChunk) - 8;       // 不包含该区块ID和Size的长度

    formatchunk.audio_format = 1;   /* 未压缩的 */

    formatchunk.channels = atoi(argv[3]);          // 通道数，字符串转换成整型

    formatchunk.sample_rate = atoi(argv[4]);    // 采样率

    formatchunk.bits_per_sample = atoi(argv[5]);     // 量化位数

    formatchunk.byte_rate = formatchunk.sample_rate * formatchunk.channels * (formatchunk.bits_per_sample >> 3);   // 每秒数据字节数=SampleRate * NumChannels * BitsPerSample/8

    formatchunk.block_align = formatchunk.channels * (formatchunk.bits_per_sample >> 3);    // 每个样本需要的字节数

    fwrite(&formatchunk, 1, sizeof(formatchunk), wavfile);

    /* *********** DATA区块  ********************* */

    strncpy(datachunk.chunk_id, "data",4);

    datachunk.chunk_size = pcmfile_size;

    fwrite(&datachunk, 1, sizeof(datachunk.chunk_id) + sizeof(datachunk.chunk_size), wavfile);

    while ((read_len = fread(buf, 1, sizeof(buf), pcmfile)) != 0) {

        fwrite(buf, 1, read_len, wavfile);

    }

    fclose(pcmfile);

    fclose(wavfile);

}

pcm2wav.c

版本二：代码参考自：https://github.com/jwhu1024/pcm-to-wav

/**

* https://github.com/jwhu1024/pcm-to-wav

*/

#include <stdio.h>

#include <stdlib.h>

#include <string.h>

typedef struct {

    unsigned char chunk_id[4];        // RIFF string

    unsigned int chunk_size;         // overall size of file in bytes (36 + data_size)

    unsigned char sub_chunk1_id[8];   // WAVEfmt string with trailing null char

    unsigned int sub_chunk1_size;    // 16 for PCM.  This is the size of the rest of the Subchunk which follows this number.

    unsigned short audio_format;       // format type. 1-PCM, 3- IEEE float, 6 - 8bit A law, 7 - 8bit mu law

    unsigned short num_channels;       // Mono = 1, Stereo = 2

    unsigned int sample_rate;        // 8000, 16000, 44100, etc. (blocks per second)

    unsigned int byte_rate;          // SampleRate * NumChannels * BitsPerSample/8

    unsigned short block_align;        // NumChannels * BitsPerSample/8

    unsigned short bits_per_sample;    // bits per sample, 8- 8bits, 16- 16 bits etc

    unsigned char sub_chunk2_id[4];   // Contains the letters "data"

    unsigned int sub_chunk2_size;    // NumSamples * NumChannels * BitsPerSample/8 - size of the next chunk that will be read

} wav_header_t;

char *dummy_get_raw_pcm(char *p, int *bytes_read) {

    long lSize;

    char *pcm_buf;

    size_t result;

    FILE *fp_pcm;

    fp_pcm = fopen(p, "rb");

    if (fp_pcm == NULL) {

        printf("File error");

        exit(1);

    }

    // obtain file size:

    fseek(fp_pcm, 0, SEEK_END);     // 将文件指针移动到文件最后

    lSize = ftell(fp_pcm);              // 返回给定流 stream 的当前文件位置(字节)

    rewind(fp_pcm);                     // 将文件指针移动到文件开头

    // 分配内存来包含整个文件

    pcm_buf = (char *) malloc(sizeof(char) * lSize);

    if (pcm_buf == NULL) {

        printf("Memory error");

        exit(2);

    }

    // 将文件复制到pcm_buf中:

    result = fread(pcm_buf, 1, lSize, fp_pcm);

    if (result != lSize) {

        printf("Reading error");

        exit(3);

    }

    *bytes_read = (int) lSize;

    return pcm_buf;

}

void get_wav_header(int raw_sz, wav_header_t *wh) {

    // RIFF chunk

    strcpy(wh->chunk_id, "RIFF");

    wh->chunk_size = 36 + raw_sz;

    // fmt sub-chunk (to be optimized)

    strncpy(wh->sub_chunk1_id, "WAVEfmt ", strlen("WAVEfmt "));

    wh->sub_chunk1_size = 16;

    wh->audio_format = 1;

    wh->num_channels = 1;

    wh->sample_rate = 16000;

    wh->bits_per_sample = 16;

    wh->block_align = wh->num_channels * wh->bits_per_sample / 8;

    wh->byte_rate = wh->sample_rate * wh->num_channels * wh->bits_per_sample / 8;

    // data sub-chunk

    strncpy(wh->sub_chunk2_id, "data", strlen("data"));

    wh->sub_chunk2_size = raw_sz;

}

void dump_wav_header(wav_header_t *wh) {

    printf("=========================================\n");

    printf("chunk_id:\t\t\t%s\n", wh->chunk_id);

    printf("chunk_size:\t\t\t%d\n", wh->chunk_size);

    printf("sub_chunk1_id:\t\t\t%s\n", wh->sub_chunk1_id);

    printf("sub_chunk1_size:\t\t%d\n", wh->sub_chunk1_size);

    printf("audio_format:\t\t\t%d\n", wh->audio_format);

    printf("num_channels:\t\t\t%d\n", wh->num_channels);

    printf("sample_rate:\t\t\t%d\n", wh->sample_rate);

    printf("bits_per_sample:\t\t%d\n", wh->bits_per_sample);

    printf("block_align:\t\t\t%d\n", wh->block_align);

    printf("byte_rate:\t\t\t%d\n", wh->byte_rate);

    printf("sub_chunk2_id:\t\t\t%s\n", wh->sub_chunk2_id);

    printf("sub_chunk2_size:\t\t%d\n", wh->sub_chunk2_size);

    printf("=========================================\n");

}

// pcm-to-wav ./time.pcm ./***.wav

int main(int argc, char *argv[]) {

    int raw_sz = 0;

    FILE *fwav;

    wav_header_t wheader;           // 文件头 结构体变量声明

    memset(&wheader, '\0', sizeof(wav_header_t));       // 清除内存位置

    // check argument

    if (argc != 2)

        return -1;

    // dummy raw pcm data

    char *pcm_buf = dummy_get_raw_pcm("./time.pcm", &raw_sz);

    // construct wav header

    get_wav_header(raw_sz, &wheader);       // 给文件头赋 初值

    dump_wav_header(&wheader);              // 打印文件头 信息

    // write out the .wav file

    fwav = fopen(argv[1], "wb");

    fwrite(&wheader, 1, sizeof(wheader), fwav);

    fwrite(pcm_buf, 1, raw_sz, fwav);

    fclose(fwav);

    if (pcm_buf)

        free(pcm_buf);

    return 0;

}

pcm2wav.c

版本三：使用python的wave库

def pcm2wav(pcm_file, wav_file, channels=1, bits=16, sample_rate=16000):

    pcmf = open(pcm_file, 'rb')

    pcmdata = pcmf.read()

    pcmf.close()

    if bits % 8 != 0:

        raise ValueError("bits % 8 must == 0. now bits:" + str(bits))

    wavfile = wave.open(wav_file, 'wb')

    wavfile.setnchannels(channels)

    wavfile.setsampwidth(bits // 8)

    wavfile.setframerate(sample_rate)

    wavfile.writeframes(pcmdata)

    wavfile.close()

还有一个github开源代码：wavutils

其他音频格式

MP3

MP3利用MPEG Audio Layer3 压缩方式进行压缩，所以简称为MP3，是一种有损压缩格式。 MPEG Audio Layer 3 压缩技术可以将音乐以1:10 甚至 1:12 的压缩率，能够在音质丢失很小的情况下把文件压缩到更小的程度。由于MP3体积小，音质高互联网上音乐几乎都是这种格式。但Mp3最高比特率320K，高频部分一刀切是他的缺点，对音质要求高的话还是建议wav格式。

ARM格式全称Adaptive Multi-Rate 和 Adaptive Multi-Rate Wideband，主要用于移动设备的音频，压缩比比较大，但相对其他的压缩格式质量比较差，多用于人声，通话，是一种有损压缩格式。

Ogg全称应该是OGG Vobis(ogg Vorbis) 是一种新的音频压缩格式，类似于MP3等现有的音乐格式。相对于MP3压缩技术它是完全免费、开放和没有专利限制的，是一种有损压缩格式。

AAC（Advanced Audio Coding），中文称为“高级音频编码”，出现于1997年，基于 MPEG-2的音频编码技术，是一种有损压缩技术。

LAC即是Free Lossless Audio Codec的缩写，为无损音频压缩编码，由于不会丢失任何音频信息可以利用算法恢复原始编码，前景广阔。

参考

wave文件(*.wav)格式、PCM数据格式

wav文件格式分析与详解

WAVE音频格式及及转换代码的更多相关文章

wave音频格式一窥
学习需要不断的刨根问底,首先,RIFF是微软多媒体格式的一个规范. 其次,有很多用C++实现wave解析的好文章.
Sound Forge批量转换音频格式，实现高效编辑音频
Sound Forge的批量处理功能可以实现批量格式转换.批量添加效果等功能,让用户可以在处理其他音频编辑任务的同时,自动完成格式转换.效果添加等重复性任务.接下来,一起来看看如何借助批处理转换器实现 ...
太赞了！Python竟可以轻松实现音频格式无损转换
大家好,我是辰哥辰哥在平时处理音频格式的时候,需要去下载各种音频处理软件(专业一点的软件还要收费),掌握Python技术的我们,知道Python是万能的(哈哈哈,开个玩笑).今天辰哥就来教大家用Py ...
(原创)speex与wav格式音频文件的互相转换
我们的司信项目又有了新的需求,就是要做会议室.然而需求却很纠结,要继续按照原来发语音消息那样的形式来实现这个会议的功能,还要实现语音播放的计时,暂停,语音的拼接,还要绘制频谱图等等. 如果是wav,m ...
C# 使用ffmpeg.exe进行音频转换完整demo-asp.net转换代码
C# 使用ffmpeg.exe进行音频转换完整demo-asp.net转换代码上一篇说了在winform下进行调用cmd.exe执行ffmpeg.exe进行音频转换完整demo.后来我又需要移植这个 ...
怎样将flac音频格式转换成MP3格式
Flac音频格式怎样转换成MP3格式呢?随着现在音频格式的不断多样性,生活中很多时候我们都会遇到音频格式转换的问题,如flac音频转MP3的问题,那么我们应该如何去解决这个问题呢?下面我们就一起去来一 ...
怎样将M4A音频格式转换成MP3格式
因为MP3音频格式应用的广泛性,所以很多时候我们都需要将不同的音频格式转换成MP3格式的,那么如果我们需要将M4A音频格式转换成MP3格式,我们应该怎样进行实现呢?下面我们就一起来看一下吧. 操作步骤 ...
linux命令实现音频格式转换和拼接
安装FFmpeg flaceric@ray:~$ sudo apt install FFmpeg flac 安装lame faaceric@ray:~$ sudo apt install lame f ...
java视频格式转换代码
http://blog.163.com/zzf_fly/blog/static/20958915820127217443816/ package com.gkzx.online.action; imp ...

随机推荐

String类的基本用法
1.String 对象的创建 String对象的创建有两种方式. 第1 种方式就是我们最常见的创建字符串的方式: String str1 = "Hello, 慕课网"; 第 2 种 ...
如何写好一份晋升PPT（附PPT模板）
又到了每年晋升述职的时间,在过去的5.6年里,我以评委身份参与了大量的晋升述职(主要是前端,也包括客户端和测试),也辅导了许多(100+)组内外的同学,指导他们书写和完善PPT.过程中我发现大家有许多 ...
数据库基础知识详解四：存储过程、视图、游标、SQL语句优化以及索引
写在文章前:本系列文章用于博主自己归纳复习一些基础知识,同时也分享给可能需要的人,因为水平有限,肯定存在诸多不足以及技术性错误,请大佬们及时指正. 11.存储过程存储过程是事先经过编译并存储在数 ...
将个人项目发布到mavan中央仓库
第一步,准备自己的git代码比如在gitee或者github上的代码,我的是gitee码云上的,开源了一个处理业务日志采集的组件,支持注解方式,支持SpEL表达式,支持变量自定义. 话不多说,直接上 ...
java第十二周作业
1.定义一个点类Point, 包含2个成员变量x.y分别表示x和y坐标,2个构造器Point()和Point( intx0,y0),以及一个movePoint (int dx,intdy)方法实现点的 ...
JVM内存管理面试常见问题全解
目录一.什么是JVM 1.jvm的三个组成部分二.类加载系统 1.类的加载过程 2.类加载器三.双亲委派机制 1.双亲委派机制介绍 2.为什么要双亲委派机制 3.双亲委派机制的核心源码 4.全盘 ...
k8s入门之Deployment(五)
Deployment控制器通常用来部署无状态的应用,这样可以在任意的节点上扩容或者删除,而不用考虑数据的问题,它可以管理pod对象. 一.多副本 1.使用命令行方式创建Deployment 在dev名 ...
一个实战让你搞懂Dockerfile
摘要在认识Dockerfile的基础功能之后,即一个用基础镜像来构建新镜像的文本文件,就需要在实际工作中使用其灵活便利的操作来提升我们的工作效率了,这里演示在Tomcat里运行一个程序的过程,以此来 ...
python学习番外篇——字符串的数据类型转换及内置方法
目录字符串的数据类型转换及内置方法类型转换内置方法优先掌握的方法需要掌握的方法 strip, lstrip, rstrip lower, upper, islower, isupper 插入 ...
EdgeFormer: 向视觉 Transformer 学习，构建一个比 MobileViT 更好更快的卷积网络
前言本文主要探究了轻量模型的设计.通过使用 Vision Transformer 的优势来改进卷积网络,从而获得更好的性能. 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结.最新技术跟 ...

WAVE音频格式及及转换代码