几个术语和概念:

1.       关于PCM的

PCM是Pulse code modulation的缩写,它是对波形最直接的编码方式。它在音频中的地位可能和BMP在图片中的地位有点类似吧。

Sampling rate:从模拟信号到数字信号,即从连续信号到离散信号的转换都是通过离散采样完成的,Sampling rate就是每秒种采样的个数。根据香农采样定理,要保证信号不失真,Sampling rate要大于信号最高频率的两倍。我们知道人的耳朵能听到的频率范围是20hz – 20khz,所以Sampling rate达到40k就够了,再多了也只是浪费。但是有时为了节省带宽和存储资源,可以降低Sampling rate而损失声音的质量,所以我们常常见到小于40k采样率的声音数据。

Sample size:用来量化一个采样的幅度,一般为8 bits、16 bits和24 bits。8 bits只有早期的声卡支持,而24 bits只有专业的声卡才支持,我们用的一般都是16 bits的。

Number of channels:声音通道个数,单声道为一个,立体声为两个,还有更多的(如8个声道的7.1格式)。一般来说,每个声道都来源于一个独立的mic,所以声道多效果会更好(更真实),当然代价也更大。

Frame: Frame是指包含了所有通道的一次采样数据,比如对于16bits的双声道来说,一个frame的大小为4个字节(2 * 16)。

一、数字音频

音频信号是一种连续变化的模拟信号,但计算机只能处理和记录二进制的数字信号,由自然音源得到的音频信号必须经过一定的变换,成为数字音频信号之后,才能送到计算机中作进一步的处理。

数字音频系统通过将声波的波型转换成一系列二进制数据,来实现对原始声音的重现,实现这一步骤的设备常被称为模/数转换器(A/D)。A/D转换器以每秒钟上万次的速率对声波进行采样,每个采样点都记录下了原始模拟声波在某一时刻的状态,通常称之为样本(sample),而每一秒钟所采样的数目则称为采样频率,通过将一串连续的样本连接起来,就可以在计算机中描述一段声音了。对于采样过程中的每一个样本来说,数字音频系统会分配一定存储位来记录声波的振幅,一般称之为采样分辩率或者采样精度,采样精度越高,声音还原时就会越细腻。

数字音频涉及到的概念非常多,对于在Linux下进行音频编程的程序员来说,最重要的是理解声音数字化的两个关键步骤:采样和量化。采样就是每隔一定时间就读一次声音信号的幅度,而量化则是将采样得到的声音信号幅度转换为数字值,从本质上讲,采样是时间上的数字化,而量化则是幅度上的数字化。下面介绍几个在进行音频编程时经常需要用到的技术指标:

采样频率

采样频率是指将模拟声音波形进行数字化时,每秒钟抽取声波幅度样本的次数。采样频率的选择应该遵循奈奎斯特(Harry Nyquist)采样理论:如果对某一模拟信号进行采样,则采样后可还原的最高信号频率只有采样频率的一半,或者说只要采样频率高于输入信号最高频率的两倍,就能从采样信号系列重构原始信号。正常人听觉的频率范围大约在20Hz~20kHz之间,根据奈奎斯特采样理论,为了保证声音不失真,采样频率应该在40kHz左右。常用的音频采样频率有8kHz、11.025kHz、22.05kHz、16kHz、37.8kHz、44.1kHz、48kHz等,如果采用更高的采样频率,还可以达到DVD的音质。 其中,8kHZ为电话的采样频率。

量化位数

量化位数是对模拟音频信号的幅度进行数字化,它决定了模拟信号数字化以后的动态范围,常用的有8位、12位和16位。量化位越高,信号的动态范围越大,数字化后的音频信号就越可能接近原始信号,但所需要的存贮空间也越大。

声道数

声道数是反映音频数字化质量的另一个重要因素,它有单声道和双声道之分。双声道又称为立体声,在硬件中有两条线路,音质和音色都要优于单声道,但数字化后占据的存储空间的大小要比单声道多一倍。

二、声卡驱动

出于对安全性方面的考虑,Linux下的应用程序无法直接对声卡这类硬件设备进行操作,而是必须通过内核提供的驱动程序才能完成。在Linux上进行音频编程的本质就是要借助于驱动程序,来完成对声卡的各种操作。

对硬件的控制涉及到寄存器中各个比特位的操作,通常这是与设备直接相关并且对时序的要求非常严格,如果这些工作都交由应用程序员来负责,那么对声卡的编程将变得异常复杂而困难起来,驱动程序的作用正是要屏蔽硬件的这些底层细节,从而简化应用程序的编写。目前Linux下常用的声卡驱动程序主要有两种:OSS和ALSA。

最早出现在Linux上的音频编程接口是OSS(Open Sound System),它由一套完整的内核驱动程序模块组成,可以为绝大多数声卡提供统一的编程接口。OSS出现的历史相对较长,这些内核模块中的一部分(OSS/Free)是与Linux内核源码共同免费发布的,另外一些则以二进制的形式由4Front Technologies公司提供。由于得到了商业公司的鼎力支持,OSS已经成为在Linux下进行音频编程的事实标准,支持OSS的应用程序能够在绝大多数声卡上工作良好。

虽然OSS已经非常成熟,但它毕竟是一个没有完全开放源代码的商业产品,ALSA(AdvancedLinux Sound Architecture)恰好弥补了这一空白,它是在Linux下进行音频编程时另一个可供选择的声卡驱动程序。ALSA除了像OSS那样提供了一组内核驱动程序模块之外,还专门为简化应用程序的编写提供了相应的函数库,与OSS提供的基于ioctl的原始编程接口相比,ALSA函数库使用起来要更加方便一些。ALSA的主要特点有:

  • 支持多种声卡设备
  • 模块化的内核驱动程序
  • 支持SMP和多线程
  • 提供应用开发函数库
  • 兼容OSS应用程序

ALSA和OSS最大的不同之处在于ALSA是由志愿者维护的自由项目,而OSS则是由公司提供的商业产品,因此在对硬件的适应程度上OSS要优于ALSA,它能够支持的声卡种类更多。ALSA虽然不及OSS运用得广泛,但却具有更加友好的编程接口,并且完全兼容于OSS,对应用程序员来讲无疑是一个更佳的选择。

三、编程接口

如何对各种音频设备进行操作是在Linux上进行音频编程的关键,通过内核提供的一组系统调用,应用程序能够访问声卡驱动程序提供的各种音频设备接口,这是在Linux下进行音频编程最简单也是最直接的方法。

3.1 访问音频设备

无论是OSS还是ALSA,都是以内核驱动程序的形式运行在Linux内核空间中的,应用程序要想访问声卡这一硬件设备,必须借助于Linux内核所提供的系统调用(systemcall)。从程序员的角度来说,对声卡的操作在很大程度上等同于对磁盘文件的操作:首先使用open系统调用建立起与硬件间的联系,此时返回的文件描述符将作为随后操作的标识;接着使用read系统调用从设备接收数据,或者使用write系统调用向设备写入数据,而其它所有不符合读/写这一基本模式的操作都可以由ioctl系统调用来完成;最后,使用close系统调用告诉Linux内核不会再对该设备做进一步的处理。

  • open系统调用
    位无符号数据、单声道、8KHz采样率,如果默认值无法达到要求,可以通过ioctl系统调用来改变它们。通常说来,在应用程序中打开设备文件/dev/dsp之后,接下去就应该为其设置恰当的格式,然后才能从声卡读取或者写入数据。

    • /dev/audio
      /dev/audio类似于/dev/dsp,它兼容于Sun工作站上的音频设备,使用的是mu-law编码方式。如果声卡驱动程序提供了对/dev/audio的支持,那么在Linux上就可以通过cat命令,来播放在Sun工作站上用mu-law进行编码的音频文件:

    [xiaowp@linuxgam sound]$ cat audio.au > /dev/audio

    由于设备文件/dev/audio主要出于对兼容性的考虑,所以在新开发的应用程序中最好不要尝试用它,而应该以/dev/dsp进行替代。对于应用程序来说,同一时刻只能使用/dev/audio或者/dev/dsp其中之一,因为它们是相同硬件的不同软件接口。

    • /dev/mixer
      在声卡的硬件电路中,混音器(mixer)是一个很重要的组成部分,它的作用是将多个信号组合或者叠加在一起,对于不同的声卡来说,其混音器的作用可能各不相同。运行在Linux内核中的声卡驱动程序一般都会提供/dev/mixer这一设备文件,它是应用程序对混音器进行操作的软件接口。混音器电路通常由两个部分组成:输入混音器(input mixer)和输出混音器(output mixer)。
      输入混音器负责从多个不同的信号源接收模拟信号,这些信号源有时也被称为混音通道或者混音设备。模拟信号通过增益控制器和由软件控制的音量调节器后,在不同的混音通道中进行级别(level)调制,然后被送到输入混音器中进行声音的合成。混音器上的电子开关可以控制哪些通道中有信号与混音器相连,有些声卡只允许连接一个混音通道作为录音的音源,而有些声卡则允许对混音通道做任意的连接。经过输入混音器处理后的信号仍然为模拟信号,它们将被送到A/D转换器进行数字化处理。
      输出混音器的工作原理与输入混音器类似,同样也有多个信号源与混音器相连,并且事先都经过了增益调节。当输出混音器对所有的模拟信号进行了混合之后,通常还会有一个总控增益调节器来控制输出声音的大小,此外还有一些音调控制器来调节输出声音的音调。经过输出混音器处理后的信号也是模拟信号,它们最终会被送给喇叭或者其它的模拟输出设备。对混音器的编程包括如何设置增益控制器的级别,以及怎样在不同的音源间进行切换,这些操作通常来讲是不连续的,而且不会像录音或者放音那样需要占用大量的计算机资源。由于混音器的操作不符合典型的读/写操作模式,因此除了open和close两个系统调用之外,大部分的操作都是通过ioctl系统调用来完成的。与/dev/dsp不同,/dev/mixer允许多个应用程序同时访问,并且混音器的设置值会一直保持到对应的设备文件被关闭为止。
      为了简化应用程序的设计,Linux上的声卡驱动程序大多都支持将混音器的ioctl操作直接应用到声音设备上,也就是说如果已经打开了/dev/dsp,那么就不用再打开/dev/mixer来对混音器进行操作,而是可以直接用打开/dev/dsp时得到的文件标识符来设置混音器。
    • /dev/sequencer
      目前大多数声卡驱动程序还会提供/dev/sequencer这一设备文件,用来对声卡内建的波表合成器进行操作,或者对MIDI总线上的乐器进行控制,一般只用于计算机音乐软件中。

    四、应用框架

    在Linux下进行音频编程时,重点在于如何正确地操作声卡驱动程序所提供的各种设备文件,由于涉及到的概念和因素比较多,所以遵循一个通用的框架无疑将有助于简化应用程序的设计。

    4.1 DSP编程

    对声卡进行编程时首先要做的是打开与之对应的硬件设备,这是借助于open系统调用来完成的,并且一般情况下使用的是/dev/dsp文件。采用何种模式对声卡进行操作也必须在打开设备时指定,对于不支持全双工的声卡来说,应该使用只读或者只写的方式打开,只有那些支持全双工的声卡,才能以读写的方式打开,并且还要依赖于驱动程序的具体实现。Linux允许应用程序多次打开或者关闭与声卡对应的设备文件,从而能够很方便地在放音状态和录音状态之间进行切换,建议在进行音频编程时只要有可能就尽量使用只读或者只写的方式打开设备文件,因为这样不仅能够充分利用声卡的硬件资源,而且还有利于驱动程序的优化。下面的代码示范了如何以只写方式打开声卡进行放音(playback)操作:

    int handle = open("/dev/dsp", O_WRONLY);

    if (handle == -1) {

    perror("open /dev/dsp");

    return -1;

    }

    运行在Linux内核中的声卡驱动程序专门维护了一个缓冲区,其大小会影响到放音和录音时的效果,使用ioctl系统调用可以对它的尺寸进行恰当的设置。调节驱动程序中缓冲区大小的操作不是必须的,如果没有特殊的要求,一般采用默认的缓冲区大小也就可以了。但需要注意的是,缓冲区大小的设置通常应紧跟在设备文件打开之后,这是因为对声卡的其它操作有可能会导致驱动程序无法再修改其缓冲区的大小。下面的代码示范了怎样设置声卡驱动程序中的内核缓冲区的大小:

    int setting = 0xnnnnssss;

    int result = ioctl(handle, SNDCTL_DSP_SETFRAGMENT, &setting);

    if (result == -1) {

    perror("ioctl buffer size");

    return -1;

    }

    // 检查设置值的正确性

    在设置缓冲区大小时,参数setting实际上由两部分组成,其低16位标明缓冲区的尺寸,相应的计算公式为buffer_size = 2^ssss,即若参数setting低16位的值为16,那么相应的缓冲区的大小会被设置为65536字节。参数setting的高16位则用来标明分片(fragment)的最大序号,它的取值范围从2一直到0x7FFF,其中0x7FFF表示没有任何限制。

    接下来要做的是设置声卡工作时的声道(channel)数目,根据硬件设备和驱动程序的具体情况,可以将其设置为0(单声道,mono)或者1(立体声,stereo)。下面的代码示范了应该怎样设置声道数目:

    int channels = 0; // 0=mono 1=stereo

    int result = ioctl(handle, SNDCTL_DSP_STEREO, &channels);

    if ( result == -1 ) {

    perror("ioctl channel number");

    return -1;

    }

    if (channels != 0) {

    // 只支持立体声

    }

    采样格式和采样频率是在进行音频编程时需要考虑的另一个问题,声卡支持的所有采样格式可以在头文件soundcard.h中找到,而通过ioctl系统调用则可以很方便地更改当前所使用的采样格式。下面的代码示范了如何设置声卡的采样格式:

    int format = AFMT_U8;

    int result = ioctl(handle, SNDCTL_DSP_SETFMT, &format);

    if ( result == -1 ) {

    perror("ioctl sample format");

    return -1;

    }

    // 检查设置值的正确性

    声卡采样频率的设置也非常容易,只需在调用ioctl时将第二个参数的值设置为SNDCTL_DSP_SPEED,同时在第三个参数中指定采样频率的数值就行了。对于大多数声卡来说,其支持的采样频率范围一般为5kHz到44.1kHz或者48kHz,但并不意味着该范围内的所有频率都会被硬件支持,在Linux下进行音频编程时最常用到的几种采样频率是11025Hz、16000Hz、22050Hz、32000Hz和44100Hz。下面的代码示范了如何设置声卡的采样频率:

    int rate = 22050;

    int result = ioctl(handle, SNDCTL_DSP_SPEED, &rate);

    if ( result == -1 ) {

    perror("ioctl sample format");

    return -1;

    }

    // 检查设置值的正确性

    4.2 Mixer编程

    声卡上的混音器由多个混音通道组成,它们可以通过驱动程序提供的设备文件/dev/mixer进行编程。对混音器的操作是通过ioctl系统调用来完成的,并且所有控制命令都由SOUND_MIXER或者MIXER开头,表1列出了常用的几个混音器控制命令:

    名 称

    作 用

    SOUND_MIXER_VOLUME

    主音量调节

    SOUND_MIXER_BASS

    低音控制

    SOUND_MIXER_TREBLE

    高音控制

    SOUND_MIXER_SYNTH

    FM合成器

    SOUND_MIXER_PCM

    主D/A转换器

    SOUND_MIXER_SPEAKER

    PC喇叭

    SOUND_MIXER_LINE

    音频线输入

    SOUND_MIXER_MIC

    麦克风输入

    SOUND_MIXER_CD

    CD输入

    SOUND_MIXER_IMIX

    回放音量

    SOUND_MIXER_ALTPCM

    从D/A 转换器

    SOUND_MIXER_RECLEV

    录音音量

    SOUND_MIXER_IGAIN

    输入增益

    SOUND_MIXER_OGAIN

    输出增益

    SOUND_MIXER_LINE1

    声卡的第1输入

    SOUND_MIXER_LINE2

    声卡的第2输入

    SOUND_MIXER_LINE3

    声卡的第3输入

    表1 混音器命令

    对声卡的输入增益和输出增益进行调节是混音器的一个主要作用,目前大部分声卡采用的是8位或者16位的增益控制器,但作为程序员来讲并不需要关心这些,因为声卡驱动程序会负责将它们变换成百分比的形式,也就是说无论是输入增益还是输出增益,其取值范围都是从0到100。在进行混音器编程时,可以使用SOUND_MIXER_READ宏来读取混音通道的增益大小,例如在获取麦克风的输入增益时,可以使用如下的代码:

    int vol;

    ioctl(fd, SOUND_MIXER_READ(SOUND_MIXER_MIC), &vol);

    printf("Mic gain is at %d %%\n", vol);

    对于只有一个混音通道的单声道设备来说,返回的增益大小保存在低位字节中。而对于支持多个混音通道的双声道设备来说,返回的增益大小实际上包括两个部分,分别代表左、右两个声道的值,其中低位字节保存左声道的音量,而高位字节则保存右声道的音量。下面的代码可以从返回值中依次提取左右声道的增益大小:

    int left, right;

    left = vol & 0xff;

    right = (vol & 0xff00) >> 8;

    printf("Left gain is %d %%, Right gain is %d %%\n", left, right);

    类似地,如果想设置混音通道的增益大小,则可以通过SOUND_MIXER_WRITE宏来实现,此时遵循的原则与获取增益值时的原则基本相同,例如下面的语句可以用来设置麦克风的输入增益:

    vol = (right << 8) + left;

    ioctl(fd, SOUND_MIXER_WRITE(SOUND_MIXER_MIC), &vol);

    在编写实用的音频程序时,混音器是在涉及到兼容性时需要重点考虑的一个对象,这是因为不同的声卡所提供的混音器资源是有所区别的。声卡驱动程序提供了多个ioctl系统调用来获得混音器的信息,它们通常返回一个整型的位掩码(bitmask),其中每一位分别代表一个特定的混音通道,如果相应的位为1,则说明与之对应的混音通道是可用的。例如通过SOUND_MIXER_READ_DEVMASK返回的位掩码,可以查询出能够被声卡支持的每一个混音通道,而通过SOUND_MIXER_READ_RECMAS返回的位掩码,则可以查询出能够被当作录音源的每一个通道。下面的代码可以用来检查CD输入是否是一个有效的混音通道:

    ioctl(fd, SOUND_MIXER_READ_DEVMASK, &devmask);

    if (devmask & SOUND_MIXER_CD)

    printf("The CD input is supported");

    如果进一步还想知道其是否是一个有效的录音源,则可以使用如下语句:

    ioctl(fd, SOUND_MIXER_READ_RECMASK, &recmask);

    if (recmask & SOUND_MIXER_CD)

    printf("The CD input can be a recording source");

    目前大多数声卡提供多个录音源,通过SOUND_MIXER_READ_RECSRC可以查询出当前正在使用的录音源,同一时刻能够使用几个录音源是由声卡硬件决定的。类似地,使用SOUND_MIXER_WRITE_RECSRC可以设置声卡当前使用的录音源,例如下面的代码可以将CD输入作为声卡的录音源使用:

    devmask = SOUND_MIXER_CD;

    ioctl(fd, SOUND_MIXER_WRITE_DEVMASK, &devmask);

    此外,所有的混音通道都有单声道和双声道的区别,如果需要知道哪些混音通道提供了对立体声的支持,可以通过SOUND_MIXER_READ_STEREODEVS来获得。

    4.3 音频录放框架

    下面给出一个利用声卡上的DSP设备进行声音录制和回放的基本框架,它的功能是先录制几秒种音频数据,将其存放在内存缓冲区中,然后再进行回放,其所有的功能都是通过读写/dev/dsp设备文件来完成的:

    /*

    * sound.c

    */

    #include <unistd.h>

    #include <fcntl.h>

    #include <sys/types.h>

    #include <sys/ioctl.h>

    #include <stdlib.h>

    #include <stdio.h>

    #include <linux/soundcard.h>

    #define LENGTH 3    /* 存储秒数 */

    #define RATE 8000   /* 采样频率 */

    #define SIZE 8      /* 量化位数 */

    #define CHANNELS 1  /* 声道数目 */

    /* 用于保存数字音频数据的内存缓冲区 */

    unsigned char buf[LENGTH*RATE*SIZE*CHANNELS/8];

    int main()

    {

    int fd; /* 声音设备的文件描述符 */

    int arg;        /* 用于ioctl调用的参数 */

    int status;   /* 系统调用的返回值 */

    /* 打开声音设备 */

    fd = open("/dev/dsp", O_RDWR);

    if (fd < 0) {

    perror("open of /dev/dsp failed");

    exit(1);

    }

    /* 设置采样时的量化位数 */

    arg = SIZE;

    status = ioctl(fd, SOUND_PCM_WRITE_BITS, &arg);

    if (status == -1)

    perror("SOUND_PCM_WRITE_BITS ioctl failed");

    if (arg != SIZE)

    perror("unable to set sample size");

    /* 设置采样时的声道数目 */

    arg = CHANNELS;

    status = ioctl(fd, SOUND_PCM_WRITE_CHANNELS, &arg);

    if (status == -1)

    perror("SOUND_PCM_WRITE_CHANNELS ioctl failed");

    if (arg != CHANNELS)

    perror("unable to set number of channels");

    /* 设置采样时的采样频率 */

    arg = RATE;

    status = ioctl(fd, SOUND_PCM_WRITE_RATE, &arg);

    if (status == -1)

    perror("SOUND_PCM_WRITE_WRITE ioctl failed");

    /* 循环,直到按下Control-C */

    while (1) {

    printf("Say something:\n");

    status = read(fd, buf, sizeof(buf)); /* 录音 */

    if (status != sizeof(buf))

    perror("read wrong number of bytes");

    printf("You said:\n");

    status = write(fd, buf, sizeof(buf)); /* 回放 */

    if (status != sizeof(buf))

    perror("wrote wrong number of bytes");

    /* 在继续录音前等待回放结束 */

    status = ioctl(fd, SOUND_PCM_SYNC, 0);

    if (status == -1)

    perror("SOUND_PCM_SYNC ioctl failed");

    }

    }

    4.4 混音器框架

    下面再给出一个对混音器进行编程的基本框架,利用它可以对各种混音通道的增益进行调节,其所有的功能都是通过读写/dev/mixer设备文件来完成的:

    /*

    * mixer.c

    */

    #include <unistd.h>

    #include <stdlib.h>

    #include <stdio.h>

    #include <sys/ioctl.h>

    #include <fcntl.h>

    #include <linux/soundcard.h>

    /* 用来存储所有可用混音设备的名称 */

    const char *sound_device_names[] = SOUND_DEVICE_NAMES;

    int fd;                  /* 混音设备所对应的文件描述符 */

    int devmask, stereodevs; /* 混音器信息对应的位图掩码 */

    char *name;

    /* 显示命令的使用方法及所有可用的混音设备 */

    void usage()

    {

    int i;

    fprintf(stderr, "usage: %s <device> <left-gain%%> <right-gain%%>\n"

    "       %s <device> <gain%%>\n\n"

    "Where <device> is one of:\n", name, name);

    for (i = 0 ; i < SOUND_MIXER_NRDEVICES ; i++)

    if ((1 << i) & devmask) /* 只显示有效的混音设备 */

    fprintf(stderr, "%s ", sound_device_names[i]);

    fprintf(stderr, "\n");

    exit(1);

    }

    int main(int argc, char *argv[])

    {

    int left, right, level;  /* 增益设置 */

    int status;              /* 系统调用的返回值 */

    int device;              /* 选用的混音设备 */

    char *dev;               /* 混音设备的名称 */

    int i;

    name = argv[0];

    /* 以只读方式打开混音设备 */

    fd = open("/dev/mixer", O_RDONLY);

    if (fd == -1) {

    perror("unable to open /dev/mixer");

    exit(1);

    }

    /* 获得所需要的信息 */

    status = ioctl(fd, SOUND_MIXER_READ_DEVMASK, &devmask);

    if (status == -1)

    perror("SOUND_MIXER_READ_DEVMASK ioctl failed");

    status = ioctl(fd, SOUND_MIXER_READ_STEREODEVS, &stereodevs);

    if (status == -1)

    perror("SOUND_MIXER_READ_STEREODEVS ioctl failed");

    /* 检查用户输入 */

    if (argc != 3 && argc != 4)

    usage();

    /* 保存用户输入的混音器名称 */

    dev = argv[1];

    /* 确定即将用到的混音设备 */

    for (i = 0 ; i < SOUND_MIXER_NRDEVICES ; i++)

    if (((1 << i) & devmask) && !strcmp(dev, sound_device_names[i]))

    break;

    if (i == SOUND_MIXER_NRDEVICES) { /* 没有找到匹配项 */

    fprintf(stderr, "%s is not a valid mixer device\n", dev);

    usage();

    }

    /* 查找到有效的混音设备 */

    device = i;

    /* 获取增益值 */

    if (argc == 4) {

    /* 左、右声道均给定 */

    left  = atoi(argv[2]);

    right = atoi(argv[3]);

    } else {

    /* 左、右声道设为相等 */

    left  = atoi(argv[2]);

    right = atoi(argv[2]);

    }

    /* 对非立体声设备给出警告信息 */

    if ((left != right) && !((1 << i) & stereodevs)) {

    fprintf(stderr, "warning: %s is not a stereo device\n", dev);

    }

    /* 将两个声道的值合到同一变量中 */

    level = (right << 8) + left;

    /* 设置增益 */

    status = ioctl(fd, MIXER_WRITE(device), &level);

    if (status == -1) {

    perror("MIXER_WRITE ioctl failed");

    exit(1);

    }

    /* 获得从驱动返回的左右声道的增益 */

    left  = level & 0xff;

    right = (level & 0xff00) >> 8;

    /* 显示实际设置的增益 */

    fprintf(stderr, "%s gain set to %d%% / %d%%\n", dev, left, right);

    /* 关闭混音设备 */

    close(fd);

    return 0;

    }

    编译好上面的程序之后,先不带任何参数执行一遍,此时会列出声卡上所有可用的混音通道:

    [xiaowp@linuxgam sound]$ ./mixer

    usage: ./mixer <device> <left-gain%> <right-gain%>

    ./mixer <device> <gain%>

    Where <device> is one of:

    vol pcm speaker line mic cd igain line1 phin video

    之后就可以很方便地设置各个混音通道的增益大小了,例如下面的命令就能够将CD输入的左、右声道的增益分别设置为80%和90%:

    [xiaowp@linuxgam sound]$ ./mixer cd 80 90

    cd gain set to 80% / 90%

    五、小结

    随着Linux平台下多媒体应用的逐渐深入,需要用到数字音频的场合必将越来越广泛。虽然数字音频牵涉到的概念非常多,但在Linux下进行最基本的音频编程却并不十分复杂,关键是掌握如何与OSS或者ALSA这类声卡驱动程序进行交互,以及如何充分利用它们提供的各种功能,熟悉一些最基本的音频编程框架和模式对初学者来讲大有裨益。

    与音频相关的技术知识点总结(Linux方向的开发)的更多相关文章

    1. atitit 商业项目常用模块技术知识点 v3 qc29

      atitit 商业项目常用模块技术知识点 v3 qc29 条码二维码barcodebarcode 条码二维码qrcodeqrcode 条码二维码dm码生成与识别 条码二维码pdf147码 条码二维码z ...

    2. Docker技术知识点总结

      Docker技术知识点总结 本文宿主机环境Centos7.4Docker version 18.09.2, build 6247962采用国内 Daocloud 加速器---------------- ...

    3. Azure IoT Hub和Event Hub相关的技术系列-索引篇

      Azure IoT Hub和Event Hub相关的技术系列,最近已经整理了不少了,统一做一个索引链接,置顶. Azure IoT 技术研究系列1-入门篇 Azure IoT 技术研究系列2-设备注册 ...

    4. 剑指Offer——知识点储备--Linux基本命令+Makefile

      剑指Offer--知识点储备–Linux基本命令 1.linux下查看进程占用cpu的情况(top): 格式 top [-] [d delay] [q] [c] [S] [s] [i] [n] 主要参 ...

    5. js 横屏 竖屏 相关代码 与知识点

      <!DOCTYPE html> <html> <head> <title></title> </head> <body&g ...

    6. NVIDIA GRID 和 NICE DCV 技术用于实现 Linux 和 Windows® 图形加速虚拟桌面

      NVIDIA GRID 和 NICE DCV 技术用于实现 Linux 和 Windows® 图形加速虚拟桌面. NICE DCV: 满足 LINUX 和 WINDOWS 的远程 3D 通过 NICE ...

    7. ARPG游戏打击感相关的技术简单总结

      说好的技术总结,根据近期的工作总结一下体现游戏打击感相关的技术.一般arpg的游戏打击感除了场景的氛围的烘托,策划的数值:连击,奖励伤害数字的连贯积累反馈,硬直加物理击飞ragdoll,更不可忽视的也 ...

    8. (八)JSP 技术知识点总结(来自那些年的笔记)

      目录 什么是 jsp Jsp 调用和运行原理(简略版) Jsp语法 Jsp指令简介 Page指令 Include指令 taglib指令 Jsp乱码问题 jsp运行原理(详细版) JSP中的九大隐式对象 ...

    9. python数据处理相关的一些知识点(学习点)

      自己总结了一下就是存储,消息处理(异步,阻塞,队列,消息中间件) 参考岗位需求 数据爬虫工程师的岗位职责:1.分布式网络爬虫研发:不断完善现有抓取系统,通过对抓取.解析.调度.存储等模块的拆分与优化, ...

    随机推荐

    1. poj 1741 树的点分治(入门)

      Tree Time Limit: 1000MS   Memory Limit: 30000K Total Submissions: 18205   Accepted: 5951 Description ...

    2. poj 1265 Area 面积+多边形内点数

      Area Time Limit: 1000MS   Memory Limit: 10000K Total Submissions: 5861   Accepted: 2612 Description ...

    3. poj3237 树链部分 边权模板

      Tree Time Limit: 5000MS   Memory Limit: 131072K Total Submissions: 7384   Accepted: 2001 Description ...

    4. APIO2017 懵逼记

      Day -1: 移步http://www.cnblogs.com/juruolty/p/6854795.html Day 0: CTSC铁牌后,下一个就是APIO了. lmy,sxy,cxc,lh过来 ...

    5. 基于Spark环境对比Python和Scala语言利弊

      在数据挖掘中,Python和Scala语言都是极受欢迎的,本文总结两种语言在Spark环境各自特点. 本文翻译自  https://www.dezyre.com/article/Scala-vs-Py ...

    6. 存储单位的换算(KB, MB, GB)

      关于存储单位的换算,大家一般会想到下面的换算方法. 1GB=1024MB 1MB=1024KB 1kb=1024字节 但实际生活中,这种换算方法并不准确. 例如在商家生产销售的硬盘, U盘中就不是这样 ...

    7. ChatGirl is an AI ChatBot based on TensorFlow Seq2Seq Model

      Introduction [Under developing,it is not working well yet.But you can just train,and run it.] ChatGi ...

    8. python2.7入门---条件语句

          前段时间呢,把MongoDB的基础内容了解的差不多了.接下来,就开始学习python2.7的基础内容喽.接着前面的知识点来学习.首先,来看一下条件语句.Python条件语句是通过一条或多条语句 ...

    9. spring基本原理

      作者:王奕然链接:https://www.zhihu.com/question/21346206/answer/101789659来源:知乎著作权归作者所有.商业转载请联系作者获得授权,非商业转载请注 ...

    10. spring的 @Scheduled的cron表达式

      网上太多说的多,但却没什么用的文章了 序号 说明 是否必填 允许填写的值         允许的通配符1       秒    是                0-59 ,             ...