Linux音频采集和在国产化平台中遇到的坑(一)

最近在做一个国产化平台的软件项目的开发,是基于国产芯片的银河麒麟系统。其中有一个重要模块,是采集和播放音频数据,播放不用多说了,采集的话,包括采集麦克风和采集桌面系统声音。很多人都觉得银河麒麟不就是linux么,那不直接用ALSA就好了,我原本也是这么想的,但是实际开发下来才发现,还是有各种坑需要自己去趟的。这里我简单记录一下。

虽然都是linux,芯片也是基于同样的架构,同样的指令集,但是考虑到芯片的实现毕竟是不同的,于是所有涉及到硬件交互的软件部分,也会有所差异,最终会导致了有些应用层面的接口,不能按照普通linux的通常用法去使用。

linux ALSA音频采集

首先,银河麒麟既然是linux系统,那首先考虑到的是通过ALSA(Advanced Linux Sound Architecture)来进行采集,ALSA是linux的默认声卡驱动,同时在用户层还有一个ALSA Lib来供应用程序调用,它的整体上的结构图是这个样子的:

应用程序通常都是通过alsa-lib来使用,如果系统没有的话,可以通过命令安装开发库,就可以使用了。例如

sudo apt-get install libasound2-dev

另外需要注意一点的是,如果是android系统,那么系统里通常是不存在alsa的,而是它的简化版tiny-alsa,接口名称也不一样,但是大致调用流程是相同的。

alsa音频采集,有几个关键函数

#include <sys/asoundlib.h>

/***
创建alsa pcm handle去连接设备
@param handle: 返回创建的PCM handle
@param name: 设备名称,ASCII编码
@param stream: 标明采集或者播放(SND_PCM_STREAM_CAPTURE, SND_PCM_STREAM_PLAYBACK)
@param mode: 打开模式(see SND_PCM_NONBLOCK, SND_PCM_ASYNC)
@return: 0表示成功,小于0表示错误
*/
int snd_pcm_open( snd_pcm_t **handle, const char* name, int stream, int mode ); /***
读取音频帧
@param handle: PCM handle
@param buffer: frames containing buffer
@param size: frames to be read
@return: 实际读取的音频帧个数,小于0表示错误
*/
ssize_t snd_pcm_readi( snd_pcm_t *handle, void *buffer, size_t size ); /***
关闭
@param handle: PCM handle
@return: 实际读取的音频帧个数,小于0表示错误
*/
int snd_pcm_close( snd_pcm_t *handle ); /***
准备使用PCM
@param handle: PCM handle
@return: 实际读取的音频帧个数,小于0表示错误
*/
int snd_pcm_prepare( snd_pcm_t *handle );

接口简单,参数也少,所以使用起来很方便,基本上是linux下采集和播放的第一选择,下面写个简单的例子演示下如何调用

  1. 打开音频设备并设置参数
SIMPLE_LOG("try open %s\n", device_name_.c_str());

int ret = snd_pcm_open(&alsa_pcm_, device_name_.c_str(), SND_PCM_STREAM_CAPTURE, SND_PCM_NONBLOCK);
if (!alsa_pcm_ || ret < 0)
{
SIMPLE_LOG("open %s failed, ret: %d\n", device_name_.c_str(), ret); return false;
} snd_pcm_hw_params_t* params; snd_pcm_hw_params_alloca (&params);
snd_pcm_hw_params_any (alsa_pcm_, params);
snd_pcm_hw_params_set_access (alsa_pcm_, params,
SND_PCM_ACCESS_RW_INTERLEAVED); snd_pcm_format_t format;
switch (bits_per_sam_) {
case 8:
format = SND_PCM_FORMAT_S8;
break;
case 16:
format = SND_PCM_FORMAT_S16_LE;
break;
case 24:
format = SND_PCM_FORMAT_S24_LE;
break;
case 32:
format = SND_PCM_FORMAT_S32_LE;
break;
default:
format = SND_PCM_FORMAT_S16_LE;
break;
}
snd_pcm_hw_params_set_format (alsa_pcm_, params, format); snd_pcm_hw_params_set_channels (alsa_pcm_, params, channel_count_); unsigned int rate = sample_rate_;
snd_pcm_hw_params_set_rate_near (alsa_pcm_, params, &rate, NULL); sample_size_ = channel_count_ * (bits_per_sam_/8); /* Activate the parameters */
ret = snd_pcm_hw_params (alsa_pcm_, params);
if (ret < 0)
{
SIMPLE_LOG("set param failed, ret: %d\n", ret); snd_pcm_close (alsa_pcm_);
alsa_pcm_ = NULL;
return false;
}
  1. 读取音频数据
bool AlsaCapture::ReadData()
{
int read_size = 0;
snd_pcm_uframes_t need_frames = real_sample_count_;
for (;;)
{
if (read_size >= pcm_buf_.size())
{
break;
} int ret = 0;
while (true)
{
char* read_buf = &pcm_buf_[0] + read_size;
ret = snd_pcm_readi(alsa_pcm_, read_buf, need_frames);
if (ret >= 0)
{
break;
} if (ret == -EAGAIN)
{
SIMPLE_LOG("snd_pcm_readi EAGAIN\n");
return false;
} if (AlsaXRunRecover(alsa_pcm_, ret) < 0)
{
SIMPLE_LOG("ALSA read error: %s\n", snd_strerror(ret));
return false;
}
} read_size += ret * sample_size_;
need_frames -= ret;
}
return true;
}

这样就可以完成音频数据的采集,需要注意的是,在第二步读取数据之前,需要先调用snd_pcm_prepare,否则是无法驱动数据采集正常进行的。

在国产化芯片平台上出现的问题

在普通Linux下,这样写下来,就可以实现想要的音频采集功能了,后面对数据做进一步的规整和编码就可以发送了。但是在某个国产芯片平台的银河麒麟系统下,我却遇到了一个问题,那就是打开设备的函数调用以及所有的参数设置都是成功的,但是数据采集却总是异常,要么返回无意义噪声数据,要么read接口干脆就报EAGAIN错误。

刚开始我以为是ALSA默认设备的问题,因为出问题的国产化芯片平台,有两个声卡,其中一个是可以正常使用的,另一个是无效声卡。这些信息可以通过使用命令行来查看,例如:

查看声卡:

cat /proc/asound/cards

查看采集设备:

sudo arecord -l

查看播放设备:

cat aplay -l

于是我尝试通过系统配置的方式,来设置默认声卡,这里推荐一个工具“alsamixer”,是一个字符化界面的ALSA配置工具,可以通过如下命令安装:

sudo apt-get install alsa-utils

启动后就是一个这样的界面

然而,修改以后,发现默认设备的修改,并不能影响到alsa采集的结果。于是通过罗列所有录音设备,并且指定设备名称,但是仍然出现同样的结果。在多次尝试无果以后,最终只能放弃使用ALSA来进行音频设备的数据采集,而采用复杂一些的PulseAudio框架。最后的结果也证明,更加上层的PulseAudio还是正确的处理了有效的音频设备和无效音频设备,并正确返回了麦克风/桌面系统声音。具体过程我下一篇再写。

合作请加QQ或微信hbstream。(转载请注明作者和出处)


Linux音频采集和在国产化平台中遇到的坑(一)的更多相关文章

  1. 驳Linux不娱乐 堪比Win平台中十款播放器

    播放器在我们日常生活中扮演着非常重要的角色,在Windows操作系统中,播放器被应用的非常广泛,不但我们可以听音乐,甚至还可以听广播,制作铃声,下载音乐等等.而在Linux发行版中,缺少娱乐性一直性W ...

  2. iOS音频采集过程中的音效实现

    1.背景 在移动直播中, 声音是主播和观众互动的重要途径之一, 为了丰富直播的内容,大家都会想要在声音上做一些文章, 在采集录音的基础上玩一些花样. 比如演唱类的直播间中, 主播伴随着背景音乐演唱. ...

  3. (四)WebRTC手记之本地音频采集

    转自:http://www.cnblogs.com/fangkm/p/4374668.html 上一篇博文介绍了本地视频采集,这一篇就介绍下音频采集流程,也是先介绍WebRTC原生的音频采集,再介绍C ...

  4. WebRTC手记之本地音频采集

    转载请注明出处:http://www.cnblogs.com/fangkm/p/4374668.html 上一篇博文介绍了本地视频采集,这一篇就介绍下音频采集流程,也是先介绍WebRTC原生的音频采集 ...

  5. DirectShow音频采集声音不连续问题分析与解决办法经验总结

    最近广州大雨不断,并且多数无前兆,突然就来场大雨,给同学们降降温,说来本也是好事,但有时候下的真不是时候,最近这段时间都是即将下班了,大雨就来了,昨晚快下班前又出现了大雨,北方人总爱忘带雨伞,这不就被 ...

  6. Linux音频编程指南

    Linux音频编程指南 虽然目前Linux的优势主要体现在网络服务方面,但事实上同样也有着非常丰富的媒体功能,本文就是以多媒体应用中最基本的声音为对象,介绍如何在Linux平台下开发实际的音频应用程序 ...

  7. Linux音频驱动学习之:(1)ASOC分析

    一.音频架构概述 (1)ALSA是Advanced Linux Sound Architecture 的缩写,目前已经成为了linux的主流音频体系结构,想了解更多的关于ALSA的这一开源项目的信息和 ...

  8. Linux音频编程指南(转)

    转自: http://www.ibm.com/developerworks/cn/linux/l-audio/ Linux音频编程指南 虽然目前Linux的优势主要体现在网络服务方面,但事实上同样也有 ...

  9. Linux音频编程

    1. 背景 在<Jasper语音助理介绍>中, 介绍了Linux音频系统, 本文主要介绍了Linux下音频编程相关内容. 音频编程主要包括播放(Playback)和录制(Record), ...

  10. EasyPlayerPro Windows播放器进行本地对讲喊话音频采集功能实现

    需求 在安防行业应用中,除了在本地看到摄像机的视频和进行音频监听外,还有一个重要的功能,那就是对讲. EasyPlayerPro-win为了减轻二次开发者的工作量,将本地音频采集也进行了集成: 功能特 ...

随机推荐

  1. IO模型及高性能网络架构分析

    前言 操作系统一次IO调用过程 应用程序发起的一次IO操作包含两个阶段: IO调用:应用程序进程向操作系统内核发起调用. IO执行:操作系统内核完成IO操作. 操作系统内核完成IO操作还包括两个过程: ...

  2. Codeforces Round #830 (Div. 2)D2. Balance (Hard version)(数据结构)

    题目链接 题目大意 维护一个集合的mex,每次有三种操作: '+' x:将数 x 插入集合中 '-' x:将数 x 移除集合 '?' k:询问满足mex的数是k的倍数 既集合中未出现的数中最小的数可以 ...

  3. JS数据结构与算法-数组结构

    数组结构 几乎所有的编程语言都原生支持数组类型,因为数组是最简单的内存数据结构. 数组通常情况下用于存储一系列同一种数据类型的值. 但在JavaScript里,也可以在数组中保存不同类型的值. 但我们 ...

  4. 不借助idea开发工具构建一个Javaweb项目

    不借助idea开发工具构建一个Javaweb项目 目录结构 webappsroot |----------WEB-INF |----------classes(存放字节码) |----------li ...

  5. TCN代码详解-Torch (误导纠正)

    TCN代码详解-Torch (误导纠正) 1. 绪论 TCN网络由Shaojie Bai, J. Zico Kolter, Vladlen Koltun 三人于2018提出.对于序列预测而言,通常考虑 ...

  6. NET 6 实现滑动验证码(一)、创建工程

    目录 实现滑动验证码的目的 创建.NET 6工程 实现滑动验证码的目的 传统验证码实现起来比较简单,但在OCR技术越来越成熟的情况下,验证码的破解难度越来越低,但如果将验证码难度加高(各种干扰背景,扭 ...

  7. Python-OpenCV的安装及学习资料

    Conda环境安装 OpenCV pip install opencv-python opencv-contrib-python -i https://mirrors.aliyun.com/pypi/ ...

  8. Spring之SpringContext

    一.概述 1.Spring Context概念 创建上下文并将BeanPostProcessor加载到spring 2.Spring Application Context概念 Spring通过应用上 ...

  9. node学习01

    1.前言 Node.js 是一个开源和跨平台的 JavaScript 运行时环境 Node.js 在浏览器之外运行 V8 JavaScript 引擎(Google Chrome 的内核). 这使得 N ...

  10. 教你用JavaScript完成轮播图

    案例介绍 欢迎来到我的小院,我是霍大侠,恭喜你今天又要进步一点点了!我们来用JavaScript编程实战案例,做一个轮播图.图片每3秒自动轮换,也可以点击左右按键轮播图片,当图片到达最左端或最右端时, ...