Kinect v2,Microphone Array可以用来对于水平面音源方向的推测(AudioBeam)和语音识别(Speech Recognition)。这一节是介绍如何取得AudioBeam。
  上一节,介绍如何使用通过Kinect SDK v2预览版,从Kinect v2预览版的Color Camera和Depth 传感器中获取数据的方法。
 
  本节,将介绍从Kinect的Microphone Array中取得AudioBeam(水平面音源方向的推测)的方法。
Microphone Array
  在第一节中介绍过,Kinect除搭载了Color Camera,Depth传感器之外,还有Microphone Array。
 
  Microphone Array由4个Microphone构成,能进行水平面音源方向的推测(AudioBeam)和语音识别(Speech Recognition)等。
 
  这一节,将介绍取得AudioBeam的方法。
 

图1 Kinect v2预览版的Microphone Array
图2 Kinect SDK v2预览版的示例程序(AudioBasics)
示例程序
  用Kinect SDK v2取得AudioBeam,将结果显示在console上的示例程序。
 
  Audio的功能(AudioBeam,Speech Recognition)的数据取得流程,在「Sensor」~「Source」这一块与之前的Image(Color,Depth,BodyIndex,Body)的取得流程一样。不过在这之后还请注意Audio功能所特有的部分,这里主要是介绍与Image所同样的数据取得流程。
 
  这个示例程序的全部内容,在下面的github里全部公开了。
 
图3 Kinect SDK v2预览版的数据取得的流程(重发)
「Sensor」
取得「Sensor」
  1. // Sensor
  2. IKinectSensor* pSensor; // ……1
  3. HRESULT hResult = S_OK;
  4. hResult = GetDefaultKinectSensor &pSensor ); //……2
  5. if FAILED hResult ){
  6. std::cerr << "Error : GetDefaultKinectSensor" << std::endl;
  7. return -;
  8. }
  9. hResult = pSensor->Open(); //……3
  10. if FAILED hResult ){
  11. std::cerr << "Error : IKinectSensor::Open()" << std::endl;
  12. return -;
  13. }

列表1.1 相当于图1「Sensor」的部分(重发)

1 处理Kinect v2预览版的Sensor接口。
2 取得默认的Sensor。
3 打开Sensor。
 
「Source」
从「Sensor」取得「Source」。
  1. // Source
  2. IAudioSource* pAudioSource; //……1
  3. hResult = pSensor->get_AudioSource &pAudioSource ); //……2
  4. if FAILED hResult ){
  5. std::cerr << "Error : IKinectSensor::get_AudioSource()" << std::endl;
  6. return -;
  7. }

列表1.2 相当于图1「Source」的部分

1 Audio功能的Source接口。
2 从Sensor取得Source。
 
「AudioBeamList」~「OpenAudioBeam」
从「Source」取得「AudioBeamList」,从List里打开指定的「AudioBeam」。
  1. // Get Audio Beam List
  2. IAudioBeamList* pAudioBeamList; //……1
  3. hResult = pAudioSource->get_AudioBeams &pAudioBeamList ); //……2
  4. if FAILED hResult ){
  5. std::cerr << "Error : IAudioSource::get_AudioBeams()" << std::endl;
  6. return -;
  7. }
  8. // Open Audio Beam
  9. IAudioBeam* pAudioBeam; //……3
  10. hResult = pAudioBeamList->OpenAudioBeam &pAudioBeam ); //……4
  11. if FAILED hResult ){
  12. std::cerr << "Error : IAudioBeamList::OpenAudioBeam()" << std::endl;
  13. return -;
  14. }

列表1.3 取得Microphone Array和AudioBeam

1 AudioBeamList接口。
2 从Source取得AudioBeam,然后取得Microphone Array的List。
3 AudioBeam接口。
4 从List里取得AudioBeam,打开Microphone Array。
   0代表第一个被找到的默认的Microphone Array。
 
「Get Angle and Confidence」
从「Stream」读入Audio数据,取得音源方向和推测的信赖值。
  1. while ){
  2. // Get Angle and Confidence
  3. FLOAT angle = 0.0f;
  4. FLOAT confidence = 0.0f;
  5. pAudioBeam->get_BeamAngle &angle ); // radian [-0.872665f, 0.872665f] ……1
  6. pAudioBeam->get_BeamAngleConfidence &confidence ); // confidence [0.0f, 1.0f] ……2
  7. // Show Result
  8. // Convert from radian to degree : degree = radian * 180 / Pi
  9. if confidence > 0.5f ){
  10. std::system "cls" );
  11. std::cout << "Angle : " << angle * 180.0f / M_PI << ", Confidence : " << confidence << std::endl; //……3
  12. }
  13. // Input Key ( Exit ESC key )
  14. if GetKeyState VK_ESCAPE < ){
  15. break;
  16. }
  17. }

列表1.5 取得音源方向和推测的信赖值

1 取得音源方向。
   角度单位是radian(弧度)。
2 取得音源方向的推测信赖值。
   取值范围是0.0f~1.0f,数值越大表示可信度更高。
3 把radian(弧度)转为dgree(度数)在Console上输出。
   只显示当前的数值,如果注释掉「std::system("cls");」的话,那么之前的值也会留在Cconsole上。
 
  可以取得的音源方向是Kinect v2的中心正面向水平方向左右+/-50°的范围。 
 
图4 音源方向的检测范围+/-50°
  因为取得的音源方向的角度单位是「radian(弧度)」要利用公式1转换为「degree(度数)」。
【公式1 adian(弧度)转换为(度数)】
  • 弧度(radian)→角度(degree)∶ degree=radian×180÷π
  • 角度(degree)→弧度(radian)∶ radian=degree×π÷180
运行结果
  运行这个示例程序,就像图5一样,将显示出声音的音源角度(Angle)和推测的信赖值(Confidence)。
 
  如果Microphone Array的反应过度敏感或迟钝,可以通过调整操作系统的录音设备属性来改善(在[控制面板]-[声音]-[录制]的录音设备中的「麦克排列Xbox NUI Sensor」的属性里调整等级)。

图5 运行结果
在Console上显示了音源方向的角度和推测的信赖值。
 
总结
这一节是介绍如何使用Kinect SDK v2预览版取得AudioBeam。
 
与Kinect SDK v1相比,从Microphone Array取得Audio数据的处理更加简单。

【翻译】Kinect v2程序设计(C++-) AudioBeam篇的更多相关文章

  1. 【翻译】Kinect v2程序设计(C++) Body 篇

    Kinect SDK v2预览版的主要功能的使用介绍,基本上完成了.这次,是关于取得Body(人体姿势)方法的说明.   上一节,是使用Kinect SDK v2预览版从Kinect v2预览版取得B ...

  2. 【翻译】Kinect v2程序设计(C++) BodyIndex篇

    通过Kinect SDK v2预览版,取得BodyIndex(人体区域)的方法和示例代码. 上一节,介绍了从Kinect v2预览版用Kinect SDK v2预览版获取Depth数据的方法.   这 ...

  3. 【翻译】Kinect v2程序设计(C++) Color篇

    Kinect SDK v2预览版,获取数据的基本流程的说明.以及取得Color图像的示例程序的介绍. 上一节,是关于当前型号Kinect for Windows(后面称作Kinect v1)和次世代型 ...

  4. 【翻译】Kinect v2程序设计(C++) Depth编

    Kinect SDK v2预览版,取得Depth数据的方法说明. 上一节,介绍了通过使用Kinect for Windows SDK v2预览版(以下简称为,Kinect SDK v2预览版)从Kin ...

  5. 【翻译】Kinect v1和Kinect v2的彻底比较

      本连载主要是比较Kinect for Windows的现行版(v1)和次世代型的开发者预览版(v2),以C++开发者为背景介绍进化的硬件和软件.本文主要是对传感的配置和运行条件进行彻底的比较.   ...

  6. 【计算机视觉】深度相机(五)--Kinect v2.0

    原文:http://blog.csdn.NET/qq1175421841/article/details/50412994 ----微软Build2012大会:Kinect for Windows P ...

  7. Kinect v2.0 for windows开发环境说明

    官方文档里是这些: Supported Operating Systems and Architectures The following operating systems and architec ...

  8. Kinect v2(Microsoft Kinect for Windows v2 )配置移动电源解决方案

    Kinect v2配置移动电源解决方案 Kinect v2如果用于移动机器人上(也可以是其他应用场景),为方便有效地展开后续工作,为其配置移动电源是十分必要的. 一.选择移动电源 Kinect v2原 ...

  9. Ubuntu_ROS中应用kinect v2笔记

    Ubuntu_ROS中应用kinect v2笔记 个人觉得最重要的资料如下: 1. Microsoft Kinect v2 Driver Released http://www.ros.org/new ...

随机推荐

  1. Android实现高仿QQ附近的人搜索展示

    本文主要实现了高仿QQ附近的人搜索展示,用到了自定义控件的方法 最终效果如下 1.下面展示列表我们可以使用ViewPager来实现(当然如果你不觉得麻烦,你也可以用HorizontalScrollVi ...

  2. svn服务端hooks钩子可用于多项目自动同步

    废话不多说,直接上post-commit脚本了: 日志会全部记录下来包括同步的文件 vim post-commit #!/bin/sh REPOS="$1" # 仓库的路径 REV ...

  3. DRF如何序列化外键的字段

    我觉得在有些应用场景下,这个操作是有用的,因为可以减少一个AJAX的请求,以增加性能. 当然,是二次请求,还是一次传输.这即要考虑用户体验,还要兼顾服务器性能. 一切是有条件的平衡吧.就算是一次传输, ...

  4. C#(去、过滤)掉字符中的换行符

    本文介绍的方法需要先导入命名空间:usingSystem.Text.RegularExpressions; 字符串里所有的的换行符都去掉:textStr = Regex.Replace(textStr ...

  5. matlab练习程序(图像马赛克)

    处理原理就是将邻域像素平均值赋给邻域中的所有像素. 这里将处理方法分为了带线条和不带线条,带线条处理后的视觉效果要好些. 原图: 处理结果(不带线条): 处理结果(带线条): 代码处理的是带线条的情况 ...

  6. Codeforces Gym 100637A A. Nano alarm-clocks 前缀和处理

    A. Nano alarm-clocks Time Limit: 20 Sec Memory Limit: 256 MB 题目连接 http://codeforces.com/gym/100637/p ...

  7. Spring的类型转换器

    spring有2种类型转换器,一种是propertyEditor,一种是Converter. 第一种属性编辑器用法见Spring的属性编辑器的章节.如果2种转换器都适用,那么究竟会适用哪种呢?Spri ...

  8. ember.js:使用笔记10 常用方法

    init: controller中初始化方法,                               //注意该方法是在其他方法之前,所以取不出this,model等值: 跳转:this.tra ...

  9. HealthKit开发快速入门教程之HealthKit框架体系创建健康AppID

    HealthKit开发快速入门教程之HealthKit框架体系创建健康AppID HealthKit开发准备工作 在开发一款HealthKit应用程序时,首先需要讲解HealthKit中有哪些类,在i ...

  10. 【python游戏编程之旅】第二篇--pygame中的IO、数据

    本系列博客介绍以python+pygame库进行小游戏的开发.有写的不对之处还望各位海涵. 在上一篇中,我们介绍了pygame的入门操作http://www.cnblogs.com/msxh/p/49 ...