作者:微软亚洲研究院资深项目经理 吴国斌

2015年7月19日,第十九届RoboCup机器人世界杯足球赛,在中国合肥隆重开幕。来自全球七十六个国家和地区的一百余支代表队参加了决赛,他们优秀的作品给观众带来了一场视觉盛宴,其中中国各代表队选手收获颇丰。

赛前,大赛组委会向微软发出邀请,希望我们能够在大会上向大家展示新一代Kinect在机器人方面的应用。我与微软核心合作伙伴——Kinect技术专业团队北京传翼四方公司的同事应邀参会。在为期一周的比赛和峰会、论坛、演讲等活动中,大家最强烈的感受是这不仅是一场世界机器人间的比赛,还是一场Kinect技术应用展示会,更像是一场各种操作系统和视觉类传感器的较量与角逐。

新一代Kinect,新一代应用

机器人学术演讲是我们此次参会的工作重点。在会上,我首先介绍了微软在自然用户界面所做的贡献,然后就新一代Kinect的基本性能与大家做了分享,并介绍了Kinect体感技术在零售、医疗保健、制造业和教育等领域潜在的商业价值及广阔的应用前景。

微软研究院近年来持续地在新一代自然用户界面领域进行探索,通过技术的进步来促进人与机器之间的交流方式,使其更加的自然和便捷。Kinect就是其中一个很好的范例。如果你体验过Xbox,那你一定知道Kinect与Xbox的结合让Xbox变成了一台体感游戏机,你的身体就是遥控器。在这一领域里,微软研究院的研究员围绕身份跟踪,头像跟踪,人脸面部表情跟踪,姿态控制和数字化等技术开展了深入的研究。例如,Kinect利用人脸、衣服和体型三项特征进行综合的识别以实现身份跟踪。通过身份跟踪技术进而可以无缝地跟踪和成功地识别游戏中某个人的身份,以保证用户界面的顺畅和自然。

第二代Kinect的性能在各方面都有了很大的提升:深度传感方面,通过深度保真提升实现3D视觉的效果并提高骨骼追踪的鲁棒性。RGB图像方面,分辨率和色彩识别度也都更加精准。此外,第二代Kinect的摄像头使用了更宽广的视野,可以追踪6个人的骨骼信息,骨骼点也从20个关节增加为25个关节。

Kinect只是下一代自然用户界面的一个缩影,借助新型的传感器、更强大的计算能力以及大数据和机器学习,可以预见未来自然用户界面领域将从PC+GUI发展成为CLOUD+NUI。

​而传翼四方的合作伙伴则将实体机器人、Kinect传感器和电脑带到了现场,通过自主研发的使用新一代Kinect控制的机器人实物向观众展示了新一代Kinect在机器人领域的综合应用实例,包括语音控制,肢体动作控制等多种控制方法,以及在场景重建和自主导航等技术中的应用。

展示的机器人通过Kinect采集的数据,可以完全跟随人类动作,如摇头、伸展双臂、抬腿等。同时,传翼四方正在与“最强大脑”节目中的迷宫行者鲍云合作,计划使用该机器人和被誉为“拥有爱因斯坦一样大脑”的鲍云进行“蜂巢迷宫”人机挑战。对此,与会者反响十分强烈,期盼着早日观看这场“人机大战”。并对新一代Kinect的应用前景和Kinect未来发展方向充满了期待。

Kinect机器人——球场之“镇海法宝”

本届大赛包括仿真机器人足球赛,服务型机器人赛,工业机器人赛以及救援机器人赛等,其中足球机器人和服务型机器人对于Kinect的应用最为广泛。而作为大赛主题赛事之一以及最吸引眼球的赛事,机器人足球赛备受关注。

足球机器人根据技术特点、球员造型等差异分为小型组、中型组、类人组、标准平台组和仿真组等。其中,中型机器人拥有完美的控球、带球转身、带球过“人”等技术,能够快速、灵活的移动,精确掌握射门角度和力度,且完全仿真的进行抽射、挑射、短传、长传……因此是所有足球机器人当中唯一可以与真人选手进行平等对战的机器人。

而在本届参加中型组比赛的12支球队中,Kinect设备因具有众多特有优势被其中的9支参赛团队应用于守门员机器人身上。最终获得冠军团队的北京信息科技大学队利用Kinect的深度数据实现了对快速物体运动轨迹的捕捉以及针对其落点的计算,使守门机器人能够准确、快速地拦截足球。该团队核心技术人员说到:“我们从2011年开始尝试应用第一代Kinect传感器作为机器人守门员的“眼睛”。几年间也尝试了十多种其他种类传感器,最终选择了最新一代的Kinect传感器,因为它对物体的识别不仅范围更广,而且准确度更高,同时性价比也最高。”

Kinect机器人——家务拯救者

赛场气氛安静、紧张的家庭服务型机器人组比赛则要求机器人能够在随机给定的家庭场景中,听从用户语音指令,完成相关行为,如拿到桌上的易拉罐饮料,水果等。而家庭服务型机器人最重要的构件就是视觉类传感器,因为他们的基本功能如自主导航、场景重建、人物跟踪、物体识别等都是基于视觉类传感器完成的。据观察统计,参加家庭服务型机器人比赛的17支队伍中,有近70%的队伍使用了Kinect传感器。其中中国科学技术大学的可佳机器人再续以往辉煌战绩,获得了优异成绩。据了解,可佳机器人从Kinect发布至今一直在使用,技术团队觉得Kinect最大的好处就是Kinect高度的集成性能够满足他们所有的数据需求,如语音、深度、红外灯等,而且性能稳定、使用方便。

本届赛事历时5天,中国代表队选手成绩不俗,在以高校团队为代表的专业组和青少年组的比赛中夺得4枚金牌和多枚奖牌。可以说,校园将是机器人事业的沃土。机器人为人类服务的成果,将在校园中生根发芽,开花结果。而我们希望微软包括Kinect在内的更多技术,能为大学生们插上灵感的翅膀,创造出更多让人欣喜的结果。

推荐阅读

漫谈2014年人机交互(CHI)大会

用Kinect为听障人士架一座沟通的桥梁

欢迎关注

微软亚洲研究院官方网站:http://www.msra.cn

微软亚洲研究院人人网主页:http://page.renren.com/600674137

微软亚洲研究院微博:http://t.sina.com.cn/msra

微软亚洲研究院微信:搜索“微软研究院“或扫描下方二维码:

探索Kinect的更多可能——亲历第十九届机器人世界杯RoboCup的更多相关文章

  1. 【C语言探索之旅】 第一部分第十课:练习题+习作

    内容简介 1.课程大纲 2.第一部分第十课: 练习题+习作 3.第二部分第一课预告: 模块化编程 课程大纲 我们的课程分为四大部分,每一个部分结束后都会有练习题,并会公布答案.还会带大家用C语言编写三 ...

  2. Kinect for Windows SDK开发入门(十九):Kinect Fusion

        Kinect for Windows SDK1.7中引入了Kinect Fusion功能.在1.8的SDK中对该功能进行了改进和强化,Kinect Fusion能够使得我们使用Kinect f ...

  3. [译]Kinect for Windows SDK开发入门(十八):Kinect Interaction交互控件

    本文译自 http://dotneteers.net/blogs/vbandi/archive/2013/03/25/kinect-interactions-with-wpf-part-i-getti ...

  4. 【C语言探索之旅】 第二部分第十课:练习题和习作

    内容简介 1.课程大纲 2.第二部分第十一课:  练习题和习作 3.第三部分第一课预告:  安装SDL 课程大纲 我们的课程分为四大部分,每一个部分结束后都会有练习题,并会公布答案.还会带大家用C语言 ...

  5. 第五十九届冠军(使用C++设计一个类不能被继承)

    称号:使用C++设计一个类不能被继承. 分析:这是Adobe 公司2007 的笔试题最新校园招聘. 应聘者的C++基本功底外,还能考察反应能力,是一道非常好的题目. 分析:C++中父类的构造函数会调用 ...

  6. NAO机器人

    NAO机器人是Aldebaran Robotics公司研制的一款人工智能机器人.它拥有着讨人喜欢的外形,并具备有一定程度的人工智能和约一定程度的情感智商并能够和人亲切的互动. 教学研究类/NAO机器人 ...

  7. Kinect for Windows SDK开发入门(15):进阶指引 下

    Kinect for Windows SDK开发入门(十五):进阶指引 下 上一篇文章介绍了Kinect for Windows SDK进阶开发需要了解的一些内容,包括影像处理Coding4Fun K ...

  8. 机器人研发十大热门编程语言:不死 Java、不朽 C/C ++、新贵 Python

    流水的编程语言,铁打的 Java.C/C++. 进行人工智能机器人研发,应该选择哪种编程语言? 这是很多机器人专家在自身的职业生涯中都会存在的一个入门级思考.毕竟,在学习一门编程语言时,需要花费大量的 ...

  9. 10 Future Web Trends 十大未来互联网趋势

    转载自:http://blog.sina.com.cn/s/blog_4be577310100ajpb.html 我们很满意自己进入的当前网络纪元,通常被称为Web 2.0.这个阶段互联网的特征包括搜 ...

随机推荐

  1. 01.Java安装及环境变量的设置

    1.下载 https://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html 2.mac上安装及配 ...

  2. Unicode的认识

    Unicode(统一码.万国码.单一码),它是为解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制码,以满足跨语言跨平台进行文本转换.处理的要求.1990年开始研 ...

  3. JKFZ%你赛炸裂祭

    Md爆40了身败名裂 上来就刚T1是什么习惯?居然不看T2导致明明能刚出正解却止步40 , T3找到原题看懂题解后却不敢交+难码 , 最近怕不是做毒瘤%你赛多了总以为T1能刚到点分 md最近怕不是炸了 ...

  4. BTree

    hash.平衡二叉树.BTree.B+tree的区别 https://blog.csdn.net/qq_40673786/article/details/90082444 联合索引在B+树上的结构介绍 ...

  5. 发布订阅--DBMS "无法作为数据库主体执行,因为主体“dbo”不存在、无法模拟这种..........”

    解决方案: 新附加的数据库需要设置所有者才能建立数据库关系图.供参考的操作步骤如下: 选择“AdventureWorks2012LT”,右键,选择“属性”,选择“文件”页,点击“所有者”右侧按钮,点击 ...

  6. DocCms_2016 代码审计

    0x00 结构浏览 按照代码审计的惯例,拿到这款cms之后首先浏览了一下目录结构,在基本了解之后,首先进入/index.php,这里包含了两个文件:/admini/config/qd-config.p ...

  7. 56)PHP,模型类的设计思想

    一张表对应一个模型类-----Mode

  8. ununtu 16.04 下的 VsCode 下载与安装

    Vscode发现用包下载显示找不到网页,于是只有继续折腾. 折腾如下: ubuntu-desktop You can update your system with unsupported packa ...

  9. scala编程(八)——函数和闭包

    当程序变得庞大时,你需要一些方法把它们分割成更小的,更易管理的片段.为了分割控制流,Scala 提供了所有有经验的程序员都熟悉的方式:把代码分割成函数.实际上,Scala 提供了许多 Java 中没有 ...

  10. 对数据集进行最优分箱和WOE转换

    对数据集分箱的方式三种,等宽等频最优,下面介绍对数据集进行最优分箱,分箱的其他介绍可以查看其他的博文,具体在这就不细说了: 大体步骤: 加载数据: 遍历所有的feature, 分别处理离散和连续特征: ...