IBM研究人员开发了一对低功耗,高性能的计算机视觉系统
机器学习算法近年来有了突飞猛进的发展。例如,像Facebook这样的最先进的系统,可以在一小时内训练图像分类算法,而不会牺牲准确性。但是,许多这些系统都是在具有强大GPU的高端机器上进行培训的,随着物联网产业向边缘计算发展,对低功耗低成本人工智能(AI)模型的需求不断增长。
IBM的有前景的研究奠定了更高效算法的基础。在本周召开的2018年计算机视觉和模式识别会议上,来自该公司研究的科学家将发表两篇关于图像分类的论文。
BlockDrop
第一个标题为“BlockDrop:残留网络中的动态干扰路径”,建立在2015年发布的微软工作外:剩余网络。残留网络(简称ResNets)引入神经网络中各层之间的身份连接,使他们能够在训练过程中学习增量或残差表示。
IBM将这一想法向前推进了一步。科学家们引入了一个轻型次级神经网络,在论文中称为“策略网络”,在预训练ResNet中动态地丢弃残余块。为了确保性能收益不以精确为代价,策略网络接受了使用最少数量的块并保持识别准确性的培训。
IBM的研究经理在接受电话采访时表示:”一般来说,如果向模型添加更多图层,您可以提高其准确性,但是会增加计算成本”。今天大多数模型的一个问题是你有一个适用于所有图像相同的计算适用所有网络。我们的系统更有效地分配资源并准确地识别图像。
BlockDrop将图像分类的平均速度提高了20%,在某些情况下高达36%,同时保持76.4%的准确性,与实验的控制相同。
改善立体视觉
IBM研究人员本周发表的第二篇论文“低功耗,高吞吐量,基于事件的立体声系统”解决了图像处理中的另一个问题:立体视觉问题。
正如IBM的研究人员所解释的那样,人类的眼睛彼此相距几厘米,从略微不同的角度看世界。大脑的视觉皮层将它们的图像无缝融合为一体,使我们能够感知深度,但是双摄像机器人系统在调节视差方面有更艰难的时间。在计算机视觉的情况下,相机镜头有异常,这会导致噪音并使问题复杂化。
研究人员的解决方案:运行在IBMTrueNorth神经形态芯片上的系统,该系统具有针对机器学习模型进行了优化的高度并行化架构。使用九个处理器的集群,一对基于事件的摄像头(当它们检测到运动时只拍摄图像的摄像头)以及一台将计算分配给上述芯片的笔记本电脑,算法捕获并处理400(最多达2,000)每秒差异图。
基于事件的摄像机的使用大大减少了带宽和能源消耗。“立体声算法已经存在了30多年,但大多数这些系统......都采用积极的方法来感知世界。我们使用被动方法。“
总体而言,与具有高帧速率照相机的最先进系统相比,该系统在每个视差图的每像素功率方面表现出200倍的提高。(黑客周刊)
IBM研究人员开发了一对低功耗,高性能的计算机视觉系统的更多相关文章
- [转]BSD系统正在死亡?一些安全研究人员这样认为
摘要:在代码安全上被关注太少,漏洞没有被报告修补,FreeBSD.OpenBSD和NetBSD还能活下来吗? 在德国莱比齐的34c3网站上,IOActive的渗透测试主管Ilja von Sprund ...
- 科学效法自然:微软研究人员测试AI控制的滑翔机
编者按:正如一颗苹果砸出了万有引力,自然界所有存在的事物和现象都有其科学合理的一面,小小的鸟儿也能够给科学带来丰富的灵感和启示. 最近,微软研究人员从自然出发,研究鸟类能够自由停留在空中的科学原理,并 ...
- Cortana携手微软学术搜索,变身研究人员最佳个人助理
编者按:在美国时间7月14日于微软总部雷蒙德召开的2014年微软教育峰会上,负责技术与研究的微软全球执行副总裁沈向洋博士在他的开幕主题演讲中正式宣布,Windows Phone 8.1系统中的虚拟个人 ...
- 【GS基础】植物基因组选择研究人员及数量遗传学发展一览
目录 1.GS研究 2.数量遗传发展 GS应用主要在国外大型动物和种企,国内仍以学术为主.近期整理相关学术文献,了解到一些相关研究人员,记录下备忘查询,但不可能全面. 1.GS研究 Theo Meuw ...
- Google研究人员宣布完成全球首例SHA-1哈希碰撞!
2004年的国际密码讨论年会(CRYPTO)尾声,我国密码学家王小云及其研究同事展示了MD5.SHA-0及其他相关杂凑函数的杂凑碰撞并给出了实例.时隔13年之后,来自Google的研究人员宣布完成第一 ...
- 现有各种SSTC电路图,欢迎补充,研究,开发
现有各种SSTC电路图,欢迎补充,研究,开发 496464505 2016-3-1 16:01:55 现在的各种SSTC基本都是这些图 2016-3-3 19:28:23 comter2001 ...
- 研究人员发现绝大部分酷派(Coolpad)手机暗藏后门(转)
隐私问题被曝光得越来越多,随着物联网的发展,只会变得越来越严重,不过从当前看来 ,国人对隐私的重视度还远没有国外,期待加强对隐私的保护策略. 转自:http://www.freebuf.com/n ...
- NGUI研究之开发项目的一些使用心得比較细节
不知不觉使用NGI插件已经有一段时间了.感觉NGUI真的是眼下Unity3D中最好用的UI插件. 可是它也有一些不是BUG的BUG,这些问题可能会让新人摸不着头脑,那么这篇文章将总结一下这段时间 ...
- Linux + .net core 开发升讯威在线客服系统:首个经过实际验证的高性能版本
业余时间用 .net core 写了一个在线客服系统.并在博客园写了一个系列的文章,写介绍这个开发过程: .net core 和 WPF 开发升讯威在线客服系统:目录 https://blog.she ...
随机推荐
- php中美元符号是什么意思
php中$符号是变量符号: 把$符号加上字符串,这个字符串就是一个变量名或对象名. 其实PHP采用的是C语言的语法,但是也有一些区别,$符号加上字符串,这就是一个变量名或对象名. 例如下面的代码:(推 ...
- 【CF1257E】The Contest【线段树】
题意:给定三个序列abc,问最少操作几次使得满足a<b<c 题解:将三个序列合并起来,设cnt[i][1/2/3]表示前i个数有几个是来自序列1/2/3的. 枚举第一个序列要到i,此时对于 ...
- Python_014(面向对象之继承)
一.面向对象之继承 1.初始继承 引入:面向对象的三大特性:继承,多态,封装 a.继承是创建新类的一种方式,在python中,新建的类可以继承一个或多个父类,父类又可称为基类或超类;新建的类称为派生类 ...
- MapServer教程
https://mapserver.org/ MapServer是一个开放源代码平台,用于将空间数据和交互式地图应用程序发布到Web.由OSGEO批准的MapServer项目指导委员会(PSC)负责管 ...
- shapefile文件数据结构
头部 点 线 面 序号 x,y,... 线 序号 1,2 面 序号 1,2,3 拓扑检查 ... <GIS数据结构与算法>
- C#用户自定义控件(含源代码)-透明文本框
using System; using System.Collections; using System.ComponentModel; using System.Drawing; using Sys ...
- BUUCTF |[0CTF 2016]piapiapia
步骤: nickname[]=wherewherewherewherewherewherewherewherewherewherewherewherewherewherewherewherewhere ...
- [CSP-S模拟测试]:神炎皇(数学)
题目描述 神炎皇乌利亚很喜欢数对,他想找到神奇的数对. 对于一个整数对$(a,b)$,若满足$a+b\leqslant n$且$a+b$是$ab$的因子,则称为神奇的数对.请问这样的数对共有多少呢? ...
- JS replace方法
var str = '1abc2defg3hijk'; str.replace(/\d/g,function(a,b,c,d){ console.log("a:",a);// 匹配 ...
- MySQL分组聚合group_concat + substr_index
场景:给予一张商品售卖表,表中数据为商品的售卖记录,假设表中数据是定时脚本插入的,每个时间段的商品售卖数量不同,根据此表找各个商品的最多售卖数量的数据. 1.数据表 CREATE TABLE `goo ...