整理AI性能指标
整理AI性能指标
Sorting out AI performance metrics
推理性能的最佳衡量标准是什么?
在人工智能加速器的世界里,对于给定的算法,芯片的性能经常以每秒万亿次的运算量(TOPS)来表示。但有许多原因说明,这可能不是最好的数据。
“客户真正想要的是每美元的高吞吐量,”人工智能加速器公司FlexLogix的首席执行官GeoffTate说。
Tate解释说,拥有更多的tops并不一定与更高的吞吐量相关。在batch size批量大小为1的边缘应用程序中尤其如此。数据中心之类的应用程序可以通过使用较大的批处理并行处理多个输入来提高其吞吐量(因为有备用的顶部),但这通常不适合边缘设备。
例如,Tate将Flex Logix’ InferX X1设备与市场领先的GPU设备进行了比较。虽然GPU提供了3到4倍的吞吐量,最高10倍,但使用的dram数量是8倍。Tate认为这使得flexlogix的架构更具资源效率。
Tate提出的每美元吞吐量指标听起来很合理,但实际上,要找到可靠的产品成本信息来进行直接比较并不容易。诸如需要多少DRAM,或者某个芯片有多少硅面积等因素可以作为成本的指标,可惜不是精确的。
Flex Logix的InfereX X1设备将于2019年年底前投产。将提供大约8.5个top。
ResNet-50公司
TOPS作为度量标准的另一个问题是,通常在运行ResNet-50时进行度量。
Tate说:“ResNet-50不是客户关心的基准,但是人报告最多的一个。“不太相关的原因是使用了非常小的图像。”
如今,ResNet-50在很大程度上被视为过时,已经存在了一段时间,已经成为引用顶级数据的事实标准。有充分的理由继续使用作为一个标准;其中包括努力保持所有分数至少在一定程度上具有可比性,以及使这一事实上的标准对所有类型的设备(即使是很小的设备)都可用。然而,不足以真正挑战当今为数据中心推理而构建的巨大芯片,也不足以炫耀能力。
行业基准
除了事实上的标准,当然还有各种各样的组织在为人工智能加速器开发基准(参见:MLPerf、DawnBench、EEMBC等)。
虽然MLPerf已经发布了推断结果,但Tate认为这个基准过于面向数据中心。在这个场景中,认为在第90个时间段,一个设备的延迟是一个性能指标。
“在边缘,我认为顾客不想知道第90个百分位,想知道第100个百分位。想知道:能保证我什么?Tate说,将自动驾驶作为一种边缘应用,在这种应用中延迟非常关键。
在更复杂的图像处理任务(如目标检测)上的性能更适合于比较当今高端的人工智能加速器
当信息在多个处理器内核和内存之间传输时,长尾延迟对于那些遭受总线争用的系统来说是一个典型的问题。虽然现在的许多设备使用高带宽内存接口,但在可能发生争用的情况下,理论上仍然存在延迟。
flexlogix基于FPGA的推理处理器设计每次都有完全相同的延迟(Groq也声称这一点,尽管坚称自己的设备不是FPGA)。
“由于我使用的是我的共同创始人在核心发明的FPGA互连,因此从内存到乘法累加器,到激活逻辑,再到内存,都有一条完全专用的路径。所以没有争议:事情就是这样。Tate说:“我的利用率不是百分之百,但我的利用率比其所有体系结构都要高得多。”。
市场
对于这一领域芯片初创公司数量的激增,泰特对FlexLogix的前景持乐观态度。
“当芯片投入使用,软件运行,展示演示,当看到价格和力量……很快,那些不在上四分之一的公司就会消失。”。
泰特的预测是,根据不同的细分市场(训练、推理、数据中心、edge、超低功耗等),这一领域可以支持10或15种芯片产品。今天提供的产品在计算能力方面跨越了多个数量级,因此并不都是直接相互竞争的。
泰特提到沃伦•巴菲特的名言:“在未来的一两年里,将有一场大规模的牛群淘汰,当潮水退去时,可以看到谁在裸泳。”
整理AI性能指标的更多相关文章
- 最近整理AI相关感想
前言 目前笔者致力于 在AI 开发研究,四大平台里,百度AI 提供 的开发者资料是最全,开发的友好度也是最高的,很多都已经集成在SDK中,支持许多语言体系. 其实 作为公司层面的考虑,针对技术的研究出 ...
- 带你从0到1开发AI图像分类应用
摘要:通过一个垃圾分类应用的开发示例,介绍AI Gallery在AI应用开发流程中的作用. 本文分享自华为云社区<AI Gallery:从0到1开发AI图像分类应用>,作者: yd_269 ...
- 2.5星|《AI进化论》:疑似基于PPT与公关稿整理汇编而成
AI进化论·解码人工智能商业场景与案例 全书是目前AI在一些热门领域的应用的介绍,包括各行业内AI可以实现的功能.现有相关公司的具体业务等.对各公司的介绍仅限于能实现什么业务,具体做的怎么样,有什么优 ...
- AI 玩法整理
随着信息技术的火热发展,人工智能已经成为IT全行业的风口爆发点,既然风口来了,作为技术人人员也都毫不犹豫的分一杯羹,怎么玩呢? 接下来的博客就会带领大家一起玩玩AI 认识AI--略,如果有需要的可以再 ...
- ps和AI使用过程中的易错点整理
ps:1.视图工具:1)标尺2)参考线3)网格:视图-->--显示>-->网格4)修改网格:编辑-->首选项>-->参考线.网格和切片 5)放大工具:画布中单击可放 ...
- 【总结整理】AI产品经理大会2017(转载)
从企业大数据到企业 AI | 易观智慧院院长 李智 1.AI 不是目的,而是要了解 AI 是什么,真正意义上的强人工智能在前沿领域尚未取得突破,暂时只能在影视文学作品中去思考人机关系.机器人三定律在未 ...
- 5G和AI会碰撞出什么样的火花呢?
本文学习和分享一篇综述文章,这篇文章是东南大学移动通信国家重点实验室主任.长江学者特聘教授尤肖虎教授2019年发表在<中国科学 信息科学>(<SCIENCE CHINA Inform ...
- 马里奥AI实现方式探索 ——神经网络+增强学习
[TOC] 马里奥AI实现方式探索 --神经网络+增强学习 儿时我们都曾有过一个经典游戏的体验,就是马里奥(顶蘑菇^v^),这次里约奥运会闭幕式,日本作为2020年东京奥运会的东道主,安倍最后也已经典 ...
- 五子棋AI清月连珠开源
经过差不多两年的业余时间学习和编写,最近把清月连珠的无禁手部分完善得差不多了.这中间进行了很多思考,也有很多错误认识,到现在有一些东西还没有全面掌握,所以想通过开源于大家共同交流. 最近一直发表一些五 ...
随机推荐
- 手动脱PeCompact 2.20壳实战
作者:Fly2015 PeCompact壳又是一个没有听说过的壳,需要脱壳的程序是吾爱破解培训的第一课的选修作业四.最近对脱壳有点上瘾了,当然也遭受了脱壳受挫的无奈,但是比较幸运还是把这个壳给搞了. ...
- cf534D 枚举握手次数
题意: 有n个学生进教室,先后顺序不同,每个人进去后会和当前在教室里的人握手,并且记录人数,而且当教室里有超过三个人的时候 他们有可能组队去参加比赛,后来的人看不到他们. 思路: ...
- POJ2709 染料贪心
题意: 要搭配出来n种颜料,每种颜料要用mi升,除了这n种颜色还有一个合成灰色的毫升数,灰色是由三种不同的颜色合成的,三种m m m 的不同颜色能合成m升灰色,然后问你满足要求至少要多少盒 ...
- JSONP跨域资源共享的安全问题
目录 关于 JSONP 一.JSON 劫持 二.Callback 可定义导致的安全问题 三.其他文件格式( Content-Type )与 JSON 四.防御 摘自:http://blog.known ...
- Andrew Ng机器学习算法入门(四):阶梯下降算法
梯度降级算法简介 之前如果需要求出最佳的线性回归模型,就需要求出代价函数的最小值.在上一篇文章中,求解的问题比较简单,只有一个简单的参数.梯度降级算法就可以用来求出代价函数最小值. 梯度降级算法的在维 ...
- Windows反调试技术(上)
写在前面 在逆向工程中为了防止破解者调试软件,通常都会在软件中采用一些反调试技术来防破解.下面就是一些在逆向工程中常见的反调试技巧与示例. BeingDebuged 利用调试器加载程序时调试器会通过C ...
- 运行程序显示丢失“MSVCR100D.dll”
前言 写了一个Dll注入工具,结果发现程序在其他机器上会出现丢失"MSVCR100D.dll".这个dll是vs2010自带的动态链接库,如果在没安装vs2010运行库的电脑中使用 ...
- Educational Codeforces Round 101 (Rated for Div. 2)
A. Regular Bracket Sequence 题意:题目中给(和)还有?,其中?可以转换成为()中的任何一个,并且所给样例中只出现一次(),问能不能括号匹配 思路:直接看第一个和最后一个能不 ...
- 浅谈Java的诞生和现状
昨天在旅途中登录一下很久没用的boss直聘,看看行情,一天的时间,已经有20+家公司给我发出了面试邀请,先跟大家谈谈Java的诞生和现状. 传说,在二十世纪90年代,一个叫Sun的公司,成立了一个项目 ...
- 我写了一个简单的JSON序列化和反序列化的工具
背景 互联网上有许多可用的Json序列化和反序列化的工具,例如fastjson,jackson,Gson等等,那么,我为什么还要自己写一个? 项目不方便依赖其他第三方库.比如有时候我们编写SDK,考虑 ...