整理AI性能指标

Sorting out AI performance metrics

推理性能的最佳衡量标准是什么?

在人工智能加速器的世界里,对于给定的算法,芯片的性能经常以每秒万亿次的运算量(TOPS)来表示。但有许多原因说明,这可能不是最好的数据。

“客户真正想要的是每美元的高吞吐量,”人工智能加速器公司FlexLogix的首席执行官GeoffTate说。

Tate解释说,拥有更多的tops并不一定与更高的吞吐量相关。在batch size批量大小为1的边缘应用程序中尤其如此。数据中心之类的应用程序可以通过使用较大的批处理并行处理多个输入来提高其吞吐量(因为有备用的顶部),但这通常不适合边缘设备。

例如,Tate将Flex Logix’ InferX X1设备与市场领先的GPU设备进行了比较。虽然GPU提供了3到4倍的吞吐量,最高10倍,但使用的dram数量是8倍。Tate认为这使得flexlogix的架构更具资源效率。

Tate提出的每美元吞吐量指标听起来很合理,但实际上,要找到可靠的产品成本信息来进行直接比较并不容易。诸如需要多少DRAM,或者某个芯片有多少硅面积等因素可以作为成本的指标,可惜不是精确的。

Flex Logix的InfereX X1设备将于2019年年底前投产。将提供大约8.5个top。

ResNet-50公司

TOPS作为度量标准的另一个问题是,通常在运行ResNet-50时进行度量。

Tate说:“ResNet-50不是客户关心的基准,但是人报告最多的一个。“不太相关的原因是使用了非常小的图像。”

如今,ResNet-50在很大程度上被视为过时,已经存在了一段时间,已经成为引用顶级数据的事实标准。有充分的理由继续使用作为一个标准;其中包括努力保持所有分数至少在一定程度上具有可比性,以及使这一事实上的标准对所有类型的设备(即使是很小的设备)都可用。然而,不足以真正挑战当今为数据中心推理而构建的巨大芯片,也不足以炫耀能力。

行业基准

除了事实上的标准,当然还有各种各样的组织在为人工智能加速器开发基准(参见:MLPerf、DawnBench、EEMBC等)。

虽然MLPerf已经发布了推断结果,但Tate认为这个基准过于面向数据中心。在这个场景中,认为在第90个时间段,一个设备的延迟是一个性能指标。

“在边缘,我认为顾客不想知道第90个百分位,想知道第100个百分位。想知道:能保证我什么?Tate说,将自动驾驶作为一种边缘应用,在这种应用中延迟非常关键。

在更复杂的图像处理任务(如目标检测)上的性能更适合于比较当今高端的人工智能加速器

当信息在多个处理器内核和内存之间传输时,长尾延迟对于那些遭受总线争用的系统来说是一个典型的问题。虽然现在的许多设备使用高带宽内存接口,但在可能发生争用的情况下,理论上仍然存在延迟。

flexlogix基于FPGA的推理处理器设计每次都有完全相同的延迟(Groq也声称这一点,尽管坚称自己的设备不是FPGA)。

“由于我使用的是我的共同创始人在核心发明的FPGA互连,因此从内存到乘法累加器,到激活逻辑,再到内存,都有一条完全专用的路径。所以没有争议:事情就是这样。Tate说:“我的利用率不是百分之百,但我的利用率比其所有体系结构都要高得多。”。

市场

对于这一领域芯片初创公司数量的激增,泰特对FlexLogix的前景持乐观态度。

“当芯片投入使用,软件运行,展示演示,当看到价格和力量……很快,那些不在上四分之一的公司就会消失。”。

泰特的预测是,根据不同的细分市场(训练、推理、数据中心、edge、超低功耗等),这一领域可以支持10或15种芯片产品。今天提供的产品在计算能力方面跨越了多个数量级,因此并不都是直接相互竞争的。

泰特提到沃伦•巴菲特的名言:“在未来的一两年里,将有一场大规模的牛群淘汰,当潮水退去时,可以看到谁在裸泳。”

整理AI性能指标的更多相关文章

  1. 最近整理AI相关感想

    前言 目前笔者致力于 在AI 开发研究,四大平台里,百度AI 提供 的开发者资料是最全,开发的友好度也是最高的,很多都已经集成在SDK中,支持许多语言体系. 其实 作为公司层面的考虑,针对技术的研究出 ...

  2. 带你从0到1开发AI图像分类应用

    摘要:通过一个垃圾分类应用的开发示例,介绍AI Gallery在AI应用开发流程中的作用. 本文分享自华为云社区<AI Gallery:从0到1开发AI图像分类应用>,作者: yd_269 ...

  3. 2.5星|《AI进化论》:疑似基于PPT与公关稿整理汇编而成

    AI进化论·解码人工智能商业场景与案例 全书是目前AI在一些热门领域的应用的介绍,包括各行业内AI可以实现的功能.现有相关公司的具体业务等.对各公司的介绍仅限于能实现什么业务,具体做的怎么样,有什么优 ...

  4. AI 玩法整理

    随着信息技术的火热发展,人工智能已经成为IT全行业的风口爆发点,既然风口来了,作为技术人人员也都毫不犹豫的分一杯羹,怎么玩呢? 接下来的博客就会带领大家一起玩玩AI 认识AI--略,如果有需要的可以再 ...

  5. ps和AI使用过程中的易错点整理

    ps:1.视图工具:1)标尺2)参考线3)网格:视图-->--显示>-->网格4)修改网格:编辑-->首选项>-->参考线.网格和切片 5)放大工具:画布中单击可放 ...

  6. 【总结整理】AI产品经理大会2017(转载)

    从企业大数据到企业 AI | 易观智慧院院长 李智 1.AI 不是目的,而是要了解 AI 是什么,真正意义上的强人工智能在前沿领域尚未取得突破,暂时只能在影视文学作品中去思考人机关系.机器人三定律在未 ...

  7. 5G和AI会碰撞出什么样的火花呢?

    本文学习和分享一篇综述文章,这篇文章是东南大学移动通信国家重点实验室主任.长江学者特聘教授尤肖虎教授2019年发表在<中国科学 信息科学>(<SCIENCE CHINA Inform ...

  8. 马里奥AI实现方式探索 ——神经网络+增强学习

    [TOC] 马里奥AI实现方式探索 --神经网络+增强学习 儿时我们都曾有过一个经典游戏的体验,就是马里奥(顶蘑菇^v^),这次里约奥运会闭幕式,日本作为2020年东京奥运会的东道主,安倍最后也已经典 ...

  9. 五子棋AI清月连珠开源

    经过差不多两年的业余时间学习和编写,最近把清月连珠的无禁手部分完善得差不多了.这中间进行了很多思考,也有很多错误认识,到现在有一些东西还没有全面掌握,所以想通过开源于大家共同交流. 最近一直发表一些五 ...

随机推荐

  1. ZOJ 3781 最短路(想法好题目)

    题意:       给你一个n*m的矩阵,上面只有两种字符,X或者O,每次可以同时改变相同颜色的一个连通块,上下左右连通才算连通,用最小的步数把这个图弄成全是X或者全是O,题意要是没看懂看下面的样例. ...

  2. Win64 驱动内核编程-24.64位驱动里内嵌汇编

    64位驱动里内嵌汇编 讲道理64位驱动是不能直接内链汇编的,遇到这种问题,可以考虑直接把机器码拷贝到内存里,然后直接执行. 获得机器码的方式,可以写好代码之后,直接通过vs看反汇编,然后根据地址在看内 ...

  3. maven下载Oracle jar包

    Oracle的jar包由于是收费的,所以当我们使用maven去下载时下载不下来,对于这种情况,可以用以下方式去处理: oracle官网下载应用地址:https://www.oracle.com/dow ...

  4. 查询某软件所连接的外网IP地址

    一:背景环境: 1>:某机械公司用的某些特殊软件,需要实现所有使用某软件的屏蔽其软件所连接的外网ip,其他上网功能不做限制. 二:需求分析:可以查出此软件所连接的外网ip,在路由器的ip过滤中将 ...

  5. 浅入浅出 MySQL 索引

    简单了解索引 首先,索引(Index)是什么?如果我直接告诉你索引是数据库管理系统中的一个有序的数据结构,你可能会有点懵逼. 为了避免这种情况,我打算举几个例子来帮助你更容易的认识索引. 我们查询字典 ...

  6. Convert character array to string in MATLAB

    Matlab提取特征值是经常要读取多个图片文件,把文件名保存在数组中后再读取会出错.从stackoverflow中找到如下解决方法: I've a M by N matrix, each cell c ...

  7. [bug] Shell:paths must precede expression

    参考 https://www.cnblogs.com/peter1994/p/7297656.html

  8. 下载最新版本Fiddler

    下载最新版本Fiddler https://www.telerik.com/download/fiddler/fiddler-everywhere-windows

  9. Python数模笔记-StatsModels 统计回归(1)简介

    1.关于 StatsModels statsmodels(http://www.statsmodels.org)是一个Python库,用于拟合多种统计模型,执行统计测试以及数据探索和可视化. 2.文档 ...

  10. docker中ubuntu源更新慢加速 换为国内源 Debian10源

    本来以为是Ubuntu打包的镜像,换了阿里源老是报错100公钥不可用,结果发现是Debian的操作系统,换位Debian的操作系统打包的,换位Debian的源即可 #源如果使用错误也会报错,没有Deb ...