整理AI性能指标

Sorting out AI performance metrics

推理性能的最佳衡量标准是什么？

在人工智能加速器的世界里，对于给定的算法，芯片的性能经常以每秒万亿次的运算量（TOPS）来表示。但有许多原因说明，这可能不是最好的数据。

“客户真正想要的是每美元的高吞吐量，”人工智能加速器公司FlexLogix的首席执行官GeoffTate说。

Tate解释说，拥有更多的tops并不一定与更高的吞吐量相关。在batch size批量大小为1的边缘应用程序中尤其如此。数据中心之类的应用程序可以通过使用较大的批处理并行处理多个输入来提高其吞吐量（因为有备用的顶部），但这通常不适合边缘设备。

例如，Tate将Flex Logix’ InferX X1设备与市场领先的GPU设备进行了比较。虽然GPU提供了3到4倍的吞吐量，最高10倍，但使用的dram数量是8倍。Tate认为这使得flexlogix的架构更具资源效率。

Tate提出的每美元吞吐量指标听起来很合理，但实际上，要找到可靠的产品成本信息来进行直接比较并不容易。诸如需要多少DRAM，或者某个芯片有多少硅面积等因素可以作为成本的指标，可惜不是精确的。

Flex Logix的InfereX X1设备将于2019年年底前投产。将提供大约8.5个top。

ResNet-50公司

TOPS作为度量标准的另一个问题是，通常在运行ResNet-50时进行度量。

Tate说：“ResNet-50不是客户关心的基准，但是人报告最多的一个。“不太相关的原因是使用了非常小的图像。”

如今，ResNet-50在很大程度上被视为过时，已经存在了一段时间，已经成为引用顶级数据的事实标准。有充分的理由继续使用作为一个标准；其中包括努力保持所有分数至少在一定程度上具有可比性，以及使这一事实上的标准对所有类型的设备（即使是很小的设备）都可用。然而，不足以真正挑战当今为数据中心推理而构建的巨大芯片，也不足以炫耀能力。

行业基准

除了事实上的标准，当然还有各种各样的组织在为人工智能加速器开发基准（参见：MLPerf、DawnBench、EEMBC等）。

虽然MLPerf已经发布了推断结果，但Tate认为这个基准过于面向数据中心。在这个场景中，认为在第90个时间段，一个设备的延迟是一个性能指标。

“在边缘，我认为顾客不想知道第90个百分位，想知道第100个百分位。想知道：能保证我什么？Tate说，将自动驾驶作为一种边缘应用，在这种应用中延迟非常关键。

在更复杂的图像处理任务（如目标检测）上的性能更适合于比较当今高端的人工智能加速器

当信息在多个处理器内核和内存之间传输时，长尾延迟对于那些遭受总线争用的系统来说是一个典型的问题。虽然现在的许多设备使用高带宽内存接口，但在可能发生争用的情况下，理论上仍然存在延迟。

flexlogix基于FPGA的推理处理器设计每次都有完全相同的延迟（Groq也声称这一点，尽管坚称自己的设备不是FPGA）。

“由于我使用的是我的共同创始人在核心发明的FPGA互连，因此从内存到乘法累加器，到激活逻辑，再到内存，都有一条完全专用的路径。所以没有争议：事情就是这样。Tate说：“我的利用率不是百分之百，但我的利用率比其所有体系结构都要高得多。”。

市场

对于这一领域芯片初创公司数量的激增，泰特对FlexLogix的前景持乐观态度。

“当芯片投入使用，软件运行，展示演示，当看到价格和力量……很快，那些不在上四分之一的公司就会消失。”。

泰特的预测是，根据不同的细分市场（训练、推理、数据中心、edge、超低功耗等），这一领域可以支持10或15种芯片产品。今天提供的产品在计算能力方面跨越了多个数量级，因此并不都是直接相互竞争的。

泰特提到沃伦•巴菲特的名言：“在未来的一两年里，将有一场大规模的牛群淘汰，当潮水退去时，可以看到谁在裸泳。”

整理AI性能指标的更多相关文章

最近整理AI相关感想
前言目前笔者致力于在AI 开发研究,四大平台里,百度AI 提供的开发者资料是最全,开发的友好度也是最高的,很多都已经集成在SDK中,支持许多语言体系. 其实作为公司层面的考虑,针对技术的研究出 ...
带你从0到1开发AI图像分类应用
摘要:通过一个垃圾分类应用的开发示例,介绍AI Gallery在AI应用开发流程中的作用. 本文分享自华为云社区<AI Gallery:从0到1开发AI图像分类应用>,作者: yd_269 ...
2.5星|《AI进化论》：疑似基于PPT与公关稿整理汇编而成
AI进化论·解码人工智能商业场景与案例全书是目前AI在一些热门领域的应用的介绍,包括各行业内AI可以实现的功能.现有相关公司的具体业务等.对各公司的介绍仅限于能实现什么业务,具体做的怎么样,有什么优 ...
AI 玩法整理
随着信息技术的火热发展,人工智能已经成为IT全行业的风口爆发点,既然风口来了,作为技术人人员也都毫不犹豫的分一杯羹,怎么玩呢? 接下来的博客就会带领大家一起玩玩AI 认识AI--略,如果有需要的可以再 ...
ps和AI使用过程中的易错点整理
ps:1.视图工具:1)标尺2)参考线3)网格:视图-->--显示>-->网格4)修改网格:编辑-->首选项>-->参考线.网格和切片 5)放大工具:画布中单击可放 ...
【总结整理】AI产品经理大会2017（转载）
从企业大数据到企业 AI | 易观智慧院院长李智 1.AI 不是目的,而是要了解 AI 是什么,真正意义上的强人工智能在前沿领域尚未取得突破,暂时只能在影视文学作品中去思考人机关系.机器人三定律在未 ...
5G和AI会碰撞出什么样的火花呢？
本文学习和分享一篇综述文章,这篇文章是东南大学移动通信国家重点实验室主任.长江学者特聘教授尤肖虎教授2019年发表在<中国科学信息科学>(<SCIENCE CHINA Inform ...
马里奥AI实现方式探索 ——神经网络+增强学习
[TOC] 马里奥AI实现方式探索 --神经网络+增强学习儿时我们都曾有过一个经典游戏的体验,就是马里奥(顶蘑菇^v^),这次里约奥运会闭幕式,日本作为2020年东京奥运会的东道主,安倍最后也已经典 ...
五子棋AI清月连珠开源
经过差不多两年的业余时间学习和编写,最近把清月连珠的无禁手部分完善得差不多了.这中间进行了很多思考,也有很多错误认识,到现在有一些东西还没有全面掌握,所以想通过开源于大家共同交流. 最近一直发表一些五 ...

随机推荐

病毒木马查杀实战第023篇：MBR病毒之引导区的解析
前言引导型病毒指寄生在磁盘引导区或主引导区的计算机病毒.这种病毒利用系统引导时,不对主引导区的内容正确与否进行判别的缺点,在引导系统的过程中入侵系统,驻留内存,监视系统运行,伺机传染和破坏.按照引导 ...
设计模式-UML图简单介绍
直接上法宝: 1.类(Class) 类图分三层: 第一层显示类的名称,如果是抽象类,则就用斜体显示. 第二层是类的特性,通常就是字段和属性. 第三层是类的操作,通常是方 ...
18张图带你入门最新版JumpServer
环境要求 docker-ce Python3+ mysql5.6+ Redis 1 Ubuntu 安装 docker-ce 环境参考文档 https://docs.docker.com/engine ...
web自动化框架—BasePage 类的简单封装
优秀的框架都有属于自己的思想,在搭建web自动化测试框架时,我们通常都遵循 PO(Page Object)思想. 简单理解就是我们会把每个页面看成一个对象,一切皆对象,面向对象编码,这样会让我们更好的 ...
推荐一个不得不知道的 Visual Studio 快捷键
不得不说,Visual Studio 内置了很多非常棒的快捷键,借助于这些快捷键我们甚至不需要再使用鼠标,就可以快速高效的编写代码,因此学习和熟悉这些快捷键是值得的. 其中有一个快捷键是我非常喜欢,也 ...
技术博客：Azure Functions + Azure Storage 开发
Azure GitHub wiki 同步发布传送门 Azure Functions 通过 Functions(一个事件驱动型无服务器计算平台,还可以解决复杂的业务流程问题)更加高效地进行开发.在本地 ...
OO第一单元总结-多项式求导
OO第一单元总结-多项式求导一.第一.第二次作业总结因为前两次作业设计复杂度差别不大,因而放在这里统一总结. 基于度量分析程序结构: 前两次作业确实存在缺乏可拓展设计的构想,基本还是面向过程的思维 ...
.Net Core·热加载的实现及测试
阅文时长 | 0.25分钟字数统计 | 460字符主要内容 | 1.引言&背景 2.解决原理&方法 3.声明与参考资料『.Net Core·热加载的实现及测试』编写人 | SC ...
==与equals比较
提到==与equals的区别,这就必须先回顾一下jvm内存的分配机制 ==和equals无非比较两个基本数据类型或者对象类型八种基本类型: 基本类型大小默认值封装类 byte 1 0 Byte ...
[c++] 细节
\r退格:printf("asdflkj\r111")输出111flkj(https://blog.csdn.net/tyshtang/article/details/436770 ...

整理AI性能指标

整理AI性能指标的更多相关文章

随机推荐

热门专题