AI芯片结构目标图形处理

AI chip architecture targets graph processing

东京——AI处理器设计师Blaize,原名ThinCI(发音为“ThinkEye”),透露其完全可编程图形流处理器(GSP)将于2020年第二季度投入量产。

Blaize联合创始人兼首席执行官迪纳卡•穆纳加拉(Dinakar Munagala)称,尽管这家成立6年的初创企业对其产品规格(如功率水平和基准测试结果)一无所知,但其测试芯片已于2018年年中在全球范围内进行了16个试点项目,并已在全球范围内开展了16个试点项目。

Blaize将其GSP描述为能够执行“直接图形处理、片上任务图管理和执行以及任务并行性”。简而言之,Blaize设计的GSP能够满足以前GPU、CPU或DSP无法满足的AI处理需求。

对于许多研究人工智能处理器的行业分析师来说,这是以前听过的一种说法。

Tirias Research的首席分析师凯文·克莱威尔(Kevin Krewell)说:“对ThinCI有点了解,但从来没有得到过架构方面的宣传。不过,很高兴改了名字。”

在幻灯片演示中缺少关于GSP体系结构的技术细节,这在技术分析界引发了挫折和怀疑。然而,穆纳加拉承诺在2020年第一季度发布信息。

GSP体系结构的高级框图

GSP体系结构由图形流处理器、专用数学处理器、硬件控制和各种类型的数据缓存组成。该公司声称,GSP可以提供:“真正的任务级并行,最小限度地使用片外存储器,深度优先的硬件图形调度,完全可编程的架构。”点击这里获取更大的图像。

进入合格供应商名单

对Blaize来说,在Munagala看来,一个好消息是一群早期的客户已经在使用普惠制。一年来,Blaize一直在与GSP一起销售台式机。可以简单地插入电源插座并连接到以太网。Munagala说,数据科学家、软件和硬件开发人员已经在评估由GSP实现的系统级功能。

Blaize拥有8700万美元的融资,得到了早期投资者和合作伙伴的支持,包括Denso、日本的tier one、Daimler和Magna。穆纳加拉说:“从几年前开始,也从汽车领域获得收入。

手中拿着一块贴好的芯片,许多初创公司都面临着“现在该怎么办?”?“进退两难。Blaize的副总裁兼战略业务发展部(strategic business development)Richard Terrill告诉《经济时报》,“一年前就已经度过了这个阶段。”

BRAIE把重点放在建设基础设施上,加强了一支工程团队(现在多达325人),延伸到加利福尼亚、印度和英国,正在搬迁到新的设施,并开始在日本和EMEA雇佣现场应用工程师。穆纳加拉说:“正在保持势头。”。

对于Blaize来说,GSP业务不再是在power point演示文稿的规格上与竞争对手竞争。这是为了弄清楚客户将如何为哪些应用程序使用GSP,以及在特定用途中“在系统级别”消耗了多少电能。

Blaize一直忙于确定其物流,使其产品通过汽车认证,并确保内部流程和文档得到认证。穆纳加拉说:“已经通过了一个审计程序,已经被列入了一份经批准的合格供应商名单”。这是汽车制造商和一线企业迫切需要的一个过程,宁愿避开那些可能持续时间不够长、无法交付产品的初创企业。

Blaize在英国(Kings Langley和Leeds)雇佣了大约30名工程师,负责汽车产品开发。是一个紧密团结的工程师团队,当想象力剥夺了MIP。Munagala解释说:“是一群高素质的人,在MIPS合作,使基于MIPS的ASICs automotive获得MobileEye的资格。”。

图形计算

尽管人工智能出现在许多不同类型的神经网络中,“所有的神经网络都是基于图形的,”Munagala解释道。理论上,这允许开发人员利用图形原生结构在单一架构上构建多个神经网络和整个工作流。因此,该公司对其普惠制的新营销宣传是“100%的图形原生”

然而,blaze并不是图计算领域中的独角兽。Graphcore,Mythic和现在失败的Wave计算都谈到了AI处理中的“数据流图的优化和编译”。

特瑞尔说:“当然,图形计算已经有60多年的历史了。”

Munagala说,blaizegsp声称在三个方面与其基于图形的数据流处理器有区别。

首先,“普惠制是完全可编程的”,能够执行“广泛的任务,”说。

第二,是“动态可重编程的…在一个单一的时钟周期。”

第三,“提供流媒体的集成”,这使得最小化延迟成为可能。解释说,大规模的效率乘数是通过“数据流机制”来实现的,在这种机制中,非计算性的数据移动被最小化或消除。

GSP体系结构的图形本机特性可以最大限度地减少数据在外部DRAM之间的来回移动。外部只需要第一个输入和最终输出,而中间的所有内容都只是临时的中间数据。这将大大减少内存带宽和功耗。

Blaize系统的既定目标是“尽可能降低延迟,减少芯片、主板和系统级别的内存需求和能量需求。”

当被问及Blaize的图形计算设计是否具有专利辩护能力时,Mungala说,“对专利组合充满信心。有多个专利,有些已经授予,有些已经申请,但已经做了多年了。”

AI芯片结构目标图形处理的更多相关文章

  1. AI芯片体系结构目标图形处理

    AI芯片体系结构目标图形处理 AI chip architecture targets graph processing 可编程图形流处理器(GSP)能够执行"直接图形处理.片上任务图管理和 ...

  2. 十大热门AI芯片

    资料来源:头条<人工智能影响力报告>中的人工智能十大热门芯片 iPhone X内部搭载了一颗全新定制的处理器——A11 Boinic,用来承担人脸识别和移动支付的工作负荷.双核心A11芯片 ...

  3. 深度 | AI芯片终极之战

    深度 | AI芯片终极之战 https://mp.weixin.qq.com/s?__biz=MzA4MTQ4NjQzMw==&mid=2652712307&idx=1&sn= ...

  4. AI芯片:高性能卷积计算中的数据复用

    随着深度学习的飞速发展,对处理器的性能要求也变得越来越高,随之涌现出了很多针对神经网络加速设计的AI芯片.卷积计算是神经网络中最重要的一类计算,本文分析了高性能卷积计算中的数据复用,这是AI芯片设计中 ...

  5. 一文解读AI芯片之间的战争 (转)

    2015年的秋天,北京的雨水比往年要多些,温度却不算太冷.这一年里,年仅23岁的姚颂刚刚拿到清华大学的毕业证书;32岁的陈天石博士毕业后已在中科院计算所待了整整8年;而在芯片界摸爬滚打了14年的老将何 ...

  6. 比特大陆发布终端 AI 芯片 端云联手聚焦安防

    雷帝网 乐天 10月17日报道 比特大陆今日正式发布终端人工智能芯片BM1880,一同发布的还有基于云端人工智能芯片 BM1682 的算丰智能服务器 SA3.嵌入式AI迷你机 SE3.3D 人脸识别智 ...

  7. 人工智能AI芯片与Maker创意接轨(下)

    继「人工智能AI芯片与Maker创意接轨」的(上)篇中,认识了人工智能.深度学习,以及深度学习技术的应用,以及(中)篇对市面上AI芯片的类型及解决方案现况做了完整剖析后,系列文到了最后一篇,将带领各位 ...

  8. 人工智能AI芯片与Maker创意接轨 (上)

    近几年来人工智能(Artificial Intelligence, AI)喴的震天价响,吃也要AI,穿也要AI,连上个厕所也要来个AI智能健康分析,生活周遭食衣住行育乐几乎无处不AI,彷佛已经来到科幻 ...

  9. 深度 | AI芯片之智能边缘计算的崛起——实时语言翻译、图像识别、AI视频监控、无人车这些都需要终端具有较强的计算能力,从而AI芯片发展起来是必然,同时5G网络也是必然

    from:https://36kr.com/p/5103044.html 到2020年,大多数先进的ML袖珍电脑(你仍称之为手机)将有能力执行一整套任务.个人助理将变的更加智能,它是打造这种功能的切入 ...

随机推荐

  1. DVWA之File Inclusion(文件包含)

    目录 LOW: Medium: High Impossible LOW: 源代码: <?php // The page we wish to display $file = $_GET[ 'pa ...

  2. Win64 驱动内核编程-29.强制解锁文件

    强制解锁文件 强制解锁因其他进程占用而无法删除的文件. 1.调用 ZwQuerySystemInformation 的 16 功能号来枚举系统里的句柄 2.打开拥有此句柄的进程并把此句柄复制到自己的进 ...

  3. 微信小程序中的加载更多(即列表分页)

    1.app.json中: "window": { "enablePullDownRefresh": true //是否开启当前页面下拉刷新 } 2.wxml中: ...

  4. MySQL中MyISAM为什么比InnoDB查询快

    大家都知道在MySQL中,MyISAM比InnoDB查询快,但很多人都不知道其中的原理. 今天我们就来聊聊其中的原理,另外也验证下是否MyISAM比InnoDB真的查询快. 在探索其中原理之前,我们先 ...

  5. 【大白话 mysql】mysql 事务与日志原理

    在后端面试中,mysql是比不可少的一环,其中对事务和日志的考察更是"重灾区", 大部分同学可能都知道mysql通过redolog.binlog和undolog保证了sql的事务性 ...

  6. TypeScript 中 Optional Chaining 和 Nullish Coalescing

    Optional Chaining 解决的问题是重复且无意义的判空,之所以说无意义,是对业务来说它不是必需的,但不判空,程序直接就挂了,比如: let x = foo.bar.baz();   这里的 ...

  7. [Qt] 信号和槽

    信号与槽:是一种对象间的通信机制 观察者模式:当某个事件发生之后,比如,按钮检测到自己被点击了一下,它就会发出一个信号(signal).这种发出是没有目的的,类似广播.如果有对象对这个信号感兴趣,它就 ...

  8. Docker Swarm(一)集群部署

    一.机器环境 机器规划 172.16.0.89 swarm的manager节点 manager-node 172.16.0.90 swarm的node节点 node1 机器版本(均是:CentOS L ...

  9. mysql有关配置

    mysql有关配置 mysql安装 mysql安装方式有三种 源代码:编译安装 二进制格式的程序包:展开至特定路径,并经过简单配置后即可使用 程序包管理器管理的程序包: rpm:有两种 OS Vend ...

  10. 实战-加密grub防止黑客通过单用户系统破解root密码

    基于Centos8进行grub加密 加密grub 实战场景:给grub加密,不让别人通过grub进入单用户. 使用grub2-mkpasswd-pbkdf2创建密文 [root@localhost ~ ...