十大热门AI芯片
资料来源:头条《人工智能影响力报告》中的人工智能十大热门芯片
iPhone X内部搭载了一颗全新定制的处理器——A11 Boinic,用来承担人脸识别和移动支付的工作负荷。双核心A11芯片运算量能够达到6000亿/s。在智能手机上安装专业化的芯片,意味着主芯片运算量减少,电池寿命提高。
作为AI算法的“摆渡人”,到底有哪些智能芯片被AI热烈追求?
1、GPU
GPU(Graphics Processing Unit):图形处理器,又称视觉处理器、显示核心、显示芯片,是一种专门在电脑、移动设备(平板电脑、智能手机等)、工作站、游戏机等终端设备上进行图像运算工作的微处理器。
GPU与CPU类似,是显卡的“心脏”,只不过GPU是专为执行复杂的数学和几何计算而设计的。
GPU作为应对图像处理需求而出现的芯片,其海量数据并行运算的能力与深度学习需求不谋而合,因此,被最先引入AI领域。
多数GPU拥有2D或3D图形加速功能。如果CPU想画一个二维图形,只要发个指令给GPU,如“在坐标位置处画个长和宽为a×b大小的长方形”,GPU就可以迅速计算出该图形的所有像素,并在显示器指定位置(x, y)上画出a×b的长方形。
GPU已经不再局限于3D图形处理了。在浮点运算、并行计算等部分计算方面,GPU拥有数十倍乃至于上百倍于CPU的性能。
AI最近几年的成绩离不开深度学习,而大多平台都在使用GPU来运行深度学习的算法。GPU强大的并行运算能力缓解了深度学习算法的训练瓶颈,从而释放了人工智能的全新潜力。
2、CPU
CPU(Central Processing Unit):中央处理器,一块超大规模的集成电路,它的功能主要是处理指令、执行操作、控制时间、处理数据。运作原理分为提取、解码、执行和写回4个阶段。
由于GPU是图像处理的专业选手,所以CPU处理图像的效率远远低于GPU。但是CPU是通用的数据处理器,处理数值计算是它的强项,所以它是不会被GPU取代的。
3、FPGA
FPGA(Field-Programmable Gate Array):现场可编程门阵列。它是在PAL、GAL、CPLD等可编程器件的基础上进一步发展的产物,具有一定的可编程性,能够同时进行数据、任务并行计算。
单从性能角度来看,FPGA弱于GPU,但在性能功耗比、灵活配置硬件结构方面,FPGA强于GPU。FPGA对深度学习领域的上层软件兼容性更强,是助力深度学习的一大技术。
在医疗、基因序列分析领域,对图像纹理、分辨率、相关性、储存空间、分析和理解要求都很高;在与视频相关的领域内,如金融、安防行业,对数据流的处理有一定的要求。FPGA已经具备了解决以上问题的特殊优势。
4、TPU
TPU(Tensor Processing Unit),专为机器学习量身定做的处理器,执行每个操作所需的晶体管数量减少,因此效率也大大超过GPU。
5、寒武纪
寒武纪是一种神经网络芯片,目标是实现人工智能。目前寒武纪包含三种原型处理器结构:
目前寒武纪包含三种原型处理器结构:寒武纪1号(DianNao):面向神经网络的原型处理器结构;
寒武纪2号(DaDianNao):面向大规模神经网络;
寒武纪3号(PuDianNao):面向多种机器学习算法。
寒武纪1号DianNao,包含一个主频:0.98GHz,神经网络基本运算峰值性:4520亿次/s,65nm工艺下功耗:0.485W,面积:3.02mm2的处理器核。DianNao的面积和功耗仅为CPU核的1/10,但是平均性能超过CPU核的100倍。
6、NPU
NPU:嵌入式神经网络处理器,为深度学习而生的专业芯片。采用“数据驱动并行计算”的架构,特别擅长处理视频、图像类的海量多媒体数据。
中国首款(NPU)“星光智能一号”,是全球首颗具备深度学习人工智能的嵌入式视频采集压缩编码系统级芯片,在人脸识别运用上准确率可高达98%。不过“星光智能一号”并不是真正意义的神经网络专用芯片,而是一款可以运行神经网络的DSP。
7、Tesla P100 GPU
英伟达(NVIDIA)推出的特斯拉P100(Tesla P100)显卡,搭载了基于最新帕斯卡构架的GPU GP100,单个芯片上集成了150亿个晶体管。
Tesla P100可实现相当于数百个CPU 服务器节点的性能,可提升数据中心的吞吐量和中心效率、减少节点数量,可执行深度学习神经网络任务。
8、Xeon Phi
Xeon Phi,更像是与CPU协同工作的GPU,在最新公布的超级电脑500强中,有7款电脑采用的是Xeon Phi芯片。
9、TrueNorth
TrueNorth:百万神经元类人脑芯片。
脑补:重量只有几克,尺寸只有邮票大小,却集成了54亿个硅晶体管,4096个内核,100万个“神经元”、2.56亿个“突触”,能力相当于一台超级计算机,功耗却只有65毫瓦。
毫无疑问,认知能力是TrueNorth的强项。TrueNorth可以执行感知、交互、识别等任务:它可以在地震时自动发出海啸警报,而传统计算机根本不可能完成这样的任务;TrueNorth可以部署在超级计算机Watson上,从而大大提高Watson的能力和能效。
10、DPU
DPU(Distributed Processing Unit):分散处理单元,常应用于DCS控制系统中。
DPU除了可以实现70多种特殊功能及150多种过程控制算法,还能够执行数据采集、标度变换、报警限值检查、操作记录、顺序事件记录等任务。
随着人工智能应用规模和需求的不断扩大,AI革命正在积极促进专用计算芯片的研发。通用芯片向定制芯片过渡,并最终走向类脑计算芯片,将会成为人工智能芯片发展的大势所趋。
十大热门AI芯片的更多相关文章
- 2015年十大热门Android开源新项目
2015年十大热门Android开源新项目 2015 即将结束,又到了大家喜闻乐见的年终盘点时刻啦,今天给大家盘点一下 2015 年 Android 开发领域新出现的 10 大热门开源项目.数据来自于 ...
- 程序员十大热门flag,有你的吗?
2018的尾声,南方人期盼已久的下雪天终于到了,实在是太鸡冻了! 而赏雪的喜悦也伴随着寒冷的忧伤 早上起床越来越难,衣服怎么裹都还是冷 这时,穿搭届的神话般的人物——程序员们,可能又要引起轰动了吧! ...
- 机器人研发十大热门编程语言:不死 Java、不朽 C/C ++、新贵 Python
流水的编程语言,铁打的 Java.C/C++. 进行人工智能机器人研发,应该选择哪种编程语言? 这是很多机器人专家在自身的职业生涯中都会存在的一个入门级思考.毕竟,在学习一门编程语言时,需要花费大量的 ...
- 前端必备,十大热门的 JavaScript 框架和库
JavaScript 框架和库可以说是开源项目中最庞大也是最累的类目了,目前在github 上这一类的项目是最多的,并且几乎每隔一段时间就会出现一个新的项目席卷网络社区,虽然这样推动了创新的发展,但不 ...
- 阿里AI芯片:12nm工艺、709平方毫米大核心
含光出自<列子·汤问>篇有“上古三剑”一章,寓意含而不露,光而不耀,象征含光 800 无形却强劲的算力. 含光 800 是一款 AI 芯片,偏重推理.据介绍,1 颗含光 800 的算力相当 ...
- 深度 | AI芯片终极之战
深度 | AI芯片终极之战 https://mp.weixin.qq.com/s?__biz=MzA4MTQ4NjQzMw==&mid=2652712307&idx=1&sn= ...
- 一文解读AI芯片之间的战争 (转)
2015年的秋天,北京的雨水比往年要多些,温度却不算太冷.这一年里,年仅23岁的姚颂刚刚拿到清华大学的毕业证书;32岁的陈天石博士毕业后已在中科院计算所待了整整8年;而在芯片界摸爬滚打了14年的老将何 ...
- 看完它,你就全懂了十大Wifi芯片原厂!
看完它,你就全懂了十大Wifi芯片原厂! 来源:全球物联网观察 概要:不知不觉中,WiFi几乎已攻占了整个世界.现在只要你上网,可能就离不开WiFi了. 2014年是物联网WiFi市场关键的转折期 ...
- 免费丨十大IT热门学科在线直播体验课正式来袭,全免费!!!
一场突如其来的疫情阻挡了人与人之间的接触,在这一系列困难面前,无数勇敢的人们挺身而出,千里驰援,默默承担,用行动践行责任与信念,希望与祖国和家人一道共渡难关. 传智播客作为一家致力于“高精尖”IT科技 ...
随机推荐
- python条件判断之直接加数字
if 后面跟的是条件表达式,条件表达式的结果为True或者False. (1)如果if后面的条件是数字,只要这个数字不是0,python都会把它当做True处理,见下面的例子: if 3: print ...
- [转]Linux下防止进程使用swap及防止OOM机制导致进程被kill掉
首先解释两个概念:swap:在linux里面,当物理内存不够用了,而又有新的程序请求分配内存,那么linux就会选择将其他程序暂时不用的数据交换到物理磁盘上(swap out),等程序要用的时候再读进 ...
- Understanding the Module Pattern in JavaScript
Understanding the Module Pattern in JavaScript Of all the design patterns you are likely to encounte ...
- c#枚举类型操作方法总结-1
关于枚举类型用法总结两点,分享如下: 1. 根据枚举值获取枚举值的描述信息,可以封装一个方法供调用: // enumValue是传入的枚举值 public string GetEnumDescrp ...
- debugfs linux rm 删除 恢复 Attempt to read block from filesystem resulted in short read while opening filesystem
w 删除具有空字符的文件 反斜杠来转义下一个字符 rm -R Samples\ -\ Copy well@well:/home/etc/project/apilinux/MarketplaceWebS ...
- CBAM: Convolutional Block Attention Module
1. 摘要 作者提出了一个简单但有效的注意力模块 CBAM,给定一个中间特征图,我们沿着空间和通道两个维度依次推断出注意力权重,然后与原特征图相乘来对特征进行自适应调整. 由于 CBAM 是一个轻量级 ...
- leetcode 46 全排列 (python)
给定一个没有重复数字的序列,返回其所有可能的全排列. 示例: 输入: [1,2,3]输出:[ [1,2,3], [1,3,2], [2,1,3], [2,3,1], [3,1,2], [3,2,1]] ...
- MyBatis系列:一、入门
MyBatis无需我介绍,本系列文章是纯干货,没有一点废话. 1.创建一个maven项目,引入mysql的驱动和mybatis的maven引用 <dependency> <group ...
- java.lang.NoClassDefFoundError: com/opensymphony/xwork2/util/finder/DefaultClassFinder$InfoBuildingV 解决方法
问题:严重: Unable to read class [com.spml.action.AddUserAction]java.lang.NoClassDefFoundError: com/opens ...
- 阶段1 语言基础+高级_1-3-Java语言高级_06-File类与IO流_04 IO字节流_2_一切皆为字节
这里的视频就是字节的形式,为了看着方便转换成了MB.一个字节就是8个二进制 包括文本,都是以字节的形式存储的