More Moore and More than Moore

——基于硅光电子学探讨摩尔定律的延续和发展

1965年4月,《电子学》杂志第114页上刊载了Intel创始人之一戈登·摩尔(Gordon Moore)的文章《让集成电路填满更多的组件》。他在搜集1959年至1965年集成电路上晶体管数量的数据基础上,预言当价格不变时,半导体芯片上集成的元器件数目如晶体管和电阻数量,约每隔18~24个月便会增加一倍,性能也将提升一倍。[1]

摩尔定律产生的经济学原因是半导体行业需要以合适的速度增长以实现利润的最大化。半导体晶体管的制程发展速度对于半导体厂商来说非常重要,因为随着制程的进化,相同的芯片可以容纳更多数量的晶体管,芯片的性能提高,并且高度集成化可以降低成本,从而带来更多的利润,如果将额外利润继续用于研发制程的改进和进化中,就可以实现效益持续提升的循环过程。这样的循环过程促成了摩尔定律。[2]

一直到20世纪90年代,半导体行业新制程的研发都没有遇到太大的阻碍,但随着特征尺寸越来越小,工艺制程的进程推进遇到了经济学和物理学上的双重阻碍。经济学方面,先进制程的工艺日益复杂,芯片的设计、掩膜制作成本以及光刻成本逐渐增加,这导致先进制程制作的芯片需要更多的销量才能实现真正盈利;物理学方面,特征尺寸缩小到5nm及以下的量子物理边界时,会产生诸多量子效应,比如量子隧穿效应会使晶体管的漏电十分严重,导致电子产品的待机功耗增加,会降低产品的性能。因此,对于摩尔定律是否可以延续的质疑声越来越多,业界也在不断寻找可以让摩尔定律继续延续或者与其他领域结合以提高生命力的方案。结合黄昆院士的名言“物穷其理,宏微交替”,本文试图从纯粹的半导体行业中抽身出来,结合纳米光学和计算机科学中神经网络的相关知识,探讨硅基光电子学的运用以及其在处理神经网络问题时的优势。

一、硅光电子学:

以20世纪晶体管的发明为起点,以硅为基础的微电子器件以低功耗、低成本、易集成的优点迅速占领了绝大部分的电子市场,摩尔定律也迈开了向前推进的脚步。然而,在微电子器件小型化到10nm及以下时,集成电路的互连延迟效应和能耗问题成为了以电子为信息载体的高速集成电路技术一个不可逾越的障碍。

与电子相比,光子作为用于传输的信息载体有巨大的优势:光子没有静止质量,可以在自由空间或者光纤中传输且传输时几乎不产生相互作用,因此有高度的并行处理能力;另外,无线电波在金属导线中传输时会受到RC时间常数的限制,而光波传播可以接近光速,不受限制;光的抗干扰能力强,不同波长可用于多路同时通讯;在信息存储方面,可以实现三维的光存储。因此,利用光子的信息技术具有更大的带宽和更高的速率。但光子器件也有一些弊端:光子器件同样受到尺寸方面的限制——衍射极限,这将光子器件限制在了微米量级,无法到达微电子器件的超小尺寸;另外,电子是费米子,由于泡利不相容原理,相邻电子之间的强相互作用可以设计出大量非线性开关元件——二极管,从而实现复杂的计算功能。只有将微电子和光电子结合起来,即所谓的硅基光电子集成技术,同时利用光子元件的传输优势和电子元件的计算优势,才可以充分提高元件的性能。

硅基光电子学,[3]就是研究和开发以光子和电子为信息载体的硅基大规模集成技术。其核心内容就是研究如何将光子器件"小型化"、“硅片化”并与纳米电子器件相集成,即利用硅或与硅兼容的其他材料,应用硅工艺,在同一硅衬底上同时制作若干微纳量级,以光子和/或电子为载体的信息功能器件,形成一个完整的具有综合功能的新型大规模集成芯片。有关硅基光子的研究可以追溯到20世纪80年代[4],当时光子计算被寄予了很高的期望,但是光子集成芯片和传统的微电子集成芯片有很大的不同,光子集成器件的线度过大,并且种类繁多,包括激光器、调制器、放大器、滤波器、耦合器、复用器等需要不同设计的功能器件,因此光电子器件的集成难度远远大于传统的微电子芯片,受限于当时的硅基制作工艺,硅基光子的发展十分缓慢。

二、硅光电子学原理探究:

由于光电子元件尺寸上的限制,硅基光电子工艺主要的应用领域还是中长距离的数据通信方面。当前光纤通信正从长距离到短距离发展,硅基光子商业化方向也逐渐向数据处理和高性能计算转移,最终实现面向CPU核之间的小尺寸互联通信。在光纤通讯行业,光纤系统中所用到的各种器件称为光器件。光器件分为有源光器件与无源光器件两种。

有源光器件又称光主动器件,是在光通信系统中能产生或接收光信号的器件。光纤通信系统中应用的光有源器件有信号光源、泵浦光源、探测器、光调制器和光放大器等。光有源器件在光纤通信系统中的功能是对光信号作主动操作,包括光信号的发射、探测和放大、光调制和波长变换等等;无源光器件又叫光被动器件,是在光通信系统中不能产生或接收光信号的器件,不需要接上电源就能够直接工作。光纤通信系统中应用的光无源器件有光连接器、光耦合器、光隔离器、光衰减器、光开关,光滤波器和光波分复用器等等。光无源器件在光纤通信系统中的功能是对输入的光信号作被动操作,如光束的分波和合波、分束和合束、光的开关、衰减和偏振控制等。

如图一所示,在硅光子系统的信息传输过程中,光源(片外光源或片上光源)发光。设备发射端输入的电信号通过光调制器加载到光上,改变光波的特征参数从而形成特定的光信号,经过传输介质光纤到达光探测器,探测器再将光信号转换为电信号进入接收设备,接收端再用解复用器将多路光分离,从而分析各路光中所蕴含的信息。

图一:硅光子学的信息传输过程
图二:不同波长的光入射增加信息量

利用光波互不干扰可以并行处理的特点,在光波传输信息的过程中。通常将一束光分成不同波长的光,可以增加传输信息量,光信号经过波分复用器将携带多路数据合并,在单光纤的通道中传输,在接收端再用解复用器将多路光分离。

三、硅光电子学历史:

1969年美国贝尔实验室的S.E.Miller首次提出了集成光学的概念。1972年,S.Somekh和A.Yarive提出了在同一半导体衬底上同时集成光器件和电器件的设想。然而当时为了制备功能多样的光器件,仍需采用不同特性的材料作为衬底,这大大限制了集成光器件的发展,之后硅光电子学发展缓慢,无论是集成光器件的研究,还是微电子加工工艺的发展,都没有达到技术研发的要求。直到20世纪90年代,集成电路的特征尺寸进入光波的波长范围,硅衬底集成工艺日趋完善,而且硅材料对通信波段的光吸收很小,有利于降低光传输损耗。另外,而且硅和二氧化硅材料之间的折射率对比比较大,增强了光器件对光场的限制,有助于减小硅基光集成器件尺寸,从而提高芯片的集成密度。硅光子学由此诞生。

21世纪,随着互联网的兴起,对于数据计算和信息处理的要求越来越高,用户对宽带速度的需求也逐渐增加,CPU运算能力受到芯片互联带宽的严重制约,而光信号在传输过程中衰减少,较容易获得更宽的带宽,在硅芯片上集成光学数据通道的难度又不算太高。因此,以Intel为首的企业和机构开始重点发展硅光学技术,极大地促进了硅光子学的研究。无论是在调制器、探测器、激光器还是波分复用器件等方面的研究在2000年之后都取得了飞速的进展。

图三:硅基光电领域飞速发展

2008年以后,以Luxtera、Intel、和IBM为代表的公司不断推出商用级硅光子集成产品。2010年,Intel建立起全球首个集成激光器的端到端硅基光数据连接,证明了未来计算机可以使用光信号替代电信号进行数据传输。2013年,Intel与康宁宣布共同研发了新的光纤传输技术,300米之内可以做到1.6 Tb/s的惊人速度。同年11月,富士通宣布,通过与Intel的大力合作,已成功打造并展示了全球第一台基于Intel OPCIE(光学PCI-E)的服务器。2014年,Intel发布了采用硅光子技术的有源光缆(AOC),该产品支持Facebook主导的数据中心行业标准“Open Compute Project”。

如下图,Yole在2014年对硅光子市场进行了预测,认为主要的市场来自两个方面:数据处理和HPC(high proformance computer)。从图中我们可以看出,15年全球硅光子元件的市场规模还只有4000万美元,2024年就会达到惊人的7亿美元。文中,Yole指出,15年拥有硅光子产品的公司只有Cisco, Intel, STMicroelectronics等寥寥几家,但随着硅光子技术的发展,高性能产品将会不断流向全球各大企业,其中90%用于数据中心提升运算性能方面。

图四:硅基光电子市场预测

图五:硅基光电子市场供求分析

四、神经网络与硅光子芯片:

21世纪井喷式增长的神经网络模型研究,将大规模并行计算的需求提升到了极致。人工神经网络是计算机深度学习领域的研究热点,它的基本原理是将数据信息输入网络中,网络算法模拟人脑从实践中学习的方式进行自我训练,将训练集数据与标签相比较,修改自身网络中的权重值和偏置值等参数,以达到提升识别效果,降低损失值的目的。训练结束的神经网络,具有完成指定任务的能力,如人脸识别、目标检测、棋类对抗、自然语言生成等等。自从ImageNet竞赛中卷积神经网络AlexNet胜出并取得了惊人的识别效果之后,卷积神经网络得到广泛应用,并逐渐加深网络层数,已实现高级特征的识别和处理,从而提升神经网络的工作性能。日益增加的网络层数对应权重等参数数目增加,也就意味着大量的并行计算过程。

一开始,研究人员将目光集中在用于图像处理和计算的GPU上,这是因为从运算的角度来看,神经网络主要是由大量的浮点矩阵构成的,而现代的神经网络,可能有几千到几百万的浮点矩阵,因此需要很大的内存带宽来访问这些海量的浮点矩阵。而GPU的内存带宽比CPU高很多。比如Intel的Core i9-7980XE内存带宽约为57GB/s,而NVIDIA的Tesla P100带宽高达900GB/s。训练一个简单的神经网络问题,比如基于Tensorflow框架训练的一个实时检测手部的网络,GPU只需要5个小时,而CPU则需要12天。然而,快速发展的深度学习训练要求并不只满足于此,继TPU、FPGA之后,关于硅光子芯片的研究吸引了深度学习领域的注意。宽带宽、高并行处理能力的硅光子芯片,毫无疑问可以在一定程度上满足深度学习对于大数据处理的需求。

MIT 博士后 Yichen Shen、研究生 Nicholas Harris、教授 Marin Soljačić 和 Dirk Englund 等人2017年6月12日在Nature Photonics发表论文,[9]提出了一种使用光子技术实现神经网络的方法,并且进行了实验验证。基于硅光子低功耗高速度处理信息的优势,团队提出了基于光学的计算算法。他们提出了一种形象的解释:即使是我们日常常见的眼睛镜片也会对穿过它的光波有复杂的运算过程——傅里叶变换。光子芯片所执行的变换要更加简单,但基本原理相近,它基于一系列相互连接的光波导对光子进行导引,这些光波导的连接可根据需要进行设定和编程,以实现特定的运算目的。芯片光输出使用多光束干涉技术,干涉条纹的信息即可以反映运算的结果。研究团队称这种芯片为可编程纳米光子处理器。

在验证实验中,团队利用运行在可编程纳米光子处理器的神经网络识别四个基本元音。结果发现,尽管仅仅使用了一个初级的系统,他们也获得了77%的准确率,而传统系统的准确率为90%。虽然没有达到传统网络的准确率,但是作为一个初步试验,这种结果还是非常令人欣喜的。团队表示,这个系统走向实用还需更多的努力和时间。然而,一旦系统获得扩展完整运行,就能实现很多功能,比如用于数据中心或安全系统。

图六:神经网络元音识别结果

六、结语:

当摩尔定律在10nm以下的尺寸遇到困难时,业界和学界给出的方案有三个大方向:“More Moore”、”“More than Moore”、“Beyond CMOS”,以谋求电子行业的进一步发展。本文以“More Moore and More than Moore”为题,希望通过黄昆院士“物穷其理,宏伟交替”的观点,结合不同学科、不同领域来赋予摩尔定律以新的生机。硅光子器件和微电子器件一样,都是基于硅材料的半导体架构。光子芯片目前还处于实验阶段,但未来的工艺微缩空间不可小觑,在数据处理和计算方面也具有十分优良的性能。在运用硅光子技术的时候,我们既要清晰认识光的传输过程稳定、并行处理能力强、低能耗的特点,也要熟记其受衍射极限限制、不适合做非线性运算的弊端。只有将微电子和硅光子技术相结合,才能各自充分发挥两者的优势。

1.Moore G E . Cramming More Components Onto Integrated Circuits[J]. Proceedings of the IEEE, 1998, 86.

2.G.Dan Hutcheson,黄国勇.摩尔定律:一个改变历史和经济的推断[J].中国集成电路,2006(08):77-82.

3.周治平.硅基光电子学.北京:北京大学,2012

4.SOREF R A, LORENZO J P. Single-Crystal Silicon: A New Material for 1.3 and 1.6 um Integrated-Optical Components[J]. Electronics Letters, 1985, 21(21): 953-954. DOI: 10.1049/el:19850673

5.Silicon Photonics Stumbles at the Last Meter. spectrum.ieee.org-By Anthony F. J. Levi

6.Is There Light At The End Of Moore’s Tunnel. November 22nd, 2013 - By: Brian Bailey

7.硅基光子进展还面临哪些设计和工艺挑战. 半导体行业观察. 2017.05.16.

8.Photonics Silicon Photonics 2014 report. Yole Development. Market & Technology Report.

9.Deep learning with coherent nanophotonic circuits. Yichen Shen, Nicholas C. Harris, Scott Skirlo.Nature Photonics volume 11, pages 441–446 (2017)

More Moore and More than Moore的更多相关文章

  1. 【分享】IT产业中的三大定理(一) —— 摩尔定理(Moore's Law)

    科技行业流传着很多关于比尔·盖茨的故事,其中一个是他和通用汽车公司老板之间的对话.盖茨说,如果汽车工业能够像计算机领域一样发展,那么今天,买一辆汽车只需要 25 美元,一升汽油能跑四百公里.通用汽车老 ...

  2. codeforces 630B Moore's Law

    B. Moore's Law time limit per test 0.5 seconds memory limit per test 64 megabytes input standard inp ...

  3. Mealy和moore型状态机

    Moore型状态机:下一状态只由当前状态决定,即次态=f(现状,输入),输出=f(现状): Mealy型状态机:下一状态不但与当前状态有关,还与当前输入值有关,即次态=f(现状,输入),输出=f(现状 ...

  4. Boyer–Moore (BM)字符串搜索算法

    在计算机科学里,Boyer-Moore字符串搜索算法是一种非常高效的字符串搜索算法.它由Bob Boyer和J Strother Moore设计于1977年.此算法仅对搜索目标字符串(关键字)进行预处 ...

  5. Boyer Moore算法(字符串匹配)

    上一篇文章,我介绍了KMP算法. 但是,它并不是效率最高的算法,实际采用并不多.各种文本编辑器的"查找"功能(Ctrl+F),大多采用Boyer-Moore算法. Boyer-Mo ...

  6. Boyer and Moore Fast majority vote algorithm(快速选举算法)

    问题来来自于leetcode上的一道题目,https://leetcode.com/problems/majority-element/,大意是是找出一个数组中,出现次数超过一个半的数字,要求是O(n ...

  7. Majority Element问题---Moore's voting算法

    Leetcode上面有这么一道难度为easy的算法题:找出一个长度为n的数组中,重复次数超过一半的数,假设这样的数一定存在.O(n2)和O(nlog(n))(二叉树插入)的算法比较直观.Boyer–M ...

  8. 【分享】IT产业中的三大定理(三) —— 反摩尔定理 (Reverse Moore's Law)

    Google(谷歌)的 CEO 埃里克·施密特在一次采访中指出,如果你反过来看摩尔定理,一个 IT 公司如果今天和十八个月前卖掉同样多的.同样的产品,它的营业额就要降一半.IT 界把它称为反摩尔定理. ...

  9. Moore majority vote algorithm(摩尔投票算法)

    Boyer-Moore majority vote algorithm(摩尔投票算法) 简介 Boyer-Moore majority vote algorithm(摩尔投票算法)是一种在线性时间O( ...

随机推荐

  1. 今天俺要说一说简单工厂模式(Simple Factory)

    前言:简单工厂不能说是设计模式,它是一种变成习惯,因为它不是23种设计模式之一,但是它在实际开发中经常用到,而且也非常简单,可以说是工厂模式的一个引导. 大多程序员都是单身狗,为了弥补一下你们的心情, ...

  2. mysql 架构篇系列 4 复制架构一主一从搭建(半同步复制)

    一.概述 在mysql 5.5之前,mysql 的复制是异步操作,主库和从库的数据之间存在一定的延时,这样存在一个隐患:当主库上写入一个事务并提交成功,而从库尚未得到主库推送的Binlog日志时,主库 ...

  3. Error: Default interface methods are only supported starting with Android N (--min-api 24): java.io.InputStream org.apache.poi.sl.usermodel.ObjectShape.readObjectData()

    项目运行的时候,如果报错 Error: Default interface methods are only supported starting with Android N (--min-api ...

  4. .net core下使用FastHttpApi构建web聊天室

    一般在dotnet core下构建使用web服务应用都使用asp.net core,但通过FastHttpApi组建也可以方便地构建web服务应用,在FastHttpApi功能的支持下构建多人聊天室是 ...

  5. .NET应用程序管理服务AMS设计

    AMS全称是Application Management Server即应用程序管理服:由于经常要写些一些应用服务,每次部署和维护都比较麻烦,首先要针对服务编写一个windows服务程序方便系统启动里 ...

  6. Spring Boot2.0 设置拦截器

    所有功能完成 配置登录认证 配置拦截器 在spring boot2.0 之后 通过继承这个WebMvcConfigurer类 就可以完成拦截 新建包com.example.interceptor; 创 ...

  7. Chapter 4 Invitations——20

    Well, that was fine. I could leave him alone. 行吧,但愿一切都好.我能让他一个人. I would leave him alone. 我也会让他一个人的. ...

  8. centos7忘记root密码

    开机时狂点方向键下(Windows还原习惯了),或者狂点别的键.目的为了不让它进入系统. 方向键移动光标定位在第一行,按e编辑它. 在新界面找到linux16开头的行.→光标到  ro    改成rw ...

  9. 服务化改造实践 | 如何在 Dubbo 中支持 REST

    什么是 REST REST 是 Roy Thomas Fielding [[1]](#fn1) 在 2000 年他的博士论文 [[2]](#fn2) “架构风格以及基于网络的软件架构设计” 中提出来的 ...

  10. [十二]JavaIO之BufferedInputStream BufferedOutputStream

    功能简介 BufferedInputStream 和 BufferedOutputStream一样,他们都是过滤流 装饰器模式下具体的装饰类 用来装饰InputStream以及OutputStream ...