Bengio最新博文:深度学习展望

人类一直梦想着创造有智能的机器。早在第一台可编程计算机问世前100多年,发明家就对如何能让由连杆和齿轮组成的设备也变得更加智能这一命题充满好奇。后来,20世纪40年代计算机领域的先驱者之一Alan Turing通过描述一个测试为计算机科学设定了目标,这个测试也就是后来被大家所熟知的图灵测试,用以衡量计算机的表现和人类行为的接近程度。(注:图灵测试一词来源于计算机科学和密码学的先驱Alan Turing写于1950年的一篇论文《计算机器与智能》。Alan Turing 1950年设计出这个测试,其内容是,如果电脑能在5分钟内回答由人类测试者提出的一系列问题,且其超过30%的回答让测试者误认为是人类所答,则电脑通过测试。)

在我学术生涯早期研究人工智能领域的时候,科学家们解决的都是一些对人类来说困难,而对计算机来说会相对简单的任务,比如大规模的数学计算。然而在最近几年,我们正在进行的一些项目都是对人类来说非常容易,或者说下意识就能解决的任务,比如语音识别和人群中的人脸识别,然而这些任务却很难让计算机理解。

真正让我感兴趣的是在人工智能领域开始有了更为复杂的探索,即让计算机获得自主学习的能力。当然我的目的并不是让计算机完全像人类一样思考,我只是想去理解那些能让实体、计算机或生物变得智能化的一些基础原则。我很久以前打过一个赌,说是如果人工智能真的能够实现的话一定是得益于实体的学习能力,因此我一直专注于构建能够学习并自行理解这个世界的计算机。

我相信此刻我们正处于人工智能甚至是计算机本身的一个历史转折点。得益于现在更为强大的计算机、可用的海量丰富数据集以及先进的算法,我们终于可以跨越一个长期以来阻碍计算机科学发展的阈值。机器学习正在从一个高度人工化的阶段向另一个更为自动化的阶段进行快速转变,前者需要我们人为地对每个项目进行设计并提取其中较好的特征,后者可以实现让计算机像孩子一样,通过不断学习获得的经验来积累内部特征,从而理解这个世界,这就是我们所说的深度学习。

深度学习并不是一个全新的概念。事实上,在20世纪80年代我还是一个学生的时候,这是一个神经网络里的概念,也可以说是深度学习的前身,我对这个概念非常着迷并决定要在计算机科学领域开启我的学术生涯。目前深度学习真正新的进展在于,因为之前许多科学和技术进步的积累,使得我们在人工智能应用方面取得了一系列突破,比如语音识别、计算机视觉和自然语言处理等等。这也使得这个领域内涌入了一大批由研究生占据主要比例的研究者,让深度学习的研究高速发展起来。

我们能走到今天离不开两方面技术的进步,一是层次结构概念的创建,二是让电脑能自己提取特征。层次结构使得电脑能通过一些简单的概念学习进而理解复杂概念,这也是人类学习并培养他们对世界的理解的方式。当我们从过去所熟悉的事物中发现了新的观点,就会逐渐优化对世界理解的模型来不断适应,这些新事物又能帮助他们更好的与事实和数据对应起来。

例如,深度学习系统可以通过组合一些简单的概念来表示一只猫的形象,比如通过边缘的概念依次定义角落和轮廓。但是我们不需要特意教它关于中间区域的概念,它会自己学习。在这样一个视觉识别系统中,计算机可以成功在一张暹罗猫翻跟头照片中识别出猫,而不需要我们展示给系统所有猫可能具有的颜色、外形或行为。当计算机“看见”一只猫的时候,它就会“知道”这是一只猫。

我非常荣幸能和Geoffrey Hinton以及Yann LeCun一起因为在行业内的突出贡献而被大家誉为计算机科学三大巨头。我们共同撰写了一篇论文:深度学习,并发表在《自然》杂志的五月刊上,文章对人工智能领域我们所研究的方向的前景进行了阐述。但这个领域所需要做的事光靠几个“媒体明星”是远远不够的。为了达成更大的进步并实现更多的应用,人工智能领域无论在学术界还是工业界都需要成千上万个科学家和工程师们。((注:文章中文版链接:http://wenku.baidu.com/link?url=nF8zA-hi7sA0Oh899TtU2AuCBr_Vb10gP2X3MtDDVcxTRJu-1Ghzxrr-0aWUj1HamFg9xh47gZBYnLI7Z3GPLth-FDr53aiX7My9YeO2Kxu

这就是为什么我一直致力于为我们激动人心的事业网罗更多人才的原因。我与Ian Goodfellow和Aaron Courville合写了一部叫《深度学习》的书。我们的核心受众是学习机器学习的大学生以及一些软件工程师,他们在某些可能会用到机器学习的重要产业里工作。这本书已经放到网上了,我们欢迎大家来阅读和学习,并给我们一些好的反馈建议。

这令我想到了另一个我想表达的关键点:我是一个技术开放概念的拥护者。众多像开源开发者一样的技术开放运动支持者都坚信我们应该在获取新知识之后尽快分享出去,这能加快科学边界向外扩张的速度而且对大家都有利。我和很多同事们都把我们在深度学习领域的所有发明,应用在了GitHub的 Theano工具及其衍生项目上。这样,任何正在构建深度学习系统的人都可以使用这些算法和编程工具,当然我们也会敦促使用者回馈这个项目,有数百人已经这样做了。

正如共享之于技术开放的意义,透明化的协作也同样重要。整个学界形成了一个巨大的头脑风暴。其中,拥有5名教授在内共60名研究院的蒙特利尔学习算法研究所(MILA),通过和许多大学及产业里的科学家进行项目合作,大大推进了整个学界的协作程度。

我们最近的研究合作伙伴是IBM。我们期待着通过与IBM研究部门以及Watson Group的科学家和工程师们的合作,能够实现深度学习在语言、演说和视觉领域应用的宏大研究计划。我们坚信只要大家齐心协力,就一定可以通过更为强大的能处理海量数据集的计算机,成规模地增加深度学习的技术和方法。它可以帮助计算机跨越更广泛的领域,从更多种类的数据来源中学的更快更多,包括那些还未被人类运用的不能被标注的海量数据。

我认为深度学习的未来非常激动人心。我们取得了一系列快速的发展,虽然我们目前离破解什么能让机器真正理解这个世界这一谜题还很远,但是我对我们最终能破解这个谜题充满了信心。

然后闸门就会被打开了,一旦计算机真正理解文本、语音、图像和声音,他们将成为我们不可或缺的助手。这将彻底改变我们与计算机交互的方式,帮助我们在日常生活中生活得更为方便,在工作状态中更加高效。它会让社会能够应对一些对我们来说非常重要的重大挑战,比如治疗致命疾病以及更广泛地传播知识和财富。更重要的是,它会帮我们理解我们自身,以及一直以来让我非常着迷的关于“智能是如何产生的”的命题。30多年来这一直是我的梦想,现在这个梦想正在快速的照进现实。

☞  本文原作者Yoshua Bengio,格灵深瞳大美女天天翻译,如需转载,请提前与我们进行联系。

让计算机看懂这个世界
www.deepglint.com

更多精彩内容,请关注微信公众号:格灵深瞳。

Bengio最新博文:深度学习展望的更多相关文章

  1. 机器学习(Machine Learning)&深度学习(Deep Learning)资料【转】

    转自:机器学习(Machine Learning)&深度学习(Deep Learning)资料 <Brief History of Machine Learning> 介绍:这是一 ...

  2. 机器学习(Machine Learning)与深度学习(Deep Learning)资料汇总

    <Brief History of Machine Learning> 介绍:这是一篇介绍机器学习历史的文章,介绍很全面,从感知机.神经网络.决策树.SVM.Adaboost到随机森林.D ...

  3. 【转载】如何自学深度学习技术,大神Yann LeCun亲授建议

    编者按:Quora 上有网友提问:自学机器学习技术,你有哪些建议?(What are your recommendations for self-studying machine learning), ...

  4. 深度学习硬件:CPU、GPU、FPGA、ASIC

    人工智能包括三个要素:算法,计算和数据.人工智能算法目前最主流的是深度学习.计算所对应的硬件平台有:CPU.GPU.FPGA.ASIC.由于移动互联网的到来,用户每天产生大量的数据被入口应用收集:搜索 ...

  5. 搭建实用深度学习环境(Ubuntu16.10+Theano0.8.2+Tensorflow0.11.0rc1+Keras1.1.0)

    在动手安装之前,首先要确定硬件,系统,准备安装软件的版本,确定这些软硬件之间是否相互支持或兼容.本文安装的主要环境和软件如下: Ubuntu16.10+CUDA8.0(cudnn5.1,CNMEM)+ ...

  6. 2020厦门大学综述翻译:3D点云深度学习(Remote Sensiong期刊)

    目录 摘要 1.引言: 2.点云深度学习的挑战 3.基于结构化网格的学习 3.1 基于体素 3.2 基于多视图 3.3 高维晶格 4.直接在点云上进行的深度学习 4.1 PointNet 4.2 局部 ...

  7. 深度学习大牛Yoshua Bengio

    深度学习大牛Yoshua Bengio今天AAAI四小时深度学习教学讲座非常详尽,PPT有230页:http://t.cn/zQ4VRVx 如觉太长,可看他33页综述文:http://t.cn/zjk ...

  8. 李飞飞、吴恩达、Bengio等人的15大顶级深度学习课程

    目前,深度学习和深度强化学习已经在实践中得到了广泛的运用.资源型博客sky2learn整理了15个深度学习和深入强化学习相关的在线课程,其中包括它们在自然语言处理(NLP),计算机视觉和控制系统中的应 ...

  9. 深度学习笔记之关于总结、展望、参考文献和Deep Learning学习资源(五)

    不多说,直接上干货! 十.总结与展望 1)Deep learning总结 深度学习是关于自动学习要建模的数据的潜在(隐含)分布的多层(复杂)表达的算法.换句话来说,深度学习算法自动的提取分类需要的低层 ...

随机推荐

  1. nyoj 86 找球号(一)

    找球号(一) 时间限制:3000 ms  |            内存限制:65535 KB 难度:3   描述 在某一国度里流行着一种游戏.游戏规则为:在一堆球中,每个球上都有一个整数编号i(0& ...

  2. git 配置用户名和邮箱

    在安装了git for windows之后,个人总是忘记配置git config的命令,以此记录一下: 配置用户名和邮箱的命令 git config --global user.name " ...

  3. 你hack那么多啊,该怎么办

    当我们通过javascript来操作css样式的时候,假如我们停留在css2的阶段,会发现操作起来并不是很困难.虽然存在一些浏览器兼容的问题,但我们通过封装自己的函数,不仅可以设置样式还能够获取样式. ...

  4. 【转载】最近在用Arrays的asList()生成的List时,List元素的个数时而不正确,数组转化为List,即Arrays.asList(intArray);

    最近在用Arrays的asList()生成的List时,List元素的个数时而不正确. Java代码 //经多次测试,只要传递的基本类型的数组,生成List的元素个数均为1 char arrc = { ...

  5. 【html】【13】特效篇--下拉导航

    html代码: <!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" ...

  6. 修改placeholder颜色

    #contact_info为textarea的ID #contact_info::-webkit-input-placeholder{ color:#999;}#contact_info:-moz-p ...

  7. java包和jar包

    1.包 package  pack;                             /*定义包,放在程序的第一行,包名所以字母小写*/ class PackageDemo{    publi ...

  8. 10_HTTP协议_入门知识

    [什么是HTTP协议] 对 浏览器客户端 和  服务器端之间的数据传输的格式规范. 客户端连上web服务器后,若想获得web服务器中的某个web资源,需遵循一定的通讯格式,HTTP协议用于定义客户端与 ...

  9. eNSP

    L2交换机 sysvlan 200q interface Vlanif 200ip address 192.168.0.1 24dis thisq interface Ethernet 0/0/1po ...

  10. ASCII Table/ASCII表

    ASCII Table/ASCII表 参考: 1.Table of ASCII Characters