The major advancements in Deep Learning in 2016

  地址:https://tryolabs.com/blog/2016/12/06/major-advancements-deep-learning-2016/

  主要挑战是unsupervised learning 无监督学习,2016年大量的研究专注于generative models 生成模型。几大巨头谷歌和脸书分别创新于自然语言处理NLP。

无监督学习

  无监督学习指的是在没有额外信息的新数据中,提取数据模式和结构。以往的经典解决办法是自动编码(autoencoders),主要包含多层感知机(multilayer perceptron MLP):输入和输出具有相同的大小,隐层训练用来覆盖输入。从隐层得到的输出能够用来聚类,降维,提高监督分类甚至是数据压缩。

对抗式网络generative adversarial Networks GANs

  基于生成模型下的新方法:对抗式网络。它能够使模型处理成无监督学习。Yann LeCun认为对抗式网络将会是机器学习未来20年最重要的ideal

  lan Goodfellow在2014年就已经提出了GANs这个概念,然而直到2016年才开始展现它真正的潜力。Deep Convolutional GAN结构能够提高训练技术和更好的结构水平。它能够调和原来神经网络的一些限制,稍后介绍的新应用也会有大幅度的灵活性提高。

The intuitive idea

  GANs有两个网络模型,生成模型generator model G,判别模型discriminatory model D,G生成的结果意图混淆D,使其分不清楚是真实样本还是虚假样本。在GANs中,G 会生成输出,D来判断是否来自于同一个训练集。

  G会产生一定的noise Z,D将会从数据集中获得输入D(x),从G中获得输入D(G(Z)),将其进行分类。D和G同时进行学习,一旦G训练成功,那么G就能产生和训练集有相似特性的新样本。新样本从细节中来看虽然不像原始训练集一样,但是仍然可以捕获到一些具体地方面能够使其看起来似乎来自图片集。

infoGAN

  最近有关于GANs的一些设想已经不仅仅是近似数据分布问题,还有学习可翻译的有用处的数据代表向量。这就是信息对抗式网络。这些向量代表需要有丰富的信息,同时需要可理解。意味着我们可以区别从G模型产生的输出形状转换类型的部分向量。infoGANs模型是由八月的时候openAI研究者所提出来的,果壳中,infoGAN能够从无监督方式中产生数据集的具体信息。例如,应用在MNIST 数据集中的时候,在没有手动标记的数据中,能够推断出旋转数字的类型和产生样本的宽度。

conditional GANs

  GANs的另一个扩展就是转换对抗式网络cGAN,这个模型所产生样本能够有额外信息(分类标签,内容,另一个图片),在使用这个模型能够强化G所产生的输出类型。这个模型已经应用在某些应用中了:

在图片添加文本内容:所产生的图片基于图片中的描述(用CNN或者LSTM来产生解码向量)所作为的额外信息。论文:Generative Adversarial Text to Image Synthesis (Jun 2016).

图片与图片之间的转换:将输入图片和输出图片进行相关映射。论文:Image-to-Image Translation with Conditional Adversarial Nets (Nov 2016).

超分辨率:从网上下载的不太清晰的图片,经过生成器的处理后尽量使得图片能够有比较自然的细节版本,论文:Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network (Nov 2016).

You can check more about generative models in this blog post or in this talk by Ian Goodfellow.

Natural Language Processing  NLP

  为了能够与机器进行流利地交流,首先需要解决以下问题:文本理解,问答,机器转换。

文本理解:JMT建立了一个单一模型,能够学习5大NLP任务。语音部分标记,分词,从属语法解析,语义相关性,文本蕴含。这个模型最大的魅力在于端到端可训练模式。意味着不同层之间可以进行合作,从而在底层任务中提高结果。这是一个突破点:利用高层能力提高底层结果。

问答:新应用模型:Dynamic Coattention Network(DCN)动态共注意网络。是选择在阅读text后再回答问题,还是先看问题再阅读text,如果选择A,则会详细注意text的每一个细节以防后面的问题、DCN做同样的事情,根据文档产生一系列代表问题并且试图做出解答,之后再可能的答案里进行收敛到最终答案。

机器翻译:九月份谷歌提出了一个新模型:Google neural machine translation GNMT,这个模型主要是训练语言翻译对象,比如说中文翻译至英文。能够启动zero-shot translation,零翻译即可以翻译一对并没有训练过的语言。

Community

  机器学习技术能够有利于社区。openAI是一个创建于2015年,将学术与工厂结合的无利润组织。创办动机来源于希望将AI技术能够让更多人的受益,同时避免有AI超级力量的产生。另一个方面,Amazon,deepmind,google,facebook ,IBM,微软。在这个先进公共领域的理解中,需要有支持开放性平台进行讨论。

十大开源工具:

  • TensorFlow by Google.
  • Keras by François Chollet.
  • CNTK by Microsoft.
  • MXNET by Distributed (Deep) Machine Learning Community. Adapted by Amazon.
  • Theano by Université de Montréal.
  • Torch by Ronan Collobert, Koray Kavukcuoglu, Clement Farabet. Widely used by Facebook.

0.读书笔记之The major advancements in Deep Learning in 2016的更多相关文章

  1. (转) The major advancements in Deep Learning in 2016

    The major advancements in Deep Learning in 2016 Pablo Tue, Dec 6, 2016 in MACHINE LEARNING DEEP LEAR ...

  2. [译]2016年深度学习的主要进展(译自:The Major Advancements in Deep Learning in 2016)

    译自:The Major Advancements in Deep Learning in 2016 建议阅读时间:10分钟 https://tryolabs.com/blog/2016/12/06/ ...

  3. 强化学习读书笔记 - 06~07 - 时序差分学习(Temporal-Difference Learning)

    强化学习读书笔记 - 06~07 - 时序差分学习(Temporal-Difference Learning) 学习笔记: Reinforcement Learning: An Introductio ...

  4. 李宏毅机器学习笔记4:Brief Introduction of Deep Learning、Backpropagation(后向传播算法)

    李宏毅老师的机器学习课程和吴恩达老师的机器学习课程都是都是ML和DL非常好的入门资料,在YouTube.网易云课堂.B站都能观看到相应的课程视频,接下来这一系列的博客我都将记录老师上课的笔记以及自己对 ...

  5. <玩转Django2.0>读书笔记:表单

    1. 表单字段 参考: 官方文档 Django表单字段汇总 2. 表单代码示例(forms.Form) # form.py代码 # 获取数据库数据 choices_list = [(i+1,v['ty ...

  6. <玩转Django2.0>读书笔记:模板和模型

    1. 模板内置标签 Django常用内置标签 标签 描述 {% for %} 遍历输出变量的内容 {% if %} 对变量进行条件判断 {% csrf_token %} 生成csrf_token标签, ...

  7. vue2.0读书笔记2-进阶

    一.深入响应式原理 二.过渡效果 三.过渡状态 四.Render函数 五.自定义指令 六.混合 七.插件 八.单文件组件 九.生产环境 十.路由 vue-router: http://router.v ...

  8. <玩转Django2.0>读书笔记:邮件和分页

    1. 发送邮件 # settings.py设置 # 邮箱设置 EMAIL_USE_SSL = True # 邮件服务器 EMAIL_HOST = 'smtp.qq.com' # 邮件服务端口 EMAI ...

  9. <玩转Django2.0>读书笔记:URL规则和视图

    1. 带变量的URL #urls.py from django.urls import path from .view import * urlpatterns = [ path('',index_v ...

随机推荐

  1. asp.net MVC3 无法打开项目文件“E:\我们的项目\Project\HeatingMIS.Web\HeatingMIS.Web.csproj”。此安装不支持该项目类型。

    在vs中打开mvc3项目,虽然装了mvc3,但是还是会遇到莫名其妙的错误,这是我在做开发的时候遇到的一个问题,附带解决方案,和大家分享一下 问题描述:无法打开项目文件“E:\我们的项目\Project ...

  2. 1.多线程-NSThread

    1.在主线程执行多次NSLog模拟耗时操作 结果,卡住主线程 解决方案: performSelectorInBackground让程序在后台执行   2.pthread的使用 开辟子线程,执行一个函数 ...

  3. [JS]jQuery,javascript获得网页的高度和宽度

    [JS]jQuery,javascript获得网页的高度和宽度网页可见区域宽: document.body.clientWidth 网页可见区域高: document.body.clientHeigh ...

  4. 笔记--MySQL相关操作

    一  登录数据库 1 用户无密码: mysql -uroot -p mysql-> 2 用户有密码: MySQL -root -p[passwd] mysql-> 二  创建数据库: 查询 ...

  5. Vmware10如何打开vmware11建立的虚拟机

    先说一下办法: 使用文本工具打开VMware 虚拟机配置文件(*.vmx文件),找到"virtualHW.version"一行,将值11修改为10保存即可. 修改之前: 硬件兼容性 ...

  6. VS2012使用中容易出现的小问题(长期更新,错多少记多少)

    1:各种属性之间一定要有空格!比如id 和 runat中间一定要有,在编译系统里虽然也能显示红色,但是...调试的时候一定会报错!而且这样的错误很难发现(相信我曾经花了半个小时才找出问题) 2:在类中 ...

  7. Android4.0 添加一个新的Android 键值

    这里添加新的键值,不是毫无凭据凭空创造的一个键值,而是根据kernel中检测到的按键值,然后转化为Android所需要的数值: 以添加一个Linux键值为217,把它映射为android的键值Brow ...

  8. 山东省第七届ACM省赛------The Binding of Isaac

    The Binding of Isaac Time Limit: 2000MS Memory limit: 65536K 题目描述 Ok, now I will introduce this game ...

  9. fenxi

    线路:通过定义而来(固定线路可以定义,随机和临时线路怎么来) 订单:线路上点对点的关系 装车单:同意线路上的车辆可以有多个订单组成的装车单 车辆任务:给调度接口输入车辆和订单集合,根据订单产生多个车的 ...

  10. js手风琴

    <!DOCTYPE html><html lang="en"><head>    <meta charset="UTF-8&qu ...