引言:

  深度学习的本质是用多层的神经网络找到一个可以被学习的复杂的函数实现语音识别,图像识别等功能。

  多层神经网络的结构:

    多层神经元的组成,每一层的输入都等于上一层的输出。

  应用领域:cv,nlp

监督学习:

  需要计算一个目标函数来测量出实际输出与预计输出之间的误差(距离),机器通过修改其参数来减小误差(距离)(反向传播的过程),这些参数称为权重,可以看作定义输出与输出之间关系的旋钮。一般利用梯度下降算法来实现反向传播。梯度下降:可以形象的比作为一个人从山顶下到山谷的过程,不断的往梯度最大反方向(最陡峭的方向)走一步,最后到达山谷。在这个过程中有可能到达局部最小值,有相应的算法解决该问题。

 反向传播算法:

在每个隐藏层计算每个单元输出的误差导数,从输出层的误差开始,将每层的误差乘以该神经元函数的梯度一直传递到输入层。

链式法则:

卷积神经网络:

卷积神经网络的过程:

1.预处理的数据加偏置用于卷积的计算(卷积核遍历)

2.将得到的结果通过非线性激活函数的处理(如Relu激活函数)

3.池化操作(取平均值或最大值,以保留显著特征,提升模型对畸变的容忍能力)

4.全连接

cnn的优势:大量减少参数,增加效率,减小计算复杂度

 分布表示和语言模型:

1-of-N Encoding:词典中词的位置表示词的含义(维度可能较大)

Word Embedding:将词转换到向量空间,向量空间中距离较近的位置词的含义相似

Sentence Embedding相当于Word Embedding的升级版,原理与其类似

循环神经网络:

特点:RNN在每个时间点链接参数值,参数只有一份;神经网络除了输出以外,还会建立在以前的‘记忆’的基础上;内存的要求与输入的规模有关;带有存储功能的神经网络

LSTM(Long Short-term Memory):

一种特殊的RNN,比普通的RNN有更好的表现,能处理更长的序列,主要解决长序列问题中梯度消失或者梯度爆炸的问题。

强化学习:

GAN(生成对抗网络):

自监督学习:

1

Deep Learning ——Yann LeCun,Yoshua Bengio&Geoffrey Hinton的更多相关文章

  1. 论文笔记(1):Deep Learning.

    论文笔记1:Deep Learning         2015年,深度学习三位大牛(Yann LeCun,Yoshua Bengio & Geoffrey Hinton),合作在Nature ...

  2. 【深度学习Deep Learning】资料大全

    最近在学深度学习相关的东西,在网上搜集到了一些不错的资料,现在汇总一下: Free Online Books  by Yoshua Bengio, Ian Goodfellow and Aaron C ...

  3. 机器学习(Machine Learning)&深度学习(Deep Learning)资料【转】

    转自:机器学习(Machine Learning)&深度学习(Deep Learning)资料 <Brief History of Machine Learning> 介绍:这是一 ...

  4. 机器学习(Machine Learning)&深度学习(Deep Learning)资料(Chapter 2)

    ##机器学习(Machine Learning)&深度学习(Deep Learning)资料(Chapter 2)---#####注:机器学习资料[篇目一](https://github.co ...

  5. 转:Deep learning系列(十五)有监督和无监督训练

    http://m.blog.csdn.net/article/details?id=49591213 1. 前言 在学习深度学习的过程中,主要参考了四份资料: 台湾大学的机器学习技法公开课: Andr ...

  6. 机器学习(Machine Learning)&深度学习(Deep Learning)资料汇总 (上)

    转载:http://dataunion.org/8463.html?utm_source=tuicool&utm_medium=referral <Brief History of Ma ...

  7. 机器学习(Machine Learning)与深度学习(Deep Learning)资料汇总

    <Brief History of Machine Learning> 介绍:这是一篇介绍机器学习历史的文章,介绍很全面,从感知机.神经网络.决策树.SVM.Adaboost到随机森林.D ...

  8. Yann LeCun清华演讲:深度学习与人工智能的未来

    2017年3月22日下午,Facebook人工智能研究院院长.纽约大学终身教授Yann LeCun在清华大学大礼堂为校内师生以及慕名而来的业内人士呈现了一场主题为<深度学习与人工智能的未来(De ...

  9. Deep Learning论文翻译(Nature Deep Review)

    原论文出处:https://www.nature.com/articles/nature14539 by Yann LeCun, Yoshua Bengio & Geoffrey Hinton ...

随机推荐

  1. BZOJ 3884 上帝与集合的正确用法题解

    一道智慧题 其实解这题需要用到扩展欧拉定理, 有了上面的公式,我们不难看出此题的解法. 设b为2^2^2^2^2.....显然,b要比φ(p)要大,所以可以直接套公式 modp时的答案 ans(p)= ...

  2. C++模板编译模型

    一:传统的编译模型 使用C/C++进行编程时,一般会使用头文件以使定义和声明分离,并使得程序以模块方式组织.将函数声明.类的定义放在头文件中,而将函数实现以及类成员函数的定义放在独立的文件中. 但是对 ...

  3. Spark in action on Kubernetes - 存储篇(一)

    前言 在上篇文章中,我们分析了Spark Operator内部的机制,今天我们会讨论一个在大数据领域中最重要的话题 - 存储.大数据已经无声无息的融入了每个人的生活中.大到旅游买房,小到外卖打车,都可 ...

  4. nginx设置301永久重定向

    https://blog.csdn.net/wzqzhq/article/details/53376501 比如说我的域名有多个,一个主域名www.zq110.com,多个次域名:www.aaa.co ...

  5. shell学习(16)- 压缩和解压缩命令tar和zip

    tar命令 [root@Linux ~]# tar [-cxtzjvfpPN] 文件与目录 .... 参数: -c :建立一个压缩文件的参数指令(create 的意思): -x :解开一个压缩文件的参 ...

  6. MyBatis动态批量插入、更新Mysql数据库的通用实现方案

    一.业务背景 由于需要从A数据库提取大量数据同步到B系统,采用了tomikos+jta进行分布式事务管理,先将系统数据源切换到数据提供方,将需要同步的数据查询出来,然后再将系统数据源切换到数据接收方, ...

  7. AtCoder Beginner Contest 078 C HSI

    虽说这是个水题,但是我做了大概有一个小时吧,才找到规律,刚学概率,还不大会做题. 找到规律后,又想了想,才想到推导过程. 思路:想要知道花费的时间,就要知道提交的次数,我在这里是计算的提交次数的期望, ...

  8. NOIP2007 树网的核 && [BZOJ2282][Sdoi2011]消防

    NOIP2007 树网的核 树的直径的最长性是一个很有用的概念,可能对一些题都帮助. 树的直径给定一棵树,树中每条边都有一个权值,树中两点之间的距离定义为连接两点的路径边权之和.树中最远的两个节点之间 ...

  9. Python中的生成器(generator)

    生成器: 在函数内部包含yield关键字,那么该函数执行的结果就是生成器(生成器即是迭代器) yield的功能:1.把函数的执行结果做成迭代器(帮函数封装好__iter__(),__next__()方 ...

  10. spring boot与activiti集成实战 转

    为什么80%的码农都做不了架构师?>>> 这是原作者的博客地址 http://wiselyman.iteye.com/blog/2285223 代码格式混乱,我修正了一下.项目源码在 ...