LSTM与Highway-LSTM算法实现的研究概述

zoerywzhou@gmail.com

http://www.cnblogs.com/swje/

作者:Zhouwan

 2015-12-22

 

声明:

1)该LSTM的学习系列是整理自网上很多大牛和机器学习专家所无私奉献的资料的。具体引用的资料请看参考文献。具体的版本声明也参考原文献。

2)本文仅供学术交流,非商用。所以每一部分具体的参考资料并没有详细对应。如果某部分不小心侵犯了大家的利益,还望海涵,并联系博主删除。

3)本人才疏学浅,整理总结的时候难免出错,还望各位前辈不吝指正,谢谢。

请联系:zoerywzhou@gmail.com 或13813017783@163.com

 
本研究课题系本人本科毕业设计,开题报告初步确定,后面会实时更新,希望能与大家相互交流,共同进步!
 
一、研究计划: 
 
1、理解LSTM的基本概念、原理与相关应用
2、剖析LSTM的代码实现
3、理解深度学习中Highway的思想,以及如何在LSTM中实现Highway
4、剖析Highway-LSTM代码
5、选择一个应用,进行验证
 
定期(每隔一月)对算法剖析的进展做总结,目标在3月底,完全掌握LSTM的代码与算法。
 
二、以下为部分学习资料的链接:
 
Github上的资源:
 
 
Basic LSTM by Torch (LUA) https://github.com/karpathy/char-rnn 
 
Highway LSTM by Torch (LUA) https://github.com/yoonkim/lstm-char-cnn 
 
 
LSTM implementation: http://apaszke.github.io/posts.html 
 

部分参考文献:

[High-way-lstm-1]High-way LSTM RNNS FOR Distant Speech Recognition.pdf : 访问密码 510b

[High-way-lstm-2]Character-Aware Neural Language Models.pdf  :访问密码 510b

神经网络课件:NN-Lectures:CSC321 Winter 2015 Introduction to Neural Networks:访问密码 0442

三、我的学习计划如下:

1、2015.12.23、24,28-30;2016.1.3、4(一周时间)————理解LSTM的基本概念、原理与相关应用
  (1)结合NN-lectures课件和以下网址看BP算法,了解其原理:(2015.12.23、24)
 
                                 
      Principles of training multi-layer neural network using backpropagation                                       
  (2)理解LSTM的基本概念、原理:(12.28~31)
 
 
      LSTM implementation: http://apaszke.github.io/posts.html   (译文)    
 
      
      深入浅出LSTM神经网络:http://www.csdn.net/article/2015-06-05/2824880
 
      Learning to read with recurrent neural networks(博士生Zachary Chase Lipton)
 
      顺便理解一下RNN,Andrej Karpathy写了篇非常棒的博客:递归神经网络不可思议的有效性英文原版
 
(3)了解LSTM的应用:(2016.1.3、4)

 目前了解到的LSTM应用大概有以下几个:
 
来自知乎:http://www.zhihu.com/question/37082800/answer/70333603

(1) Language Model
The Unreasonable Effectiveness of Recurrent Neural Networks

(2) Image Captioning
[CVPR15]]Long-term Recurrent Convolutional Networks for Visual Recognition and Description
Deep Visual-Semantic Alignments for Generating Image Descriptions

(3)Speech Recognition

(4)Machine Translation
[NIPS15]Sequence to Sequence Learning with Neural Networks.

 
2、2016.1.5-2016.1.19 ————剖析LSTM的代码实现,动手编程序,并写一篇总结日志,发布到CSDN上:
 
    2016.1.5-2016.1.10 ——Basic LSTM (LUA) https://github.com/wojzaremba/lstm    
       https://github.com/bgshih/crnn
 
       学LUA:(在线学习手册):http://manual.luaer.cn/
        关于LUA闭包的解释:http://www.2cto.com/kf/201503/382691.html
 
    2016.1.11-2016.1.18 ——Basic LSTM by Torch (LUA) https://github.com/karpathy/char-rnn 
 
    2016.1.19 ——写一篇总结日志,发布到CSDN上
 
 *******************************************************************
   

 非学习时间:2016.1.19-2.22寒假回家,暂定每周两天时间看看论文
 {
    2016.1.19寒假回家!
  
    提高time:健身、读书【写读后感】、写日志【完成日志《保研之路》,分享到保研论坛】
 }

 

 *******************************************************************
 
 
3、2016.2.15-2016.2.27 ————理解深度学习中Highway的思想,以及如何在LSTM中实现Highway
 
 
 2016.2.28-2016.2.29 ——写一篇总结日志,发布到CSDN上
 
4、2016.3.1-2016.3.29 ————剖析Highway-LSTM代码
 
  Highway LSTM by Torch (LUA) https://github.com/yoonkim/lstm-char-cnn 
 
 2016.3.30-2016.3.31 ——写一篇总结日志,发布到CSDN上
 
5、2016.4.1-2016.4.30 ————选择一个应用,进行验证
    
 
 先做出来,再看应用吧。。

LSTM与Highway-LSTM算法实现的研究概述的更多相关文章

  1. Highway LSTM 学习笔记

    Highway LSTM 学习笔记 zoerywzhou@gmail.com http://www.cnblogs.com/swje/ 作者:Zhouwan  2016-4-5   声明 1)该Dee ...

  2. 理解LSTM网络--Understanding LSTM Networks(翻译一篇colah's blog)

    colah的一篇讲解LSTM比较好的文章,翻译过来一起学习,原文地址:http://colah.github.io/posts/2015-08-Understanding-LSTMs/ ,Posted ...

  3. LSTM和双向LSTM讲解及实践

    LSTM和双向LSTM讲解及实践 目录 RNN的长期依赖问题LSTM原理讲解双向LSTM原理讲解Keras实现LSTM和双向LSTM 一.RNN的长期依赖问题 在上篇文章中介绍的循环神经网络RNN在训 ...

  4. 使用Keras进行深度学习:(六)LSTM和双向LSTM讲解及实践

    欢迎大家关注我们的网站和系列教程:http://www.tensorflownews.com/,学习更多的机器学习.深度学习的知识! 介绍 长短期记忆(Long Short Term Memory, ...

  5. DNA甲基化研究概述

    DNA甲基化研究概述 生信技能树 已关注 2018.01.23 11:43 字数 993 阅读 183评论 0喜欢 1 DNA甲基化(DNA methylation)是最早被研究的重要表观遗传修饰之一 ...

  6. PaddlePaddle︱开发文档中学习情感分类(CNN、LSTM、双向LSTM)、语义角色标注

    PaddlePaddle出教程啦,教程一部分写的很详细,值得学习. 一期涉及新手入门.识别数字.图像分类.词向量.情感分析.语义角色标注.机器翻译.个性化推荐. 二期会有更多的图像内容. 随便,帮国产 ...

  7. SSE图像算法优化系列二十四: 基于形态学的图像后期抗锯齿算法--MLAA优化研究。

    偶尔看到这样的一个算法,觉得还是蛮有意思的,花了将近10天多的时间研究了下相关代码. 以下为百度的结果:MLAA全称Morphological Antialiasing,意为形态抗锯齿是AMD推出的完 ...

  8. 【uva 1615】Highway(算法效率--贪心 区间选点问题)

    题意:给定平面上N个点和一个值D,要求在x轴上选出尽量少的点,使得对于给定的每个店,都有一个选出的点离它的欧几里德距离不超过D. 解法:先把问题转换成模型,把对平面的点满足条件的点在x轴的直线上可得到 ...

  9. 对A-Star寻路算法的粗略研究

    首先来看看完成后的效果: 其中灰色代表路障,绿色是起点和移动路径,红色代表终点   // = openArray[i+1].F) { minNode = openArray[i+1]; } } sta ...

随机推荐

  1. 如何使用 LINQ 执行插入、修改和删除操作

        本实例实现创建 LINQ To SQL 类对数据库进行插入.修改和删除的操作:以下是 具体步骤: 1 )建立 windows 窗体应用项目文件 2 )选择 ' 项目 \ 添加新项 ' 菜单,在 ...

  2. net-snmp配置文件snmp.conf

    master agentxagentaddress UDP:161sysLocation locationsysContact test@example.comsysName TestsysObjec ...

  3. Django 进阶篇之 Form验证

    Django Form验证 在实际的生产环境中比如登录和验证的时候,我们一般都使用Jquery+ajax来判断用户的输入是否为空,假如JS被禁用的话,咱们这个认证屏障是不是就消失了呢?(虽然一般不会禁 ...

  4. linux切换用户命令

    1. 切换用户的命令为:su +username 2.从普通用户切换到root用户:sudo su 3.退回到原来的用户:exit命令或logout,或者ctrl+d 4.如果要切换到新用户的工作环境 ...

  5. java的服务端与客户端通信(1)

    一.理解socket 1.1什么是socket? socket通常也称作"套接字",用于描述IP地址和端口,是一个通信链的句柄.应用程序通常通过"套接字"向网络 ...

  6. 【HackerRank】Game Of Rotation

    题目连接:Game Of Rotation Mark is an undergraduate student and he is interested in rotation. A conveyor ...

  7. I.MX6Q(TQIMX6Q/TQE9)学习笔记——U-Boot移植

    其实Freescale的BSP移植文档已经将u-boot的移植步骤讲述的非常详细了,但为了以后方便查阅,还是按照自己的理解记录在这里. 获取源码 根据前一篇文章搭建好LTIB环境后就可以非常方便的导出 ...

  8. MongoDB的Find详解(一)

    1.指定返回的键 db.[documentName].find ({条件},{键指定}) 数据准备persons.json var persons = [{name:"jim",a ...

  9. 主攻ASP.NET.4.5.1 MVC5.0之重生:空地搭建一个包含 Ninject框架 项目

    1.创建一个空白解决方案 2.添加一个类库 名称为XXX.Domain 3.添加一个ASP.MVC 名称为XXX.WebUI 4.选着空模版,勾选MVC核心引用 5.添加单元测试项目XXX.UntiT ...

  10. iOS_数据存取(一)

    目录: 一.沙盒机制 二.用户偏好设置 三.归档 一.沙盒机制 每个iOS应⽤都有⾃己的应用沙盒(应⽤沙盒就是⽂件系统⽬录),与其他文件系统隔离.应⽤必须待在⾃己的沙盒⾥,其他应用不能访问该应用沙盒的 ...