Unsupervised Feature Learning and Deep Learning(UFLDL) Exercise 总结
7.27 暑假开始后,稍有时间,“搞完”金融项目,便开始跑跑 Deep Learning的程序
Hinton 在Nature上文章的代码 跑了3天 也没跑完 后来Debug 把batch 从200改到20 勉强跑出结果
后来开始看 文章等 感觉晕晕乎乎
又翻到:Deep Learning Tutorials 装Theano等,但是python 代码 Debug真是好生恶心
再后来翻到 UFLDL,看着有Exercise 便做了起来。
用了5天刷了9个Exercises。
大概年后吧,在微博上看到 @邓侃 组织翻译 Andrew Ng 执笔的 Deep Learning 系列(UFLDL)
当时 就泼了冷水 那个时候在读 Machine Learning的书 清一色英文 觉得英文不是问题 为什么要翻译呢?
我觉得读书 应该读经典 读好书;国内很多书的内容质量大家都懂的。
学习一个新方向(比如ML/CV/IP等)我的方法是:先找一本中文书(可以是翻译的)熟悉知识的框架/关键字;然后找些经典书籍(多数是英文,偶尔会有不错的中文书)来读,再深入就要 Code 读Paper等;Code也可以在读书的时候进行,我在读PRML的时候,看完一章节,就合上书自己推导/Code,收获很多。
现在来看邓前辈组织的翻译,特别符合我入门DL的需求,而且Ng的Exercise做得很用心,难度不大。
为一开始的不敬,愧疚。向翻译团队致敬!
============================================
1.Sparse Autoencoder
关于Sparse/Low-rank model,看过20多篇计算机视觉的文章,还Code过几个算法。
在Neural Networks中,通过约束隐含层的平均激活度 来实现稀疏
Exercise Result:
展示的是 第一层系数W每一行 reshape成 patch 大小的图像。联想到了EignFaces...
-----------------------------------------------------------------------------------------
2.Vectorization
向量化编程;matlab中for循环很慢,如果在cost函数中包含for循环,那么优化将变得很慢。
一开始我不以为意,没去做这事;在后面的一个Exercise中,程序跑得很慢,便优化了Sparse Autoencoder的代码,去掉了所有for循环,速度提高了8倍左右。
-----------------------------------------------------------------------------------------
3.PCA and Whitening
Whitening部分对我来说虽然较新,却不难;做降维的时候,PCA就是一个主要方法;PCA重建这事自己也探索过;
白化在PRML上看到过,没太留意。图形的预处理还是很重要的。
-----------------------------------------------------------------------------------------
4.Softmax Regression
Logistic Regression 多分类的直接推广。关于这个还有个小故事,曾经以对LR的理解,看出了豆瓣某工程师对SR推导的错误。
MNIST:
这个准确率 跟前段时间 玩Kaggle时用 one-vs-all logistic regression差不多(91.x%)
-----------------------------------------------------------------------------------------
5.Self-Taught Learning
使用5-9的MNIST数据 train 一个 Autoencoder 得到参数W1 b1
reshape W1:
使用W1 b1 来 Extract 0-4的Features
接着使用softmax regression训练一个分类器(偷了个懒 Autoencoder只迭代了200次)
-----------------------------------------------------------------------------------------
6.Implement Deep Learning Networks for Digital Classification
真正意义上构建的的第一个深层网络:前两层用Sparse Autoencoder训练feature I II,最后使用softmax regression对feature II进行分类。
迭代的次数 需要自己设定 所以多少有些出入
-----------------------------------------------------------------------------------------
7.Linear Decoders with Autoencoders
由于sigmoid/tanh函数的取值范围限制,输入数据x也只能在相同范围内
在输出端 使用线性激励函数 就可以克服此问题.
-----------------------------------------------------------------------------------------
8.Convolution and pooling
-----------------------------------------------------------------------------------------
9.Sparse Coding
稀疏模型 不多说了 搞过;咔咔,解析解需要用到矩阵求导 利用trace(AA')求导即可 加入收敛条件
从其提供的代码来看,cost function的第一项重建差 需要除以patch数目,其实这种除可以相应scale lambda gamma达到一样的效果,cosnt*f(x)与f(x)最优解是一致的。
================================================
再次感谢 翻译团队 对母语的理解 还是要比英文顺畅得多
在此之前 只code过一次 Neuron Network,
——做Exercise6的时候,胸口疼了一会,真正在做多层网络啦!
接下来 读一些 readlist 上的文章,丰富Neuron Networks的知识。
Autoencoder知识UF的一种...
Unsupervised Feature Learning and Deep Learning(UFLDL) Exercise 总结的更多相关文章
- UFLDL(Unsupervised Feature Learning and Deep Learning)
UFLDL(Unsupervised Feature Learning and Deep Learning)Tutorial 是由 Stanford 大学的 Andrew Ng 教授及其团队编写的一套 ...
- paper 124:【转载】无监督特征学习——Unsupervised feature learning and deep learning
来源:http://blog.csdn.net/abcjennifer/article/details/7804962 无监督学习近年来很热,先后应用于computer vision, audio c ...
- 转:无监督特征学习——Unsupervised feature learning and deep learning
http://blog.csdn.net/abcjennifer/article/details/7804962 无监督学习近年来很热,先后应用于computer vision, audio clas ...
- [转] 无监督特征学习——Unsupervised feature learning and deep learning
from:http://blog.csdn.net/abcjennifer/article/details/7804962 无监督学习近年来很热,先后应用于computer vision, audio ...
- A Gentle Introduction to Transfer Learning for Deep Learning | 迁移学习
by Jason Brownlee on December 20, 2017 in Better Deep Learning Transfer learning is a machine learni ...
- deep learning 以及deep learning 常用模型和方法
首先为什么会有Deep learning,我们得到一个结论就是Deep learning需要多层来获得更抽象的特征表达. 1.Deep learning与Neural Network 深度学习是机器学 ...
- 应该如何入门deep learning呢?从UFLDL开始!
抱歉,大家,这里不是要分享如何学习deep learning,而是想要记录自己学习deep learning的小历程,算是给自己的一点小动力吧,希望各位业内前辈能够多多指教! 看到有网友提到,Andr ...
- 转:UFLDL_Tutorial 笔记(deep learning绝佳的入门资料 )
http://blog.csdn.net/dinosoft/article/details/50103503 推荐一个deep learning绝佳的入门资料 * UFLDL(Unsupervised ...
- Deep Learning(深度学习)学习笔记整理
申明:本文非笔者原创,原文转载自:http://www.sigvc.org/bbs/thread-2187-1-3.html 4.2.初级(浅层)特征表示 既然像素级的特征表示方法没有作用,那怎样的表 ...
随机推荐
- ThinkPHP中视图模型详解.
很多TP的新手对于模型中的视图模型不甚了解,官方虽然有详细手册,但是对于初学者来说还是比较难以理解! 先简单说一下视图模型所能实现的功能,基本就是主表与副表之间各个字段的关联问题,实现多表关联查询,相 ...
- HDU4535+公式
错排公式. 用64位! /* */ #include<stdio.h> #include<string.h> #include<stdlib.h> #include ...
- [杂题]CSUOJ1274Balls and Boxes
题目链接 题意:中文题 题意不多赘述 值得注意的是n<m 不必考虑n==m的情况 (m是盒子个数, n是每次选取的盒子个数, 不要弄反了!) 这题一看就是同余方程 每次选取n个盒子放球 也就是说 ...
- Ember.js demo2
<!DOCTYPE html> <html> <head> <script src="http://code.jquery.com/jquery-1 ...
- 做最好的自己(Be Your Personal Best)
成功——做最好的自己 价值观——成功源于诚信 积极主动——成功的选择在于自己 同理心——人际交往的基础 自信——用信心放飞自我 自省——在反思中走向成功 勇气——勇往直前的精神 胸怀——海纳百川的境界 ...
- bzoj1007
其实吧,就是一个半平面交,而且不用考虑转回来的情况,所以只要极角排序然后用栈即可给的是点斜式,比极角很方便至于完整版的半平面交还没写过,看到再说吧 ..] of longint; v:..] of b ...
- 对easyUI中课堂源码编辑改进建议
在孙宇老师讲得Easyui第10讲完后,基本的增删该查做出来了,但是编辑存在一个问题:行内样式编辑修改,如果当用户没有修改数据,孙宇老师讲得时候直接return,这样做是不合理的:第二次再使用右键编辑 ...
- c#调用带有安全认证的java webservice
最近使用c#调用另外一个同事写的java webservice耽误了很多时间,网上资料不太完整,走了很多弯路,希望对大家有帮助. 基本思路是1.拼装soap使用http post ,主要将验证身份信息 ...
- 在Eclipse中使用Github(EGit)
安装配置EGit 1. 安装Windows版的Git,登陆Github账号,登陆成功后会自动在本地和Github配置好密钥 2. 在Eclipse中安装EGit,地址http://download.e ...
- LightOJ 1245 Harmonic Number (II) 水题
分析:一段区间的整数除法得到的结果肯定是相等的,然后找就行了,每次是循环一段区间,暴力 #include <cstdio> #include <iostream> #inclu ...