cs231n spring 2017 lecture2 Image Classification

1. 相比于传统的人工提取特征（边、角等），深度学习是一种Data-Driven Approach。深度学习有统一的框架，喂不同的数据集，可以训练识别不同的物体。而人工提取特征的方式很脆弱，换一个物体就要重新设计特征。

2. 描述图像之间相似程度，可以直接把每个对应像素做减法，然后把差的绝对值累加起来。这个差值的和越小，图片越接近。这是曼哈顿距离L1。

对应像素点的差值的平方累加再开平方，这是欧几里得距离L2。

L1和L2谁更好，这取决于具体问题。但一般来说，如果做差的向量有很具体的含义，比如对于员工分类，向量的每一个元素可能是“工作年限”、“工资”等，这种用L1会更好一点，因为L1更依赖坐标系。

3. K近领域算法是计算当前图片和所有候选图片的相似程度（或者说距离），最近的K个候选中，最多的那个标签就被作为当前图片的标签。K越大，对噪音越鲁棒（当然，也不是越大越好，会有最佳值）。

这种算法的缺点是：1）预测的复杂度太高，需要和每一个训练数据去比较。2）不鲁邦，测试数据和训练数据必须很像，如果有遮挡、旋转之类的，会误认为差别很大。3）维度问题，数据集必须在整个空间很稠密的分布，需要指数级增加的数据集，维度高的时候就很不现实。

4. Hyperparameter：预先设定的参数，而不是算法学习得到的。比如K近领域算法中的K。这种参数是很依赖具体问题的。如何设置Hyperparameter呢？

　　方案一：在训练集上表现最好的。这个方案是不行的，因为我们在乎的不是在训练集上表现怎么样，而是在乎在没见过的测试集上表现好。或者说方案一并不能保证很好的泛化能力。

　　方案二：把数据集分为训练集和测试集，选在测试集上最好的。这个方案的问题和方案一一样，依旧不能保证很好的泛化能力。

　　方案三：把数据集分为训练集、验证集、测试集，根据验证集上的表现来选择hyperparameter，然后再在测试集上评估。这种方案很好。对于很多hyperparameter的情况，验证集最好也设定的更大一点。　　

　　方案四：把数据集分为n组，交叉验证。随机挑选n-2组用来训练，1组用来验证，1组用来测试。这种方法比较适合小数据集，在深度学习中，由于训练的代价太大，所以用的也不算多这种方案。

5. 深度学习的框架像是拼乐高积木，而线性回归是最基本最好用的最广泛使用的积木。

6. 深度学习的训练过程就是训练出一组参数W，在预测x的时候计算y=f(x,W)，W的每一行都是一个template，对应一个标签，计算出的y是一个向量，每个元素对应一个标签的相似程度，最大的值就对应预测出的标签。深度学习的框架反映在函数f上。

对于线性回归，f就是简单相乘，f(x,W) = Wx。

cs231n spring 2017 lecture2 Image Classification的更多相关文章

cs231n spring 2017 lecture2 Image Classification 听课笔记
1. 相比于传统的人工提取特征(边.角等),深度学习是一种Data-Driven Approach.深度学习有统一的框架,喂不同的数据集,可以训练识别不同的物体.而人工提取特征的方式很脆弱,换一个物体 ...
cs231n spring 2017 lecture11 Detection and Segmentation 听课笔记
1. Semantic Segmentation 把每个像素分类到某个语义. 为了减少运算量,会先降采样再升采样.降采样一般用池化层,升采样有各种"Unpooling"." ...
cs231n spring 2017 lecture11 Detection and Segmentation
1. Semantic Segmentation 把每个像素分类到某个语义. 为了减少运算量,会先降采样再升采样.降采样一般用池化层,升采样有各种“Unpooling”.“Transpose Conv ...
cs231n spring 2017 lecture13 Generative Models 听课笔记
1. 非监督学习监督学习有数据有标签,目的是学习数据和标签之间的映射关系.而无监督学习只有数据,没有标签,目的是学习数据额隐藏结构. 2. 生成模型(Generative Models) 已知训练数 ...
cs231n spring 2017 lecture9 CNN Architectures 听课笔记
参考<deeplearning.ai 卷积神经网络 Week 2 听课笔记>. 1. AlexNet(Krizhevsky et al. 2012),8层网络. 学会计算每一层的输出的sh ...
cs231n spring 2017 lecture7 Training Neural Networks II 听课笔记
1. 优化: 1.1 随机梯度下降法(Stochasitc Gradient Decent, SGD)的问题: 1)对于condition number(Hessian矩阵最大和最小的奇异值的比值)很 ...
cs231n spring 2017 Python/Numpy基础 (1)
本文使根据CS231n的讲义整理而成(http://cs231n.github.io/python-numpy-tutorial/),以下内容基于Python3. 1. 基本数据类型:可以用 prin ...
cs231n spring 2017 lecture13 Generative Models
1. 非监督学习监督学习有数据有标签,目的是学习数据和标签之间的映射关系.而无监督学习只有数据,没有标签,目的是学习数据额隐藏结构. 2. 生成模型(Generative Models) 已知训练数 ...
cs231n spring 2017 lecture9 CNN Architectures
参考<deeplearning.ai 卷积神经网络 Week 2 听课笔记>. 1. AlexNet(Krizhevsky et al. 2012),8层网络. 学会计算每一层的输出的sh ...

随机推荐

python对数组缺失值进行填充
1. 两个常用的函数 1.1 np.nonzero() np.nonzero()函数返回数组中不为False(0)的元素对应的索引 a = np.array([1,2,0,3,1,0]) print( ...
腾讯一shell试题.
腾讯一shell试题. 假设qq.tel文件内容: 12334:13510014336 12345:12334555666 12334:12343453453 12099:13598989899 12 ...
sklearn 模型评估
原文链接 http://d0evi1.com/sklearn/model_evaluation/ 预测值:pred 真实值:y_test #### 直接用平均值 ``` mean(pred == y_ ...
vscode显示当前文件完整路径信息
Code->Preferences->Settings 搜索window.title 原本是activeEditorShort,修改 activeEditorShort => act ...
image compression with libjpeg
http://www.aaronmr.com/en/2010/03/test/ Working on the project I've seen in the need for compression ...
开启新项目时启动tomcat的一个小问题
Application context 这里为啥只有是空的,才能正常启动tomcat?
android studio 修改新建EmptyActivity默认布局
https://www.jianshu.com/p/d4f201135097 打开你的Android Sudio安装目录,我的为D:\Program Files\Android\Android Stu ...
curl命令简介
curl 文件传输工具参数: -c --cokie-jar: 将cookie写入到文件 -b --cokie: 从文件中读取cookie -C --continue-at: 断点续传 -d --da ...
LGOJ3747 六省联考2017 分手是祝愿
这两天遇到不少这种"人类智慧题"了,感觉都是很巧妙的 Description link 现在有 \(n\) 盏灯,设每一次操作控制第 \(i\) 占灯,而改变状态的灯就是 \(i\ ...
使用pycharm遇到问题排查过程
一.安装Python 下载路径:https://www.python.org/downloads/ 二.配置环境变量安装Python后,配置环境变量,将安装目录添加到Path中: 使用pycharm ...

cs231n spring 2017 lecture2 Image Classification

cs231n spring 2017 lecture2 Image Classification的更多相关文章

随机推荐

热门专题