cs231n spring 2017 lecture2 Image Classification 听课笔记

1. 相比于传统的人工提取特征（边、角等），深度学习是一种Data-Driven Approach。深度学习有统一的框架，喂不同的数据集，可以训练识别不同的物体。而人工提取特征的方式很脆弱，换一个物体就要重新设计特征。

2. 描述图像之间相似程度，可以直接把每个对应像素做减法，然后把差的绝对值累加起来。这个差值的和越小，图片越接近。这是曼哈顿距离L1。

对应像素点的差值的平方累加再开平方，这是欧几里得距离L2。

L1和L2谁更好，这取决于具体问题。但一般来说，如果做差的向量有很具体的含义，比如对于员工分类，向量的每一个元素可能是“工作年限”、“工资”等，这种用L1会更好一点，因为L1更依赖坐标系。

3. K近领域算法是计算当前图片和所有候选图片的相似程度（或者说距离），最近的K个候选中，最多的那个标签就被作为当前图片的标签。K越大，对噪音越鲁棒（当然，也不是越大越好，会有最佳值）。

这种算法的缺点是：1）预测的复杂度太高，需要和每一个训练数据去比较。2）不鲁邦，测试数据和训练数据必须很像，如果有遮挡、旋转之类的，会误认为差别很大。3）维度问题，数据集必须在整个空间很稠密的分布，需要指数级增加的数据集，维度高的时候就很不现实。

4. Hyperparameter：预先设定的参数，而不是算法学习得到的。比如K近领域算法中的K。这种参数是很依赖具体问题的。如何设置Hyperparameter呢？

　　方案一：在训练集上表现最好的。这个方案是不行的，因为我们在乎的不是在训练集上表现怎么样，而是在乎在没见过的测试集上表现好。或者说方案一并不能保证很好的泛化能力。

　　方案二：把数据集分为训练集和测试集，选在测试集上最好的。这个方案的问题和方案一一样，依旧不能保证很好的泛化能力。

　　方案三：把数据集分为训练集、验证集、测试集，根据验证集上的表现来选择hyperparameter，然后再在测试集上评估。这种方案很好。对于很多hyperparameter的情况，验证集最好也设定的更大一点。　　

　　方案四：把数据集分为n组，交叉验证。随机挑选n-2组用来训练，1组用来验证，1组用来测试。这种方法比较适合小数据集，在深度学习中，由于训练的代价太大，所以用的也不算多这种方案。

5. 深度学习的框架像是拼乐高积木，而线性回归是最基本最好用的最广泛使用的积木。

6. 深度学习的训练过程就是训练出一组参数W，在预测x的时候计算y=f(x,W)，W的每一行都是一个template，对应一个标签，计算出的y是一个向量，每个元素对应一个标签的相似程度，最大的值就对应预测出的标签。深度学习的框架反映在函数f上。

对于线性回归，f就是简单相乘，f(x,W) = Wx。

cs231n spring 2017 lecture2 Image Classification 听课笔记的更多相关文章

cs231n spring 2017 lecture9 CNN Architectures 听课笔记
参考<deeplearning.ai 卷积神经网络 Week 2 听课笔记>. 1. AlexNet(Krizhevsky et al. 2012),8层网络. 学会计算每一层的输出的sh ...
cs231n spring 2017 lecture13 Generative Models 听课笔记
1. 非监督学习监督学习有数据有标签,目的是学习数据和标签之间的映射关系.而无监督学习只有数据,没有标签,目的是学习数据额隐藏结构. 2. 生成模型(Generative Models) 已知训练数 ...
cs231n spring 2017 lecture14 Reinforcement Learning 听课笔记
(没太听明白,下次重新听) 1. 增强学习有一个 Agent 和 Environment 交互.在 t 时刻,Agent 获知状态是 st,做出动作是 at:Environment 一方面给出 Re ...
cs231n spring 2017 lecture2 Image Classification
1. 相比于传统的人工提取特征(边.角等),深度学习是一种Data-Driven Approach.深度学习有统一的框架,喂不同的数据集,可以训练识别不同的物体.而人工提取特征的方式很脆弱,换一个物体 ...
cs231n spring 2017 lecture9 CNN Architectures
参考<deeplearning.ai 卷积神经网络 Week 2 听课笔记>. 1. AlexNet(Krizhevsky et al. 2012),8层网络. 学会计算每一层的输出的sh ...
cs231n spring 2017 lecture11 Detection and Segmentation 听课笔记
1. Semantic Segmentation 把每个像素分类到某个语义. 为了减少运算量,会先降采样再升采样.降采样一般用池化层,升采样有各种"Unpooling"." ...
cs231n spring 2017 lecture7 Training Neural Networks II 听课笔记
1. 优化: 1.1 随机梯度下降法(Stochasitc Gradient Decent, SGD)的问题: 1)对于condition number(Hessian矩阵最大和最小的奇异值的比值)很 ...
cs231n spring 2017 lecture16 Adversarial Examples and Adversarial Training 听课笔记
(没太听明白,以后再听) 1. 如何欺骗神经网络? 这部分研究最开始是想探究神经网络到底是如何工作的.结果人们意外的发现,可以只改变原图一点点,人眼根本看不出变化,但是神经网络会给出完全不同的答案.比 ...
cs231n spring 2017 lecture15 Efficient Methods and Hardware for Deep Learning 听课笔记
1. 深度学习面临的问题: 1)模型越来越大,很难在移动端部署,也很难网络更新. 2)训练时间越来越长,限制了研究人员的产量. 3)耗能太多,硬件成本昂贵. 解决的方法:联合设计算法和硬件. 计算硬件 ...

随机推荐

《python参考手册(第四版)》【PDF】下载
<python参考手册(第四版)>[PDF]下载链接: https://u253469.pipipan.com/fs/253469-230382222 内容介绍本书是权威的Python语 ...
命令行执行php脚本中$argv和$argc
在实际工作中有可能会碰到需要在nginx命令行执行php脚本的时候,当然你可以去配置一个conf用外网访问. 在nginx命令行中使用 php index.php 就可以执行这个index.php脚 ...
bzoj 4538: [Hnoi2016]网络
Description 一个简单的网络系统可以被描述成一棵无根树.每个节点为一个服务器.连接服务器与服务器的数据线则看做一条树边.两个服务器进行数据的交互时,数据会经过连接这两个服务器的路径上的所有服 ...
阿里云ECS升级OpenSSL记录
1.下载OpenSSL wget https://www.openssl.org/source/openssl-1.1.0e.tar.gz 2.解压编译安装 tar xf openssl-1.1.0e ...
lsattr 命令详解
lsattr 作用: 查看文件的第二扩展文件系统属性选项: -a: 列出目录中的全部文件 -E: 显示设备属性的当前值, 从设备数据库中获得 -D: 显示属性的名称, 属性的默认值,描述和用户是否 ...
[解决方案]WebAPI+SwaggerUI部署服务器后，访问一直报错的问题
项目的背景:制作一批接口用来给前台app或者网站提供服务,因为WebApi是最近几年来比较流行和新颖的开发接口的方式,而且又属于轻型应用,所以选用它部署的过程:建立了WebAPI项目并使用Swagg ...
用纯CSS实现的箭头
div+css实现带三角箭头提示框链接:http://www.xuebuyuan.com/160534.html 链接:http://www.admin10000.com/document/4089 ...
MySQL数据库学习: 02 —— 数据库的安装与配置
MySQL安装图解一.MYSQL的安装 1.打开下载的mysql安装文件mysql-5.0.27-win32.zip,双击解压缩,运行“setup. ...
3D轮播切换特效源码
这个3D轮播切换特效是我2017年2月份写的当初我刚接触HTML不久,现在把源码分享给大家源码的注释超级清楚 . <!-- 声明文档类型:html 作用:符合w3c统一标准规范每个浏览器 ...
Go 语言编写单元测试
吾尝终日而思矣,不如须臾之所学也:吾尝跂而望矣,不如登高之博见也.登高而招,臂非加长也,而见者远:顺风而呼,声非加疾也,而闻者彰.假舆马者,非利足也,而致千里:假舟楫者,非能水也,而绝江河.君子生非异 ...

cs231n spring 2017 lecture2 Image Classification 听课笔记

cs231n spring 2017 lecture2 Image Classification 听课笔记的更多相关文章

随机推荐

热门专题