lesson3 overfitting -fastai

VGG:3*3
Imagenet：7*7,9*9
论文中证明3*3更胜一筹，但是用多少并没有定论
微调：删掉模型的中间
只对最后一层微调：model.pop，就删掉了最后一层

如何决定训练多少层？：·看论文上的可视化结构，清楚每一层的语义层次，哪一层的语义操作和自己的模型相关 ·试验

欠拟合：使用的模型不够复杂不够强大到能完成你的任务或者没有足够的参数；
过拟合：参数太多，训练时间太长，训练集上的准确率远远高于测试集和验证集，意味着模型变得过分严格的识别训练集上的内容

如何把vgg的权重加到去掉dropout的vgg模型中？：return 二分之一的权重~没有dropout但相当于dropout

卷积层是进行计算的地方，dense layer是内存所在地

避免过拟合但是不删除重要信息：1增加更多数据 2数据扩增 3使用更多泛化结构 4正则化，如dropout，L2正则化
---》由于数据扩增，我们不能进行任何的与计算，因此需要重新计算卷积层而耗费时间
---》何时需要数据扩增？比如猫狗，不需要上下反转，因为从来没有看到过倒立着的猫狗；但是可以旋转、resize，因为由于拍摄方式不同，可以得到这些图片
---》对图片变为黑白算是一种扩增吗？：不，因为kaggle的图片就是彩色的，颜色也是一种重要信息，去掉了颜色，就把判断过程复杂化了
---》可以在输入图片处dropout吗？：简单的说是ok的，但是删除模型信息和删除输入信息是不同的，前者可以有效避免过拟合，后面会丢失信息

建立batches：使用数据生成器image.ImageDtaGenerator

验证集没有数据增加和变动，是持续固定的：因为它是检查的标准

batch normalnization：数值-均值/标准差，给数值不同的权重，对loss的影响也很不同；当输入数值差距很大时，特别是使用softmax，会让朕个模型变得很脆弱，意味着很难学会获得最好的权重组
---》总是需要标准化输入信息
---》实际情况中，不仅要标准化输入值，也要标准化激活值（但是不仅仅是-均值/标准差，因为这样简单的操作并不会起作用，SGD是很难对付的，如果它想要提高某个权重，但是你想通过-均值/标准差来对抗它，那么SGD又会重新提高该权重
---》采用bacthnorm：（1）快十倍，因为一般会使用高10倍的学习率（2)能够在不需要删除任何模型信息的情况下，减少过拟合
---》batchnorm的实现：像标准化输入层一样标准化中间层，同时增加了两个可训练的参数，其中v一个参数乘以所有的激活值，另一个参数和所有的激活值相加；这两个参数也会融合到梯度计算中，因此现在模型知道它能够重新调整所有权重（在不需要把任何一个权重删除的情况下）
从而有效的控制权重 ~ 放在dense layers之后，当作用于卷积层时，需要BatchNormalization（axis=1）

np.expand_dims：keras卷积操作中，希望又一定量的通道，所以对于灰度图的输入，需要要用~来加入empty dimension
Flatten（）：讲输入的图片转化为向量
epoch=1，学习率设为0.1，epoch=2，学习率设为0.01，即epoch增长的同时，降低学习率；在每个epoch的多个batch中，观察知道出现过拟合时停止学习率的减小

Ensembing（集合）：建立多个版本的模型然后把他们组合起来，来提高每个模型的性能 -- 即把不同学习率的model组合，最后return model
同一个model可以获取6个：相同的方式进行训练，但是以不同的随机起点开始
---》all_preds.shape为（6，10000，10），即10000个输入测试图片，10个输出，6个model
---》all_preds.mean就是找出不同model的错误点，计算平均值

lesson3 overfitting -fastai的更多相关文章

局部加权回归、欠拟合、过拟合（Locally Weighted Linear Regression、Underfitting、Overfitting）
欠拟合.过拟合如下图中三个拟合模型.第一个是一个线性模型,对训练数据拟合不够好,损失函数取值较大.如图中第二个模型,如果我们在线性模型上加一个新特征项,拟合结果就会好一些.图中第三个是一个包含5阶多 ...
11 Clever Methods of Overfitting and how to avoid them
11 Clever Methods of Overfitting and how to avoid them Overfitting is the bane of Data Science in th ...
overfitting过拟合
来自:https://www.zhihu.com/question/32246256 其实不完全是噪声和假规律会造成过拟合. (1)打个形象的比方,给一群天鹅让机器来学习天鹅的特征,经过训练后,知道了 ...
over-fitting、under-fitting 与 regularization
机器学习中一个重要的话题便是模型的泛化能力,泛化能力强的模型才是好模型,对于训练好的模型,若在训练集表现差,不必说在测试集表现同样会很差,这可能是欠拟合导致:若模型在训练集表现非常好,却在测试集上差强 ...
过拟合(Overfitting)和正规化(Regularization)
过拟合: Overfitting就是指Ein(在训练集上的错误率)变小,Eout(在整个数据集上的错误率)变大的过程 Underfitting是指Ein和Eout都变大的过程从上边这个图中,虚线的左 ...
过度拟合（overfitting）
我们之前解决过一个理论问题:机器学习能不能起作用?现在来解决另一个理论问题:过度拟合. 正如之前我们看到的,很多时候我们必须进行nonlinear transform.但是我们又无法确定Q的值.Q过小 ...
lesson3:使用java代码的方式对不能识别的协议进行压力测试
在我们的实际环境中,我们所使用的协议肯定不只是http的方式,对于rpc等调用协议,目前jmeter没有相应的sampler支持,这时就需要通过引入我们自己写的jar包的方式来解决这个问题.例如:当我 ...
overfitting
当模型复杂度上升时,可控制参数变多,VC dimension变大, 当VC dimension过大时,虽然Ein很小,但是Eout很大,产生overfitting 比喻:开车开太快 ...
Overfitting&Underfitting Problems
这次根据结合Google的翻译果然速度快上许多,暂时休息,晚上在传一个exm2的随笔. 关于过度拟合下的问题考虑从x∈R预测y的问题,下面的最左边的图显示了将\(y=\theta_0+\theta_ ...

随机推荐

运维相关 docker
linux下top命令参数详解
top命令是Linux下常用的性能分析工具,能够实时显示系统中各个进程的资源占用状况,类似于Windows的任务管理器.下面详细介绍它的使用方法. 内存信息.内容如下: Mem: 191272k to ...
Spring Boot + Spring Cloud 实现权限管理系统（集成 Shiro 框架）
Apache Shiro 优势特点它是一个功能强大.灵活的,优秀开源的安全框架. 它可以处理身份验证.授权.企业会话管理和加密. 它易于使用和理解,相比Spring Security入门门槛低. 主 ...
bzoj1239
题解: 首先计算出两两之间的距离然后二分答案然后贪心判断是否可以放置少于等于k个代码: #include<bits/stdc++.h> using namespace std; ; ...
zookeeper：springboot+dubbo配置zk集群并测试
1.springboot配置zk集群 1.1:非主从配置方法 dubbo: registry: protocol: zookeeper address: ,, check: false 1.2:主从配 ...
flask项目结构（四）使用sqlalchemy和alembic
简介其实我不是啥正经人,错了,不是啥正经程序员,所能想到的估计也就码农一级吧,高级程序员,搞什么算法,什么人工智能,大数据计算…………离我还太遥远. 但是这并不妨碍我继续学习,继续写垃圾小程序. 反 ...
react全家桶-路由
/src目录下新增一个pages目录,用于存放渲染页面的组件在/src/pages中新增一个Add.js文件 /src 下的index.js 路由:import React from 'react' ...
Java集合排序方法comparable和comparator的总结
一.概述Comparable和Comparator都是用来实现集合中元素的比较.排序的.Comparable是在集合内部定义的方法实现的排序,位于java.lang下.Comparator是在集合外部 ...
二：通过VirtualBox+Vagrant创建一个centos的虚拟机：
官网安装VirtualBox及Vagrant. 下载centos7,添加到vagrant中. http://e-proxy.yfb.sunline.cn/download/vagrant/centos ...
day 31 udp 协议SOCK_DGRAM
udp 服务端引用socket=类型,协议绑定地址和端口while 循环收到 data addr = 服务.recvfrom(1024)发送服务.sendto(data,addr(ip 端口)) ...

lesson3 overfitting -fastai

lesson3 overfitting -fastai的更多相关文章

随机推荐

热门专题