cv学习总结(11.6-11.13)
两层全连接神经网络的内容要比想象中的多很多,代码量也很多,在cs231n只用了15分钟讲解的东西我用了一周半的时间才完全的消化理解,这周终于完成了全连接神经网络博客的书写https://www.cnblogs.com/Lbmttw/p/16858127.html,两层全连接神经网络的结构是输入层-----隐藏层-----激活函数层-----输出层,其实本质我们要寻求的东西是一样的,都是要寻找分数函数,并且要求损失函数最小,不过我们原本是将整个输入层经过一层处理得到分数函数,不过在神经网络中,我们要经过多层,在后面的卷积神经网络中甚至还有卷积层和池化层;多了隐藏层相当于我们多处理了图像中的特点,隐藏层多了相当于学习能力变强了,隐藏层中节点的个数可以看做学习到的特征的数量。所以在经过一个两层全连接神经网络后我们的模型学习能力变强,准确率相应的也会升高。在两层全连接网络中,分类任务的准确率提高到了50%左右。
全连接网络的训练速度特别缓慢,我在Google drive上枚举寻找最优参数的过程中用时将近3个小时才找到最优的参数,训练出一个最优的模型,但是这个模型仍然存在过拟合的问题,减小过拟合可以通过增大正则项,减少隐藏层的神经元个数来实现,显然,减小神经元的个数相当于降低了机器的学习能力,也就能避免过拟合,但是一定要注意,如果隐藏层的数目过小可能会导致学习能力过低从而测试集准确率反而下降的现象,所以如何设定隐藏层的神经元个数值得我们商榷。
本周的困难主要出在对于神经网络这一模型的认知上,我之前始终不明白神经网络模型弄了那么多层是在干什么,每一层具体的物理意义是什么,在听完CNN的课后忽然就有一点明白了,本质都是一样的,在寻求分数函数并且损失函数最小化进而通过每一个类的分数来确定测试集到底属于哪一类,将所有性质一窝蜂似的大杂烩显然不能很好的学习模型的特性,相反的,通过不同层之间相互的映射,便可以逐层学习到模型不一样的特征,包括接下来要弄的CNN中的卷积层也是同样的道理,卷积核不断的移动,得到不同局部的性质,然后再通过局部性质合成成整张照片。目前的进度稍稍有点慢了,但是是我有意为之,神经网络的博客的工作量赶得上之前所有博客之和还要多,所以为了让自己理解明白并且能说明白这件事情,还是用了很多的心思的。下一周的任务是卷积神经网络的实现以及NeRF(神经辐射场)的综述部分,打算好好写一下综述,并且想要投一下试试看,亲身体验一下投paper的感觉。
cv学习总结(11.6-11.13)的更多相关文章
- c++学习书籍推荐《深入理解C++11 C++11新特性解析与应用》下载
百度云及其他网盘下载地址:点我 编辑推荐 <深入理解C++11:C++11新特性解析与应用>编辑推荐:C++标准委员会成员和IBM XL编译器中国开发团队共同撰写,权威性毋庸置疑.系统.深 ...
- Kafka 学习笔记之 Kafka0.11之console-producer/console-consumer
Kafka 学习笔记之 Kafka0.11之console-producer/console-consumer: 启动Zookeeper 启动Kafka0.11 创建一个新的Topic: ./kafk ...
- Qt 学习之路 2(13):对话框简介
Qt 学习之路 2(13):对话框简介 豆子 2012年9月14日 Qt 学习之路 2 53条评论 对话框是 GUI 程序中不可或缺的组成部分.很多不能或者不适合放入主窗口的功能组件都必须放在 ...
- [源码解析] 深度学习分布式训练框架 horovod (13) --- 弹性训练之 Driver
[源码解析] 深度学习分布式训练框架 horovod (13) --- 弹性训练之 Driver 目录 [源码解析] 深度学习分布式训练框架 horovod (13) --- 弹性训练之 Driver ...
- 2016年11月11日 星期五 --出埃及记 Exodus 20:2
2016年11月11日 星期五 --出埃及记 Exodus 20:2 "I am the LORD your God, who brought you out of Egypt, out o ...
- System.Thread.TImer控件——http://www.360doc.com/content/11/0812/11/1039473_139824496.shtml
http://www.360doc.com/content/11/0812/11/1039473_139824496.shtml
- Ubuntu 10.10, 11.04, 11.10这三个版本无法从优盘启动
问题:Ubuntu 10.10, 11.04, 11.10这三个版本无法从优盘启动 解决:从U盘启动安装的时候,会卡住不动.搞定办法相当简单,修改syslinux/syslinuxfg文件:将defa ...
- iOS 11.2 - 11.3.1 越狱教程
iOS 11.2 - 11.3.1 越狱教程 一.准备相应的工具 (1) 下载 CydiaImpactor,官网地址是 http://cydiaImpactor.com (2) 下载 Electra, ...
- 201771010126 王燕《面向对象程序设计(Java)》第十四周学习总结(测试程序11)
实验十四 Swing图形界面组件 理论部分: 不使用布局管理器 有时候可能不想使用任何布局管理器,而只 是想把组件放在一个固定的位置上.下面是将一 个组件定位到某个绝对定位的步骤: 1)将布局管理器 ...
- (原+转)ubuntu16中安装opencv2.4.11(2.4.13)
转载请注明出处: http://www.cnblogs.com/darkknightzh/p/5638117.html 参考网址: http://www.cnblogs.com/jeakon/arch ...
随机推荐
- 某大厂面试题:说一说Java、Spring、Dubbo三者SPI机制的原理和区别
大家好,我是三友~~ 今天来跟大家聊一聊Java.Spring.Dubbo三者SPI机制的原理和区别. 其实我之前写过一篇类似的文章,但是这篇文章主要是剖析dubbo的SPI机制的源码,中间只是简单地 ...
- Hugging News #0317: ChatGLM 会成为 HF 趋势榜的第一名吗?
每一周,我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新,包括我们的产品和平台更新.社区活动.学习资源和内容更新.开源库和模型更新等,我们将其称之为「Hugging Ne ...
- Salesforce LWC学习(十二) Dependence Picklist实现
本篇可参看: Salesforce LWC学习(六) @salesforce & lightning/ui*Api Reference salesforce零基础学习(八十七)Apex 中Pi ...
- Learning with Mini-Batch
在机器学习中,学习的目标是选择期望风险\(R_{exp}\)(expected loss)最小的模型,但在实际情况下,我们不知道数据的真实分布(包含已知样本和训练样本),仅知道训练集上的数据分布.因此 ...
- Python学习之爬虫
又被老师要求去搞Python ,曰,,下午回顾了一下Python的基础知识,写了个爬取图片的程序,在此做个分享吧.不喜勿喷 import requests import time from bs4 i ...
- STL常用容器用法总结
vector 变长数组,倍增的思想 size() 返回元素个数 empty() 返回是否为空 clear() 清空 front()/back() push_back()/pop_back() begi ...
- Go语言:通过TDD驱动测试开发为同事写的程序优化提速——初次接触并发与channel
正文: 假如同事已经写了一个 CheckWebsites 的函数检查 URL 列表的状态. package concurrency type WebsiteChecker func(string) b ...
- ACM-刷题记录-14届NEFU校赛
P2031凯撒密码 #include<bits/stdc++.h> using namespace std; int main(){ string s; int d; while(cin& ...
- 什么时候需要使用try-catch
代码执行预料不到的情况,或出错的可能性很大时,使用try-catch语句 构造一个文件输入流(上传文件时,线上环境的内存情况不确定)出错的可能性很大 文件上传写入, 数据库事务的提交,还有摄像头和打印 ...
- Kubernetes(K8S)内核优化常用参数详解
net.ipv4.tcp_keepalive_time=600 net.ipv4.tcp_keepalive_intvl=30 net.ipv4.tcp_keepalive_probes=10 net ...