每天进步一点点-深度学习入门-基于Python的理论与实现（2）

猝不及防 2024-11-07 19:29:14 原文

今天要补上两天的

不补了，新手，看的比较慢--

手写识别例子跳过先

思考如何实现数字5的识别

三种方法：

训练数据：学习，寻找最优解

测试数据：评价模型能力.

损失函数：以损失函数为线索寻找自由权重参数，讲解损失函数：https://blog.csdn.net/qq_24753293/article/details/78788844

mini-batch学习：机器学习就是是针对训练数据计算损失函数的值，找出使该值尽可能小的参数，所以如果训练数据有100 个的话，我们就要把这100 个损失函数的总和作为学习的指标。

为何要设定损失函数而不使用目标精度作为指标：关键在于导数不为0，如果以对精度求导，大多数地方导数为0，无法根据导数变化更新值

（具体为啥大多数地方对精度求导会得0我理解的不是很清楚..

书中说的是，值得细微变化并不会引起精度的变化

我理解就是值得变化对于精度不敏感，当值变化很多时，精度才会变化一点，此时需要一个敏感的损失函数，值的每一点变化都能时刻反应值的这一点增减对于损失函数的走向，由此再次细微调节值，两者相互敏感的变化。

好像就这样：损失函数是一个能表达精度又能对值变化敏感（导数敏感）的函数。

）

例1：损失函数为均方误差

import numpy as np

#均方误差会计算神经网络的输出和正确解监督数据的各个元素之差的平方，再求总和。

# 经过训练后，出现0-9的期望

y=[0.1,0.05,0.6,0.0,0.05,0.1,0.0,0.1,0.0,0.0]

# 训练后的期望与实际期望的差值进行一定运算，其值越小越准确

def mean_squared_error(y,t):

return 0.5*np.sum((y-t)**2)

# 测试数据，测试数据结果为2,即实际期望

t=[0,0,1,0,0,0,0,0,0,0]

print(mean_squared_error(np.array(y),np.array(t)))

# 测试数据，测试数据结果为7,即实际期望

t=[0,0,0,0,0,0,1,0,0,0]

print(mean_squared_error(np.array(y),np.array(t)))

每天进步一点点-深度学习入门-基于Python的理论与实现（2）的更多相关文章

学习《深度学习入门：基于Python的理论与实现》高清中文版PDF+源代码
入门神经网络深度学习,推荐学习<深度学习入门:基于Python的理论与实现>,这本书不来虚的,一上来就是手把手教你一步步搭建出一个神经网络,还能把每一步的出处讲明白.理解神经网络,很容易就 ...
给深度学习入门者的Python快速教程 - 番外篇之Python-OpenCV
这次博客园的排版彻底残了..高清版请移步: https://zhuanlan.zhihu.com/p/24425116 本篇是前面两篇教程: 给深度学习入门者的Python快速教程 - 基础篇给深度 ...
给深度学习入门者的Python快速教程 - numpy和Matplotlib篇
始终无法有效把word排版好的粘贴过来,排版更佳版本请见知乎文章: https://zhuanlan.zhihu.com/p/24309547 实在搞不定博客园的排版,排版更佳的版本在: 给深度学习入 ...
深度学习入门实战（二）-用TensorFlow训练线性回归
欢迎大家关注腾讯云技术社区-博客园官方主页,我们将持续在博客园为大家推荐技术精品文章哦~ 作者 :董超上一篇文章我们介绍了 MxNet 的安装,但 MxNet 有个缺点,那就是文档不太全,用起来可能 ...
给深度学习入门者的Python快速教程
给深度学习入门者的Python快速教程基础篇 numpy和Matplotlib篇本篇部分代码的下载地址: https://github.com/frombeijingwithlove/dlcv_f ...
深度学习入门者的Python快速教程 - 基础篇
5.1 Python简介本章将介绍Python的最基本语法,以及一些和深度学习还有计算机视觉最相关的基本使用. 5.1.1 Python简史 Python是一门解释型的高级编程语言,特点是简单明 ...
mnist手写数字识别——深度学习入门项目（tensorflow+keras+Sequential模型）
前言今天记录一下深度学习的另外一个入门项目——<mnist数据集手写数字识别>,这是一个入门必备的学习案例,主要使用了tensorflow下的keras网络结构的Sequential模型 ...
深度学习基础-基于Numpy的卷积神经网络（CNN）实现
本文是深度学习入门: 基于Python的实现.神经网络与深度学习(NNDL)以及动手学深度学习的读书笔记.本文将介绍基于Numpy的卷积神经网络(Convolutional Networks,CNN) ...
深度学习基础-基于Numpy的多层前馈神经网络（FFN）的构建和反向传播训练
本文是深度学习入门: 基于Python的实现.神经网络与深度学习(NNDL)以及花书的读书笔记.本文将以多分类任务为例,介绍多层的前馈神经网络(Feed Forward Networks,FFN)加上 ...

随机推荐

MYSQL-连续出现的数字
编写一个 SQL 查询,查找所有至少连续出现三次的数字. +----+-----+| Id | Num |+----+-----+| 1 | 1 || 2 | 1 || 3 | 1 || 4 | 2 ...
webpack devServer配置项的坑
本文所用webpack版本为4+,阅读本章的同学请注意区分. webpack默认不需要配置文件但是你仍可在项目的node_module目录同级目录建立一个webpack.config.js文件进行配 ...
关于if else 和三目运算符的效率问题-java
1.从类型转换上看,因为三目运算符在做判断的时候需要考虑到类型转换的问题,而if else 不需要考虑类型转换. 所以 if else 效率高一点. 2.从总体上看 A:需要考虑到循环自身所占用的时间 ...
express简易代理请求
var express = require('express') var app = express() var proxy = require('http-proxy-middleware') va ...
Arduino与NodeMCU——联网
我们现在要使用Arduino IDE来配置您的ESP8266芯片.这是使用该芯片的好方法,因为您可以使用着名的Arduino IDE对其进行编程,并重复使用几个现有的Arduino库.如果尚未完成,请 ...
sklearn中standardscaler中fit_transform()和transform()有什么区别，应该怎么使用？
在根据机器学习书中提供的实例中,看到需要对训练和测试的特征数据进行标准化. 但是使用的是有两个函数, 对于训练数据,使用的是fit_transform()函数对于测试数据,使用的是tansform( ...
Java-Class-C：cn.hutool.core.date.DateUtil
ylbtech-Java-Class-C:cn.hutool.core.date.DateUtil 1.返回顶部 2.返回顶部 1.1. import cn.hutool.core.date.Da ...
一文看懂SATA和NVMe固态硬盘用起来有何区别？
本文摘自:https://www.sohu.com/a/203688929_615464 NVMe固态硬盘正在逐步扩张,而包括三星.东芝在内的大厂并没有停止SATA固态硬盘新品的研发.到底那种固态硬盘 ...
线程创建后为什么要调用CloseHandle
很多程序在创建线程都这样写的: ............ ThreadHandle = CreateThread(NULL,0,.....); CloseHandel(ThreadHandle ); ...
nfs下的exportfs命令和nfs客户端重新挂载
工作中,如果使用了nfs服务器,会遇到修改nfs服务器配置的情况,如果想重新让客户端加载上修改后的配置,但是又不能重启rpcbind服务,我们需要使用export命令了 exportfs命令常用选项 ...