手算推导BP神经网络

2024-07-26 02:14:04 原文

一、神经元

下图的蓝色区域被称为一个“感知机”(Perceptron), 感知机是对信息进行编码、压缩、集成、融合的计算机智能接口系统。

说白了，就是在输入端输入X1~X7这7个输入值，在感知机中乘以各自的权重矩阵、加上偏置值b后再放入激活函数f，最后输出结果y.

图中黄圈也代表了一个“感知机”，黄圈中进行了1.矩阵点乘后求和，2.加偏置值b，3.经过激活函数变换，这三项操作。

常见的三种激活函数是sigmoid函数(又称S函数)、tanh函数和Relu函数，图像和公式见下：

二、输入层、隐藏层、输出层

先求输出层的误差，而后倒推出隐藏层和输入层的误差：（d为真实值，O为最终预测值）

权重虚拟值：

偏置虚拟值：

三、开始手推公式

对neth1 通过sigmoid激活函数之后，得到outh1，我们先看一下sigmoid函数的长什么样：（其实上面介绍激活函数时也画出来了）

同理可得：

同理：

总损失:

那么到此，结果的总损失已经算出，现在需要反向传播求偏导，以求出每一个参数对最终总损失的‘贡献’，为参数更新做准备。

同理：

从而得到W1更新值：

（注：1. 为学习率，即梯度下降中的步长，为超参数。

2.为什么学习率前是负号？因为目标函数一般都是下凹函数，偏导为正就需左移自变量，为负就需右移自变量）

同理可得到每一个W的更新值：

顺便放在程序上跑一跑，可以发现进行这样的反向传播梯度更新的确会使最终结果越来越接近目标值。

（实际O1=0.01，O2=0.09）

最初的权重矩阵W0(随机赋值)是这样的：

迭代1000次（也就是更新1000次参数后）的权重矩阵W1000：

手算推导BP神经网络的更多相关文章

BP神经网络推导过程详解
BP算法是一种最有效的多层神经网络学习方法,其主要特点是信号前向传递,而误差后向传播,通过不断调节网络权重值,使得网络的最终输出与期望输出尽可能接近,以达到训练的目的. 一.多层神经网络结构及其描述 ...
BP神经网络算法推导及代码实现笔记zz
一. 前言: 作为AI入门小白,参考了一些文章,想记点笔记加深印象,发出来是给有需求的童鞋学习共勉,大神轻拍! [毒鸡汤]:算法这东西,读完之后的状态多半是 --> “我是谁,我在哪?” 没事的 ...
机器学习入门学习笔记：（一）BP神经网络原理推导及程序实现
机器学习中,神经网络算法可以说是当下使用的最广泛的算法.神经网络的结构模仿自生物神经网络,生物神经网络中的每个神经元与其他神经元相连,当它“兴奋”时,想下一级相连的神经元发送化学物质,改变这些神经元的 ...
Andrew BP 神经网络详细推导
Lec 4 BP神经网络详细推导本篇博客主要记录一下Coursera上Andrew机器学习BP神经网络的前向传播算法和反向传播算法的具体过程及其详细推导.方便后面手撸一个BP神经网络. 目录 Lec ...
练习推导一个最简单的BP神经网络训练过程【个人作业/数学推导】
写在前面各式资料中关于BP神经网络的讲解已经足够全面详尽,故不在此过多赘述.本文重点在于由一个"最简单"的神经网络练习推导其训练过程,和大家一起在练习中一起更好理解神经网络训 ...
BP神经网络的直观推导与Java实现
人工神经网络模拟人体对于外界刺激的反应.某种刺激经过人体多层神经细胞传递后,可以触发人脑中特定的区域做出反应.人体神经网络的作用就是把某种刺激与大脑中的特定区域关联起来了,这样我们对于不同的刺激就可以 ...
BP神经网络原理及python实现
[废话外传]:终于要讲神经网络了,这个让我踏进机器学习大门,让我读研,改变我人生命运的四个字!话说那么一天,我在乱点百度,看到了这样的内容: 看到这么高大上,这么牛逼的定义,怎么能不让我这个技术宅男心 ...
机器学习（一）：梯度下降、神经网络、BP神经网络
这几天围绕论文A Neural Probability Language Model 看了一些周边资料,如神经网络.梯度下降算法,然后顺便又延伸温习了一下线性代数.概率论以及求导.总的来说,学到不少知 ...
BP神经网络算法学习
BP(Back Propagation)网络是1986年由Rumelhart和McCelland为首的科学家小组提出,是一种按误差逆传播算法训练的多层前馈网络,是眼下应用最广泛的神经网络模型之中的一个 ...
【机器学习】BP神经网络实现手写数字识别
最近用python写了一个实现手写数字识别的BP神经网络,BP的推导到处都是,但是一动手才知道,会理论推导跟实现它是两回事.关于BP神经网络的实现网上有一些代码,可惜或多或少都有各种问题,在下手写了一 ...

随机推荐

CH32V307 内部10M网络工程创建流程
说明: 本次操作是基于目前MRSV1.8.0版本,以及WCH官网CH32V307-V1.8版本的例程操作. MRS链接:http://www.mounriver.com/download CH32V3 ...
[常用工具] PyAutoGUI使用教程
PyAutoGUI使用教程目录 PyAutoGUI使用教程 1 基础知识 2 一般函数 3 故障保险 4 鼠标函数 4.1 鼠标移动 4.2 鼠标拖动 4.3 鼠标单击 4.4 鼠标滚动 4.5 鼠 ...
[sklearn] 决策树、随机森林、隐马尔可夫模型
决策树决策树(Decision Tree)是一种用于处理分类和回归问题的无监督学习算法.如下图所示为某女青年在某相亲网站的相亲决策图.这幅图描述的都是一个非常典型的决策树模型. 通过对其相亲决策的分 ...
[WPF]DataContext结果不显示
namespace DataContext_ItemSource_Demo { public class Person { public string Name; } public class Vie ...
Mac上优秀的虚拟机软件推荐 PD Parallels Desktop 18.1.1
APPERK 软件信息软件名称 ParallelsDesktop 版本号 18.1.1 软件类型官网版 + 商业版安装包大小 390MB 语言中文系统支持 macOS11及以上(M芯片原生) ...
《机器人SLAM导航核心技术与实战》第1季：第4章_机器人传感器
<机器人SLAM导航核心技术与实战>第1季:第4章_机器人传感器视频讲解 [第1季]4.第4章_机器人传感器-视频讲解 [第1季]4.1.第4章_机器人传感器_惯性测量单元-视频讲解 [ ...
（20）go-micro微服务Elasticsearch使用
目录一 Elasticsearch介绍二 Elasticsearch的主要功能及应用场景 1.Elasticsearch 主要具有如下功能: 2.Elasticsearch 的主要应用场景如下: ...
effective-c 条款2理解与思考
尽量使用const,enum,inline替换 #define 因为,#define 替换发生在预处理阶段,编译器对这个替换内容就缺少了类型检测,并且不利于错误信息的查看编译器再声明数组时必须知道数 ...
Golang编译
SET CGO_ENABLED=0 SET GOOS=darwin SET GOARCH=amd64 go build main.go SET CGO_ENABLED=0 SET GOOS=linux ...
解决:ChatGPT too many requests in 1 hour.Try again later 怎么办？OpenAI 提示
ChatGPT 提示: Too many requests in 1 hour. Try again later. 如下图,我多次访问也出现同样的问题.中文意思是太多的请求数量在当前 1 个小时内,请 ...