ML三（人工神经网络）

robert_ai 2024-08-29 13:06:20 原文

人工神经网络

Artificial Neural Nerworks

基本术语概念：

人工神经网络（Artificial Neural Networks，ANN）

感知器（Perceptron）：以一个实数值向量作为输入，计算输入的线性组合，如果结果大于某个阈值输出1，否则输出-1。

权值（weight）：贡献率。

线性可分（linearly separable）

Delta法则（delta rule）：LMS的一个变态，采用梯度下降。

感知器训练法则（perceptron training rule）

梯度下降（gradient descent）

反向传播算法（The Backpropagation Algorithm）

1 适合神经网络学习的问题

实例使用很多"属性-值"对表示的。
目标函数的输出可能是离散值。
训练数据可能包含错误。
可容忍长时间的训练。
可能需要快速求出目标函数值。
人类能否理解学到的目标函数是不重要的。

2 感知器（perceptron）

感知器：ANN系统的基础单元

其中，w是一个实数常量，叫做权值（weight）。

学习一个感知器意味着选择权w的值。

2.1 感知器的表征能力

单独的感知器可以解决线性可分（linearly separable）样例集合，例如很多布尔函数，AND，OR，但不能解决线性不可分的函数，例如异或函数XOR。

2.2 感知器训练法则

感知器法则（perceptron training rule）：

该法则收敛的前提是训练样例线性可分。

Delta法则：

如果训练样本不是线性可分的，那么delta法则会收敛到目标概念的最佳近似。它的关键思想是使用梯度下降（gradient descent）来进行搜索。

先制定一个度量标准来衡量假设相对于训练样本的训练误差（training error）。

其中，D是训练样例集合，t是训练样例d的目标输出，o是线性单元对训练样例d的输出。

接下来要是误差最小，计算E相对w每个分量的导数。

这个向量导数被称为E对于w的梯度（gradient）。

通过求导得：

3 多层网络和反向传播算法（The Backpropagation Algorithm）

3.1 可微阈值单元（A Differentiable Threshold Unit）

这里需要的单元应该是，它的输出是输入的非线性函数，并且输出是输入的可微函数，这样我们就能表征非线性函数的网络。Sigmoid单元满足。

Sigmoid单元：

3.2 反向传播算法（The Backpropagation Algorithm）

这里描述的算法适用于包含两层sigmoid单元的分层前馈网络，它采用梯度下降方法试图最小化网络输出值和目标值之间的误差平方，来学习这个网络的权值。一些符号意义：

3.3 反向传播法则的推导

符号表示：

ML三（人工神经网络）的更多相关文章

SIGAI深度学习第三集人工神经网络2
讲授神经网络的理论解释.实现细节包括输入与输出值的设定.网络规模.激活函数.损失函数.初始化.正则化.学习率的设定.实际应用等大纲: 实验环节: 理论层面的解释:两个方面,1.数学角度,映射函数h( ...
C#中调用Matlab人工神经网络算法实现手写数字识别
手写数字识别实现设计技术参数:通过由数字构成的图像,自动实现几个不同数字的识别,设计识别方法,有较高的识别率关键字:二值化投影矩阵目标定位 Matlab 手写数字图像识别简介: 手写 ...
人工神经网络(Artificial Neural Networks)
人工神经网络的产生一定程度上受生物学的启发,因为生物的学习系统是由相互连接的神经元相互连接的神经元组成的复杂网络.而人工神经网络跟这个差不多,它是一系列简单的单元相互密集连接而成的.其中每个单元有一定 ...
人工神经网络简介和单层网络实现AND运算--AForge.NET框架的使用（五）
原文:人工神经网络简介和单层网络实现AND运算--AForge.NET框架的使用(五) 前面4篇文章说的是模糊系统,它不同于传统的值逻辑,理论基础是模糊数学,所以有些朋友看着有点迷糊,如果有兴趣建议参 ...
人工神经网络 Artificial Neural Network
2017-12-18 23:42:33 一.什么是深度学习深度学习(deep neural network)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高 ...
微软“小冰”识狗与人工神经网络（I）
2014年8月21日,微软"小冰"网络机器人推出了一项图像识别技能:"小冰识狗". "小冰"怎么会"识狗"呢? 依据微软 ...
人工神经网络--ANN
神经网络是一门重要的机器学习技术.它是目前最为火热的研究方向--深度学习的基础.学习神经网络不仅可以让你掌握一门强大的机器学习方法,同时也可以更好地帮助你理解深度学习技术. 本文以一种简单的,循序的方 ...
人工神经网络反向传播算法（BP算法）证明推导
为了搞明白这个没少在网上搜,但是结果不尽人意,最后找到了一篇很好很详细的证明过程,摘抄整理为 latex 如下. (原文:https://blog.csdn.net/weixin_41718085/a ...
neurosolutions 人工神经网络集成开发环境 keras
人工神经网络集成开发环境 : http://www.neurosolutions.com/ keras: https://github.com/fchollet/keras 文档 http ...

随机推荐

java游戏开发基础Swing之JCheckBox
© 版权声明:本文为博主原创文章,转载请注明出处 1.复选框(JCheckBox) 使用复选框可以完成多项选择.Swing中的复选框与AWT中的复选框相比,优点是Swing复选框中可以添加图片 JCh ...
Atitit.异步编程的发展历史 1.1. TAP & async/await
Atitit.异步编程的发展历史 1.1. TAP & async/await 1. 异步编程的发展历史1 1.1. Thread1 1.2. Task1 1.3. Async await2 ...
利用SQL server 的复制功能分散用户访问服务器的负载
先来了解一下一个基本的关于复制的概念. 什么是复制? 复制就是把数据的多个拷贝(复制品)分发到公司中的各个服务器中,通过复制为多台服务器提供相同的数据.这样用户就可以在不同服务器中访问同样的信息. 对 ...
Sql效能优化总结（续）- sql语句优化篇
今晚继续进行Sql效能问题的分享,今天主要是一些具体的sql优化方法和思路分享,若看过后你也有其他想法,欢迎一起探讨,好了,进入今天的主题. 针对性地对一些耗资源严重的具体应用进行优化出现效能问题时 ...
什么是scale up和scale out
Scale Out(也就是Scale horizontally)横向扩展,向外扩展Scale Up(也就是Scale vertically)纵向扩展,向上扩展无论是Scale Out,Scale Up ...
常见UI组件的一个模板
效果: 代码: using UnityEngine; using UnityEditor; using System.Collections; using System.IO; using Unity ...
JS中setInterval、setTimeout不能传递带参数的函数的解决办法
在JS中无论是setTimeout还是setInterval,在使用函数名作为调用句柄时都不能带参数,而在许多场合必须要带参数,这就需要想方法解决. 一.采用字符串形式:——(缺陷)参数不能被周期性改 ...
PHP 和 AJAX MySQL 数据库实例
HTML 表单 <!DOCTYPE html> <html lang="en"> <head> <meta charset="U ...
Java水印图片处理
今天需要用Java程序给图片加水印,于是在网上找到了一段代码,感觉很好,于是记录了下来,原来的网址给忘了: import java.awt.AlphaComposite; import java.aw ...
大华NVR设备接分别入宇视摄像机Onvif和RTSP主子码流的方案说明
需求提要 1.各个内网现场有多种网络摄像机IPC和网络硬盘录像机NVR设备: 2.需要将这些设备统一接入到云端中心平台,进行统一的视频直播和录像回放管理: 3.由于目前IPC设备都属于高清设备,主码流 ...