神经网络与机器学习第3版学习笔记

-初学者的笔记，记录花时间思考的各种疑惑

本文主要阐述该书在数学推导上一笔带过的地方。参考学习，在流畅理解书本内容的同时，还能温顾学过的数学知识，达到事半功倍的效果。

第一章 Rosenblatt感知器

１、第32页

1.1 为什么如果第n次迭代时的内积存在符号错误，第n+1次迭代内积的符号就会正确？

已知 $\eta \left( n \right) X^T\left( n \right) X\left( n \right) >\left| W^T\left( n \right) X\left( n \right) \right|$ ······················································①

(1)假设$X\left( n \right) \in \varphi \left( 1 \right) $，即正确的内积结果大于0：$W^{\begin{array}{c} T\\\end{array}}\left( n \right) X\left( n \right) >0$ 。

$\because $第n次迭代时的内积存在符号错误

$\therefore W^{\begin{array}{c} T\\\end{array}}\left( n \right) X\left( n \right) <0$

$\because X\left( n \right) \in \varphi \left( 1 \right) \,\,\land W^{\begin{array}{c} T\\\end{array}}\left( n \right) X\left( n \right) <0$

$\therefore W\left( n+1 \right) =W\left( n \right) +\eta \left( n \right) X\left( n \right) $ //加上一个正数，使下次内积增大（P30的式1.6）

$\therefore W^T\left( n+1 \right) =W^T\left( n \right) +\eta \left( n \right) X^T\left( n \right) $

$\therefore W^T\left( n+1 \right) X\left( n \right) =W^T\left( n \right) X\left( n \right) +\eta \left( n \right) X^T\left( n \right) X\left( n \right) $

又$\because ①\Rightarrow \eta \left( n \right) X^T\left( n \right) X\left( n \right) >-W^T\left( n \right) X\left( n \right) $

$\therefore W^T\left( n+1 \right) X\left( n \right) >0$

即：第n+1次迭代内积的符号正确。

(2)同理可证当“$X\left( n \right) \in \varphi \left( 2 \right) \land W^{\begin{array}{c} T\\\end{array}}\left( n \right) X\left( n \right) >0$”时，第n+1次迭代内积的符号正确。

2、第33页

2.1 关于“C_ij”

C_ij的通俗解释：$x\in \varphi \left( i \right) $ 却错误分类到$\varphi \left( j \right) $的风险。

3、第34页

3.1 为什么C11<C21&C22<C12?

因为错误分类的风险更大。

3.2 最优分类策略的由来。

要使分类策略最优，即：实现风险最小。

所以，最优分类为，使得$\int_{\mathscr{X}1}{A\left( x \right) dx}$最小的A（A为1.27中的代数式）。

那么，把所有使得$A\left( x \right) <0$的x都分配给$\mathscr{X}1$，可使得上式最小。

4、第35页

4.1 式1.33的简化过程

$-\frac{1}{2}\left( X-\mu _1 \right) ^TC^{-1}\left( X-\mu _1 \right) +\frac{1}{2}\left( X-\mu _2 \right) ^TC^{-1}\left( X-\mu _2 \right) $

= $-\frac{1}{2}X^TC^{-1}X+\frac{1}{2}X^TC^{-1}\mu _1+\frac{1}{2}\mu _1^TC^{-1}X-\frac{1}{2}\mu _1^TC^{-1}\mu _1$

$\,\,+\frac{1}{2}X^TC^{-1}X-\frac{1}{2}X^TC^{-1}\mu _2-\frac{1}{2}\mu _2^TC^{-1}X+\frac{1}{2}\mu _2^TC^{-1}\mu _2$

= $\,\,\frac{1}{2}X^TC^{-1}\left( \mu _1-\mu _2 \right) +\frac{1}{2}\left( \mu _1^T-\mu _2^T \right) C^{-1}X$

$+\frac{1}{2}\left( \,\,\mu _2^TC^{-1}\mu _2-\mu _1^TC^{-1}\mu _1 \right) $

= $\,\,\frac{1}{2}X^TC^{-1}\left( \mu _1-\mu _2 \right) +\frac{1}{2}\left( \mu _1-\mu _2 \right) ^TC^{-1}X$

$+\frac{1}{2}\left( \,\,\mu _2^TC^{-1}\mu _2-\mu _1^TC^{-1}\mu _1 \right) $

$\because X,C,\mu _1,\mu _2$都是一维向量，且一维向量X一维向量=常数

$\therefore X^TC^{-1}\left( \mu _1-\mu _2 \right) =\left( \mu _1-\mu _2 \right) ^TC^{-1}X$

$\therefore $原式=$\,\,\left( \mu _1-\mu _2 \right) ^TC^{-1}X+\frac{1}{2}\left( \,\,\mu _2^TC^{-1}\mu _2-\mu _1^TC^{-1}\mu _1 \right) $

5、第37页

5.1 实验所需要的感知器参数中：$\beta =50$ ？

因为区域A的输入向量的最大欧几里得范数应该为大圆半径10，

所以 $\beta =10^2=100$。

5.2 中文版中对于“权向量大小m=20”的描述，在原版中不存在，可忽略。

6、双月模型的计算机实验

见以下开源代码：

（作者3步迭代就收敛，可我的代码大约需要几百步才能收敛，

由于是随机产生的输入向量，收敛步数应该得看脸，好在都能瞬间完成

并生成可分析数据）

https://gitee.com/none_of_useless/nnalm

思路：

①创建感知器。接受输入向量及初始权值，输出收敛后的权值。

②创建双月模型，生成训练与验证数据。

神经网络与机器学习第3版学习笔记-第1章 Rosenblatt感知器的更多相关文章

tensorflow学习笔记——自编码器及多层感知器
1,自编码器简介传统机器学习任务很大程度上依赖于好的特征工程,比如对数值型,日期时间型,种类型等特征的提取.特征工程往往是非常耗时耗力的,在图像,语音和视频中提取到有效的特征就更难了,工程师必须在这 ...
HTML5与CSS3基础教程第八版学习笔记11~15章
第十一章,用CSS进行布局开始布局注意事项 1.内容与显示分离 2.布局方法:固定宽度和响应式布局固定宽度,整个页面和每一栏都有基于像素的宽度响应式布局也称为流式页面,使用百分数定义宽度 3.浏 ...
锋利的jQuery第2版学习笔记8~11章
第8章,用jQuery打造个性网站网站结构文件结构 images文件夹用于存放将要用到的图片 styles文件夹用于存放CSS样式表,个人更倾向于使用CSS文件夹 scripts文件夹用于存放jQ ...
锋利的jQuery第2版学习笔记1~3章
第1章,认识jQuery 注意:使用的jQuery版本为1.7.1 目前流行的JavaScript库 Prototype(http://www.prototypejs.org),成型早,面向对象的思想 ...
HTML5与CSS3基础教程第八版学习笔记7~10章
第七章,CSS构造块 CSS里有控制基本格式的属性(font-size,color),有控制布局的属性(position,float),还有决定访问者打印时在哪里换页的打印控制元素.CSS还有很多控制 ...
HTML5与CSS3基础教程第八版学习笔记1~6章
第一章,网页的构造块网页主要包括三个部分: 1.文本内容(纯文字) 2.对其他文件的引用:图像,音频,视频,样式表文件,js文件 3.标记:对文本内容进行描述并确保引用正确地工作注:所有这些成分都 ...
c#高级编程第七版学习笔记第三章对象和类型
第三章对象和类型本章的内容: 类和结构的区别类成员按值和按引用传送参数方法重载构造函数和静态构造函数只读字段部分类静态类 Object类,其他类型都从该类派生而来 3.1 类和结构 ...
python cookbook第三版学习笔记二十一：利用装饰器强制函数上的类型检查
在演示实际代码前,先说明我们的目标:能对函数参数类型进行断言,类似下面这样: @typeassert(int, int) ... def add(x, y): ... return x + y ...
流畅的python学习笔记第七章：装饰器
装饰器就如名字一样,对某样事物进行装饰过后然后返回一个新的事物.就好比一个毛坯房,经过装修后,变成了精装房,但是房子还是同样的房子,但是模样变了. 我们首先来看一个函数.加入我要求出函数的运行时间.一 ...

随机推荐

LeetCode按照解题方法分类题目
解题方法分类 1. 滑动窗口. 2. 双指针. 3. 快慢指针. 4. 区间合并. 5. 循环排序. 6. 原地反转链表. 7. 树上的BFS. 8. 树上的DFS. 9. 双堆. 10. 子集. 1 ...
Oracle 全部后台进程简介
LGWR,DBWR,SMON,PMON,CKPT是必需的五个后台进程.ARCH是最重要的可选后台进程.最重要的六个进程:1.LGWR重做日志写进程,LOG write 负责将重做日志缓冲区记录顺序写入 ...
qsing
qsing1 1.低仿机器人一道大模拟 2.放爆竹小辉原本想让小明告诉他,如果同时点燃n串雷,最多会有多长的时间至少有两串雷爆炸的声音是一样的. 但是小辉觉得这个问题真是太简单了,所以决定问小明, ...
CNN模型合集 | 1 LeNet
1.1 LeNet的设计思想 1998年LeCun提出,经典结构,3层,五脏俱全(卷积层.Pooling层.FC网络.Sigmod层),对标传统神经网络.主要设计贡献局部感受野(local rece ...
P3986 斐波那契数列——数学（EXGCD）
https://www.luogu.org/problem/P3986 很久很久以前,我好像写过exgcd,但是我已经忘了: 洛谷上搜EXGCD搜不到,要搜(扩展欧几里得) 这道题就是ax+by=k, ...
linux环境下完成jenkins的环境搭建
环境搭建部署: 请完成jenkins的环境搭建,需安装tomcat,mysql. Jenkins 地址: https://jenkins.io/download/ 步骤分析: 1.全部操作使用普通用 ...
python生成二维码（简易）
首先要的配置: pillow image qrcode zxing 然后直接上代码: import PIL import qrcode # 实例化二维码生成类 qr = qrcode.QRCode( ...
Qt之模型/视图（自定义风格）
Qt之模型/视图(自定义风格) 关于自定义风格是针对视图与委托而言的,使用事件与QSS都可以进行处理,今天关于美化的细节讲解一下. 先看下图: 先撇开界面的美观性(萝卜青菜,各有所爱),就现有的这些风 ...
PowerDesigner 使用小结
这里总结一篇关于数据建模工具 PowerDesigner 的使用小技巧,下面列出的两个应用场景要在网上现找解决方案的话还真不一定好找,所以选择将这两个棘手的问题先记下来. 1. PDM 中表间关系出现 ...
从Cortex-M3的MSP 和PSP谈Linux能否在中断中使用Sleep
1.Cortex-M3 的PSP和MSP 曾经在STM32上使用过RT thread和uC/OS,对于任务切换代码一直是一知半解,没有自己手动写出来过,对于任务切换后的ORR LR, LR, #0 ...

神经网络与机器学习第3版学习笔记-第1章 Rosenblatt感知器