《Andrew Ng深度学习》笔记2

那一抹风 2024-10-29 12:54:38 原文

神经网络基础

1.图计算

计算时有两种方法：正向传播和反向传播。正向传播是从底层到顶层的计算过程，逐步推出所求公式。反向传播是从顶层到底层，从已知的式子求出因变量的影响关系。

在这里用到的反向传播算法就是为了通过似然函数(成本函数)来确定要计算的参数。

在这里，logistic回归应用了反向传播，主要是为了方便梯度下降算法的计算，来逐次逼近w和b。通过图片看到，反向传播其实就是微积分里的“链式法则”。这块可能要补补微积分才能更深入学习。这里先跳过，反正是明白了logistic回归中的梯度下降应用了反向传播计算。

2.向量化

向量化的目的是加快计算速度。避免for之类的循环，消耗性能。在python中，使用np.function()函数实现向量化。

通过向量方式的形式表达，可以简化计算，比如使用Python中的numpy库，针对这些计算可以简化为1行代码，减少for之类的循环编写，简化计算。说到这里，很有必要深入学学python。

3.Python中numpy的应用

这里只是Python对向量化操作的一个例子，详细是在numpy库中，里面的函数主要是为了矩阵等计算，方便代码开发，加快速度。

Python中向量化的实质是，会把R变为向量化(SMID 并行多数据流)，主要是把变量变为广播形式。

在logistic回归中，上图左边是一般的计算流程，右边是经过向量化后的计算流程，很明显减少for循环，只要是用到了numpy库里的函数。

但是在实际中药用好numpy库的向量化，里面有一些坑。在行向量和列向量求和应该是出错的，但是在python的numpy库中会得到一个矩阵。所以在使用时要小心谨慎。

《Andrew Ng深度学习》笔记2的更多相关文章

《Andrew Ng深度学习》笔记1
深度学习概论 1.什么是神经网络? 2.用神经网络来监督学习 3.为什么神经网络会火起来? 1.什么是神经网络? 深度学习指的是训练神经网络.通俗的话,就是通过对数据的分析与计算发现自变量与因变量的映 ...
Andrew Ng - 深度学习工程师 - Part 2. 改善深层神经网络：超参数调试、正则化以及优化（Week 2. 优化算法）
===========第2周优化算法================ ===2.1 Mini-batch 梯度下降=== epoch: 完整地遍历了一遍整个训练集 ===2.2 理解Mini-bat ...
Andrew Ng - 深度学习工程师 - Part 1. 神经网络和深度学习（Week 4. 深层神经网络）
=================第2周神经网络基础=============== ===4.1 深层神经网络=== Although for any given problem it migh ...
Andrew Ng - 深度学习工程师 - Part 1. 神经网络和深度学习（Week 1. 深度学习概论）
=================第1周循环序列模型=============== ===1.1 欢迎来到深度学习工程师微专业=== 我希望可以培养成千上万的人使用人工智能,去解决真实世界的实际问 ...
《Andrew Ng深度学习》笔记4
浅层神经网络 1.激活函数在神经网络中,激活函数有很多种,常用的有sigmoid()函数,tanh()函数,ReLu函数(修正单元函数),泄露ReLu(泄露修正单元函数).它们的图形如下: sigm ...
《Andrew Ng深度学习》笔记3
浅层神经网络初步了解了神经网络是如何构成的,输入+隐藏层+输出层.一般从输入层计算为层0,在真正计算神经网络的层数时不算输入层.隐藏层实际就是一些算法封装成的黑盒子.在对神经网络训练的时候,就是对神 ...
《Andrew Ng深度学习》笔记5
深层神经网络深层神经网络的组成如图,这里主要是深层神经网络符号的定义. 为什么要用深层神经网络,有什么好处?这里主要是分层的思想.在软件工程中,如果问题遇到困难,一般是通过“加多”一层的方法来解决, ...
Andrew Ng - 深度学习工程师 - Part 1. 神经网络和深度学习（Week 3. 浅层神经网络）
=================第3周浅层神经网络=============== ===3..1 神经网络概览=== ===3.2 神经网络表示=== ===3.3 计算神经网络的输出== ...
Andrew Ng - 深度学习工程师 - Part 1. 神经网络和深度学习（Week 2. 神经网络基础）
=================第2周神经网络基础=============== ===2.1 二分分类=== ===2.2 logistic 回归=== It turns out, whe ...

随机推荐

iTunes 安装ipa文件到iPhone上
iTunes 安装ipa文件到iPhone上把ipa文件拖到itunes里面. ipa(iPhoneApplication) 菜单 File>Add File to Library>Se ...
class function
type TTest = class public class function sayHello :String; function saybye:String; ...
python3导入自定义模块
模块是个好东西啊,大牛们开源共享许多模块也加快了大家开发的速度,许多开源模块可以在这里找到 ↓ https://pypi.python.org/pypi 因为刚入门所有有很多细节不懂,在网上搜寻资料的 ...
Game Develop Books
[Working On] [Pending] 3.<实时计算机图形学> 4.<游戏编程精粹1> 5.<游戏编程精粹2> 6.<3D游戏引擎设计:实时计算机图形 ...
Select2 的使用
实现这个下拉列表框下载这两个官网上的CSS,JS 官网地址 https://select2.org/getting-started/installation 我自己存的高速下载地址 http://y ...
selenium2 用Yaml文件进行元素管理（五）
比如界面有一个按钮,id号是test.如果进行对象化的话,就是test.click就可以了.不用每次都要去创建test对象.如果id号变了,我们也只需要改一下test的名称就行了. 使用Yaml需要用 ...
ROS导航包的介绍
博客转载自:https://blog.csdn.net/handsome_for_kill/article/details/53130707#t3 ROS导航包的应用利用ROS Navigation ...
3.Strings 字符串如何工作？----对缓冲区的理解。
修改Hello World程序向特定的人问好. #include <iostream> #include <string> int main() { std::string n ...
黑盒测试实践--Day2 11.26
黑盒测试实践--Day2 今天完成任务情况: 大家自主安装和学习Selenium软件小尹给大家介绍学生信息管理系统的基本情况,有余力者搭建了相关环境周末,休息附录小组基本情况介绍人数:五人 ...
UVa 11149 Power of Matrix (矩阵快速幂，倍增法或构造矩阵)
题意:求A + A^2 + A^3 + ... + A^m. 析:主要是两种方式,第一种是倍增法,把A + A^2 + A^3 + ... + A^m,拆成两部分,一部分是(E + A^(m/2))( ...