nnet3的代码分析
nnet3/nnet-common.h
定义了Index,(n, t, x)三元组,表示第n个batch中第t帧。
并声明了关于Index或Cindex的一些读写操作。
nnet3/nnet-nnet.h
声明了NetworkNode(主要包含其类型以及索引信息)
声明了Nnet(nnet3网络类)
private:
//网络中的组件名列表
std::vector<std::string> component_names_;
//网络中实际的组件指针列表,同一组件可能出现多次
std::vector<Component*> components_;
//网络中结点名列表,即:inputs、components以及outputs
//同一组件名会出现两次:foo-input和foo
//因为foo-input有其自己的NetworkNode索引
std::vector<std::string> node_names_;
//网络中实际的结点指针列表
std::vector<NetworkNode> nodes_;
以及关于以上数据成员的实用函数。
nnet3/nnet-component-itf.h
Component的itf(interface,接口)
class Component
主要包含以下函数:
Propagate //正向传播
Backprop //反向传播
StoreStats //储存平均激活值、非线性函数微分平均值
ZeroStats //stats清零
GetInputIndexes //只适用于非简单组件
IsComputable //只适用于非简单组件
ReorderIndexes //只适用于非简单组件
以及实用函数
class RandomComponent: public Component
随机数生成的组件
class UpdatableComponent: public Component
参数扰动率
学习率
学习率因子
实际学习率(实际学习率=学习率*学习率因子)
冻结自然梯度更新
每个minibatch最大参数变换率(NnetTrainer以L2正则化的形式使用)
标准L2正则化参数
的设定、修改、查询
class NonlinearComponent: public Component
由于该类不修改特征维数,因子该类是sigmoid、softmax、ReLU的基类
该类
储存激活平均值
储存训练中的微分
负责模型初始化
负责IO
nnet3/nnet-simple-component.h
class PnormComponent: public Component
p-norm的公式:
对维数为intput_dim的输入进行降维,输出维数为output_dim
其Propagate与Backprop函数十分简单,具体关于p-norm单元的实现位于
kaldi::CuMatrixBase::GroupPnorm
Kaldi::CuMatrixBase::DiffGroupPnorm
class DropoutComponent : public RandomComponent
DropoutComponent组件对输入以dropout比例随机置零,而梯度只在非零的输入处进行反向传播。通常只在训练期间使用此组件,但不在测试时间使用
Dropout: A Simple Way to Prevent Neural Networks from Overfitting"
Propogate()
//初始化一个元素取值范围为[0,1]的向量y
const_cast<CuRand<BaseFloat>&>(random_generator_).RandUniform(out);
out->Add(-dropout);
out->ApplyHeaviside();
out->MulElements(in);
通过设置dropout_per_frame_,可以以帧的元素为单位dropout:
[[0,1,1,1],[1,0,1,1],[1,1,0,1],[1,1,1,0],[1,1,1,0]]
或帧为单位进行随机丢弃:
[[1,1,1,1],[0,0,0,0],[0,0,0,0],[1,1,1,1],[0,0,0,0]]
class ElementwiseProductComponent: public Component
点乘组件,用于降维
维输入向量
(0.7,0.5,1.0,0.2,0.9,0.0,0.3,0.1,0.6,0.8)
假设输出维数为5,则10/5=2,两两相乘:
(0.7*0.5,1.0*0.2,0.9*0.0,0.3*0.1,0.6*0.8)
结果为
(0.35,0.20,0.0,0.03,0.48)
class SigmoidComponent: public NonlinearComponent
class TanhComponent: public NonlinearComponent
class RectifiedLinearComponent: public NonlinearComponent
class AffineComponent: public UpdatableComponent
class BlockAffineComponent : public UpdatableComponent
class RepeatedAffineComponent: public UpdatableComponent
class NaturalGradientRepeatedAffineComponent: public RepeatedAffineComponent
class SoftmaxComponent: public NonlinearComponent
Softmax损失函数(归一化指数函数):
其中o是输出向量
Backprop()
对于softmax函数的微分,令:
该函数的雅可比矩阵为:
令输出向量微分为e,输入向量微分为d,有:
nnet3/nnet-computation.h
负责实际的计算。
声明了ComputationRequest、CommandType、NnetComputation等类。
struct ComputationRequest
//计算需要的输入
std::vector<IoSpecification> inputs;
//计算预期的输出
std::vector<IoSpecification> outputs;
以及关于以上数据成员的实用函数
enum CommandType
神经网络计算类型,如:
kPropagate
kBackprop
kAllocMatrix
struct NnetComputation
编译后的神经网络具体计算特定步骤
给定Nnet与ComputationRequest后
就可编译得到该结构体
数据成员包括:
(子)矩阵信息及其索引(使用索引而不存储实际的矩阵)
矩阵
计算类型(CommandType)
计算所依赖的输入输出Index
nnet3/nnet-analyze.h
检测计算是否能有效进行。
主要的类:
class ComputationAnalysis
private:
const NnetComputation &computation_;
const Analyzer &analyzer_;
ComputationVariables variables;
std::vector<CommandAttributes> command_attributes;
std::vector<std::vector<Access> > variable_accesses;
std::vector<MatrixAccesses> matrix_accesses;
成员函数:
访问索引s的第一个非初始化指令
访问索引s的第一个指令
访问索引s的最后一个指令
访问索引s的最后一个写指令
访问索引s的无效指令
访问矩阵索引m的第一个非初始化指令
访问矩阵索引m的最后一个指令
class ComputationChecker
与ComputationAnalysis类似
主要检测:
维数一致性检测
未定义变量读取检测
读写冲突检测(是否是写完再读)
矩阵访问有效性检测
矩阵压缩检测
nnet3/nnet-example.h
struct NnetIo
std::vector<Index> indexes;
GeneralMatrix features;
特征(以及后验)的读写
struct NnetExample
//minibatch结构体
std::vector<NnetIo> io;
及其实用函数
以及一些关于NnetExample的比较、哈希等函数
nnet3的代码分析的更多相关文章
- Android代码分析工具lint学习
1 lint简介 1.1 概述 lint是随Android SDK自带的一个静态代码分析工具.它用来对Android工程的源文件进行检查,找出在正确性.安全.性能.可使用性.可访问性及国际化等方面可能 ...
- pmd静态代码分析
在正式进入测试之前,进行一定的静态代码分析及code review对代码质量及系统提高是有帮助的,以上为数据证明 Pmd 它是一个基于静态规则集的Java源码分析器,它可以识别出潜在的如下问题:– 可 ...
- [Asp.net 5] DependencyInjection项目代码分析-目录
微软DI文章系列如下所示: [Asp.net 5] DependencyInjection项目代码分析 [Asp.net 5] DependencyInjection项目代码分析2-Autofac [ ...
- [Asp.net 5] DependencyInjection项目代码分析4-微软的实现(5)(IEnumerable<>补充)
Asp.net 5的依赖注入注入系列可以参考链接: [Asp.net 5] DependencyInjection项目代码分析-目录 我们在之前讲微软的实现时,对于OpenIEnumerableSer ...
- 完整全面的Java资源库(包括构建、操作、代码分析、编译器、数据库、社区等等)
构建 这里搜集了用来构建应用程序的工具. Apache Maven:Maven使用声明进行构建并进行依赖管理,偏向于使用约定而不是配置进行构建.Maven优于Apache Ant.后者采用了一种过程化 ...
- STM32启动代码分析 IAR 比较好
stm32启动代码分析 (2012-06-12 09:43:31) 转载▼ 最近开始使用ST的stm32w108芯片(也是一款zigbee芯片).开始看他的启动代码看的晕晕呼呼呼的. 还好在c ...
- 常用 Java 静态代码分析工具的分析与比较
常用 Java 静态代码分析工具的分析与比较 简介: 本文首先介绍了静态代码分析的基 本概念及主要技术,随后分别介绍了现有 4 种主流 Java 静态代码分析工具 (Checkstyle,FindBu ...
- SonarQube-5.6.3 代码分析平台搭建使用
python代码分析 官网主页: http://docs.sonarqube.org/display/PLUG/Python+Plugin Windows下安装使用: 快速使用: 1.下载jdk ht ...
- angular代码分析之异常日志设计
angular代码分析之异常日志设计 错误异常是面向对象开发中的记录提示程序执行问题的一种重要机制,在程序执行发生问题的条件下,异常会在中断程序执行,同时会沿着代码的执行路径一步一步的向上抛出异常,最 ...
随机推荐
- Vue--路由
main.js: 1.先在项目安装路由模块:npm install vue-router --save-dev2.使用路由:main.js首先要引用vue模块: import Vue from 'vu ...
- 洛谷P3959 宝藏
去年NOIP第二毒瘤(并不)的题终于被我攻克了,接下来就只剩noip难度巅峰列队了. 首先说一下三种做法:随机化,状压DP和搜索. 前两种做法我都A了,搜索实在是毒瘤,写鬼啊. 有些带DFS的记忆化搜 ...
- Dreamweaver - <!DOCTYPE html>
最近设计网页,很多使用 <!DOCTYPE html> 关于<!DOCTYPE html>的详细介绍: http://www.w3school.com.cn/tags/tag_ ...
- strut2 的数据验证
数据验证 用户的输入验证,必须做,且工作量巨大. 1.验证的方式 客户端验证:javascript 服务端验证:逻辑验证(我们的代码) 注意:如果客户端和服务端二选一的话,服务器端的不能省. 实际开发 ...
- 使用海康的某款摄像头以及v4l2的经验
Video Capture模式下发现使用MJPEG流和YUYV流相同分辨率视野却不同. 最后没找到怎么设物理窗口或图片窗口的方法,做实验知道了为什么. 设为1280×720 YUYV实际物理窗口是19 ...
- C语言进阶--Day2
今天主要讲解的是函数的压栈与出栈 1. 要实现一个数组的逆置,用栈的压栈出栈观点: reverseArr(int *parr,int i,int len) { if(i != len-1) rever ...
- echart折线区域图
在引入echart区域折线图时,没有出现对应的区域图 当发现引入下面代码到自己的代码中并没有对应的区域图 option = { xAxis: { type: 'category', boundaryG ...
- H5新增元素
标签 标记意义及用法分析/示例 属性/属性值/描述 <article> 定义独立的内容,如论坛帖子.报纸文章.博客条目.用户评论等内容. 支持HTML5的全局属性和事件属性. <as ...
- noi.openjudge 1.12.6
http://noi.openjudge.cn/ch0112/06/ 总时间限制: 2000ms 内存限制: 65536kB 描述 传说很遥远的藏宝楼顶层藏着诱人的宝藏.小明历尽千辛万苦终于找到传 ...
- 4.django学习模板
##引用模板 步骤: 在应用目录下创建templates目录,在目录下创建html文件 在views.py返回render(渲染) 1.requests请求本身,2.模板文件,3.后台传递到前端的数据 ...