[源码解析] NVIDIA HugeCTR,GPU版本参数服务器 --(1) 目录 [源码解析] NVIDIA HugeCTR,GPU版本参数服务器 --(1) 0x00 摘要 0x01 背景 1.1 推荐系统中的点击率估计 1.2 点击率估算训练的挑战 0x02 HugeCtr 0x03 架构 3.1 CTR DL 模型 3.2 HugeCTR 架构 3.3 基于GPU的参数服务器 0x04 核心功能 4.1 模型并行训练 4.1.1 in-memory GPU hash table 4.1.…
[源码解析] NVIDIA HugeCTR,GPU版本参数服务器--- (2) 目录 [源码解析] NVIDIA HugeCTR,GPU版本参数服务器--- (2) 0x00 摘要 0x01 总体流程 1.1 概述 1.2 如何调用 0x02 Session 2.1 Session 定义 2.2 构造函数 2.2.1 ResourceManager 2.2.1.1 接口 2.2.1.2 Core 2.2.1.3 拓展 0x03 Parser 3.1 定义 3.2 如何组织网络 3.2.1 输入…
[源码解析] NVIDIA HugeCTR,GPU版本参数服务器---(3) 目录 [源码解析] NVIDIA HugeCTR,GPU版本参数服务器---(3) 0x00 摘要 0x01 回顾 0x02 数据集 2.1 Norm 2.1.1 数据文件 2.1.2 文件列表 2.2 Raw 2.3 Parquet 0x03 CSR 格式 3.1 什么是CSR 3.2 HugeCTR 之中的CSR 3.3 操作类 3.3.1 定义 3.3.2 构造函数 3.3.3 生成新行 3.3.4 插入数据 0…
[源码解析] NVIDIA HugeCTR,GPU版本参数服务器--- (4) 目录 [源码解析] NVIDIA HugeCTR,GPU版本参数服务器--- (4) 0x00 摘要 0x01 总体流程 0x02 DataReader 2.1 定义 2.2 构建 2.3 DataReaderSparseParam 2.3.1 定义 2.3.2 使用 0x03 DataReader Buffer 机制 3.1 比对 3.2 Buffer 相关类 3.3 DataReader构造 3.3.1 辅助 G…
[源码解析] NVIDIA HugeCTR,GPU版本参数服务器--- (5) 嵌入式hash表 目录 [源码解析] NVIDIA HugeCTR,GPU版本参数服务器--- (5) 嵌入式hash表 0x00 摘要 0x01 前文回顾 0x02 Embedding 2.1 概念 2.1.1 One-hot 编码 2.1.2 分布式表示 2.1.3 推荐领域 2.2 Lookup 2.3 嵌入层 2.3.1 点积 2.3.2 全连接层 2.3.3 元数据信息 2.3.4 经典架构 2.3.4.1…
[源码解析] NVIDIA HugeCTR,GPU版本参数服务器--- (6) --- Distributed hash表 目录 [源码解析] NVIDIA HugeCTR,GPU版本参数服务器--- (6) --- Distributed hash表 0x00 摘要 0x01 简述 1.1 基类 1.2 功能 0x02 定义 2.1 思路 2.2 代码 0x03 HashTable 3.1 定义 3.2 HashTableContainer 3.3 调用 3.4 concurrent_unor…
[源码解析] NVIDIA HugeCTR,GPU 版本参数服务器---(7) ---Distributed Hash之前向传播 目录 [源码解析] NVIDIA HugeCTR,GPU 版本参数服务器---(7) ---Distributed Hash之前向传播 0x00 摘要 0x01 前文回顾 0x02 总体逻辑 2.1 注释&思路 2.2 总体代码 0x03 配置数据 3.1 CUB函数 3.1.1 cub::DeviceScan::InclusiveSum 3.1.2 cub::Dev…
[源码解析] NVIDIA HugeCTR,GPU 版本参数服务器---(8) ---Distributed Hash之后向传播 目录 [源码解析] NVIDIA HugeCTR,GPU 版本参数服务器---(8) ---Distributed Hash之后向传播 0x00 摘要 0x01 回顾 0x02 总述 2.1 注释 2.2 代码 0x03 输入 3.1 定义 3.2 切换 0x04 backward 4.1 总体代码 4.2 AllGather 4.2.1 原理 4.2.2 代码 4.…
[源码解析] NVIDIA HugeCTR,GPU 版本参数服务器 --(9)--- Local hash表 目录 [源码解析] NVIDIA HugeCTR,GPU 版本参数服务器 --(9)--- Local hash表 0x00 摘要 0x01 前文回顾 0x02 定义 0x03 构建 3.1 调用 3.2 构造函数 3.3 如何确定slot 0x04 前向传播 4.1 总述 4.2 alltoall 4.3 Reorder 4.3.1 思路 4.3.2 图示 4.4 slot id 4.…
当配置有vGPU虚拟机发起License授权请求,授权服务器会根据License中所包含的GRID License版本,加载不同的vGPU驱动(普通驱动和专业Quodra卡驱动).目前vPC和vApp的License对应加载的都是普通的显示驱动. vGPU License服务器的工作原理 首先,我们一起先了解一下NVIDIA vGPU的内部架构.vGPU跟传统的GPU类似,具有固定数量的GPU帧缓冲器和一个或多个虚拟显示输出.在vGPU虚拟机被创建的时候,帧缓冲区就被分配到物理GPU的帧缓冲区中…