CUDA学习笔记 GPU架构 GPU围绕流式多处理器(SM)的可扩展阵列搭建,每个GPU有多个SM,每个SM支持数百个线程并发执行.目前Nvidia推出了6种GPU架构(按时间顺序,详见下图):Fermi.Kepler.Maxwell.Pascal.Volta和Turing,每种架构的SM构成不尽相同. 以Fermi架构为例,SM通常包含以下组成部分: 32个CUDA核心,每核心由一整数算术逻辑单元ALU和一浮点运算单元FPU组成 共享内存/L1Cache 寄存器 加载/存储单元 特殊功能单元S…