稀疏性如何为AI推理增加难度

吴建明wujianming 2024-10-17 21:52:58 原文

稀疏性如何为AI推理增加难度

NVIDIA Ampere架构使数学运算加倍，以加速对各种神经网络的处理。

如果曾经玩过游戏Jenga，那么将有一些AI稀疏感。

玩家将木制积木交叉成一列。然后，每个玩家轮流小心地移开一个障碍物，而不会倾倒立柱。

它从一开始就很容易，但是变得越来越毛茸茸，直到失败的玩家拔出一个障碍物，导致塔楼坠毁。

多年来，研究人员一直在努力地利用数字打积木，以利用稀疏性来加速AI。他们尝试从神经网络中提取尽可能多的不需要的参数-而不破坏AI的超高精度。

目标是减少深度学习所需的矩阵乘法堆，从而缩短达到良好结果的时间。到目前为止，还没有大赢家。

迄今为止，研究人员已经尝试了多种技术来提取神经网络中多达95％的权重。但是随后，他们花了比他们节省的时间更多的时间，不得不采取激进的步骤来弥补简化模型的准确性。适用于一种模型的步骤不适用于其他模型。

数字稀疏

NVIDIA安培架构引入了第三代张量磁芯在NVIDIA A100的GPU称取在网络权细粒度稀疏的优点。提供了高达2倍的密集数学最大吞吐量，而不会牺牲深度学习的核心矩阵乘法累加作业的准确性。

测试表明，这种稀疏方法在许多AI任务（包括图像分类，目标检测和语言翻译）中使用密集数学来维持方法的准确性。它也已经在卷积神经网络和递归神经网络以及基于注意力的转换器上进行了测试。

A100打包了稀疏矩阵以加速AI推理任务。

内部数学运算速度的提高对应用程序级别具有重大影响。使用稀疏性，A100 GPU可以运行BERT（来自转换的双向编码器表示），这是用于自然语言处理的最新模型，比密集型数学要快50％。

NVIDIA Ampere架构利用了神经网络中较小值的普遍性，从而使尽可能广泛的AI应用程序受益。具体来说，定义了一种训练神经网络的方法，该方法可以去除一半的权重，即所谓的50％稀疏度。

当做对时，少即是多

一些研究人员使用粗粒度剪枝技术，这些技术会从神经网络层中删除整个通道，从而经常降低网络的准确性。NVIDIA Ampere架构中的方法采用结构化的稀疏性和细粒度的剪枝技术，不会明显降低准确性，用户在重新训练模型时可以进行验证。

适当剪枝网络后，A100 GPU将自动完成其余工作。

A100 GPU中的Tensor Core有效压缩稀疏矩阵以启用适当的密集数学。跳过矩阵中实际上是零值位置的位置会减少计算量，节省功耗和时间。压缩稀疏矩阵还可以减少宝贵的内存和带宽的使用。

稀疏性如何为AI推理增加难度的更多相关文章

AI推理与Compiler
AI推理与Compiler AI芯片编译器能加深对AI的理解, AI芯片编译器不光涉及编译器知识,还涉及AI芯片架构和并行计算如OpenCL/Cuda等.如果从深度学习平台获得IR输入,还需要了解深度 ...
使用函数计算三步实现深度学习 AI 推理在线服务
目前深度学习应用广发, 其中 AI 推理的在线服务是其中一个重要的可落地的应用场景.本文将为大家介绍使用函数计算部署深度学习 AI 推理的最佳实践, 其中包括使用 FUN 工具一键部署安装第三方依赖 ...
基于函数计算 + TensorFlow 的 Serverless AI 推理
前言概述本文介绍了使用函数计算部署深度学习 AI 推理的最佳实践, 其中包括使用 FUN 工具一键部署安装第三方依赖.一键部署.本地调试以及压测评估, 全方位展现函数计算的开发敏捷特性.自动弹性伸缩 ...
AI推理单元
AI推理单元推理服务供了一套面向 MLU(Machine Learning Unit,机器学习单元)设备的类似服务器的推理接口(C++11标准),以及模型加载与管理,推理任务调度等功能,极大地简化了 ...
L1、L2范式及稀疏性约束
L1.L2范式及稀疏性约束假设需要求解的目标函数为: E(x) = f(x) + r(x) 其中f(x)为损失函数,用来评价模型训练损失,必须是任意的可微凸函数,r(x)为规范化约束因子,用来对模型 ...
UFLDL（五）自编码算法与稀疏性
新教程内容太繁复,有空再看看,这节看的还是老教程: http://ufldl.stanford.edu/wiki/index.php/%E8%87%AA%E7%BC%96%E7%A0%81%E7%AE ...
【转】自编码算法与稀疏性（AutoEncoder and Sparsity）
目前为止,我们已经讨论了神经网络在有监督学习中的应用.在有监督学习中,训练样本时有类别标签的.现在假设我们只有一个没带类别标签的训练样本集合 ,其中 .自编码神经网络是一种无监督学习算法,它使用了 ...
cuSPARSELt开发NVIDIA Ampere结构化稀疏性
cuSPARSELt开发NVIDIA Ampere结构化稀疏性深度神经网络在各种领域(例如计算机视觉,语音识别和自然语言处理)中均具有出色的性能.处理这些神经网络所需的计算能力正在迅速提高,因此有效 ...
全场景AI推理引擎MindSpore Lite，助力HMS Core视频编辑服务打造更智能的剪辑体验
移动互联网的发展给人们的社交和娱乐方式带来了很大的改变,以vlog.短视频等为代表的新兴文化样态正受到越来越多人的青睐.同时,随着AI智能.美颜修图等功能在图像视频编辑App中的应用,促使视频编辑效率 ...

随机推荐

【Navicat】获取表结构的DDL语句以及获取更新表字段的操作的DDL
1.获取表结构的DDL语句 2.获取修改表结构某一字段的DDL语句设计表-修改表字段(记住不要保存)-SQL预览
C/C++ 介绍的PE文件遍历工具
在前面的笔记中,我总结了Pe结构的一些结构含义,并手动编写了几段PE结构遍历代码,这里我直接把之前的C语言代码进行了封装,形成了一个命令行版的PE文件查看工具,该工具只有20kb,但却可以遍历出大部分 ...
LA3403天平难题（4个DFS）
题意: 给出房间的宽度r和每个吊坠的重量wi,设计一个尽量宽但宽度不能超过房间宽度的天平,挂着所有挂坠,每个天平的一段要么挂这一个吊坠,要么挂着另一个天平,每个天平的总长度是1,细节我给出题 ...
hdu4642博弈（矩阵）
题意: 给一个01矩阵,每次可以选择1的格子,选择之后以他为左上角的矩阵全都取反,两个人轮班取,不能取的人输. 思路: 博弈的题目,结论是右下角是0就输,1就赢,原因可以这么 ...
【Mybtais】Mybatis 插件 Plugin开发（一）动态代理步步解析
需求: 对原有系统中的方法进行'拦截',在方法执行的前后添加新的处理逻辑. 分析: 不是办法的办法就是,对原有的每个方法进行修改,添加上新的逻辑:如果需要拦截的方法比较少,选择此方法到是会节省成本.但 ...
006-Java的访问权限控制符和包导入机制
目录一.Java的访问权限控制符一.访问控制符的作用二.访问控制符的分类二.Java的包导入机制一.为什么要使用package? 二.package怎么用? 三.对于带有package的ja ...
迷失在Mysql的锁世界~
1.饮料这是一杯饮料. 这是3杯饮料,每杯饮料的味道各不相同. 但是人类并不称呼[饮料]为[饮料],而是称呼[饮料]为[记录]. 2.红章鱼这个红色的,长的像章鱼的家伙,我们就叫它红章鱼~ 红章鱼 ...
Django/Flask的一些实现方法
一.导出当前项目用到的依赖到requirements.txt文件中 pip freeze > requirements.txt 二.安装当前项目需要的依赖: pip install -r req ...
转圈箭头 ⟳ 10227 27F3 刷新 HTML常用的特殊符号总结
HTML常用的特殊符号总结 2014年9月12日 57621次浏览 html中经常会用到一些特殊符号,例如箭头,雪花,心形等等,这些符号就不用css样式或者图片来写了,直接用html特殊符号可以实现. ...
ltp日志
grep "fail" -i /var/log/messages |wc -lgrep "fail" -i /var/log/messagesgrep &quo ...