CAD& CG 2020 胡事民教授—开源框架Jittor的创新与探索
题目:深度学习框架“计图”的创新与探索
报告人:胡事民
报告人简介:胡事民,清华大学计算机系教授,主要研究方向为计算机图形学、虚拟现实、智能信息处理和系统软件等。
报告简介:深度学习框架是现代人工智能算法开发和应用的基本支撑框架,自主可控的深度学习框架是推动中国人工智能更好发展的必然要求。国外主流深度学习框架基于开源开放的生态环境,已经构建起了完整的产业链和庞大用户群体。计图是国内首个由高校主导的开源深度学习框架。计图基于所提出的“统一计算图”,创新地使用了元算子融合和动态编译技术,目前在多种任务性能上超越国外主流平台。除此之外,计图框架还在易用性、灵活性以及模型算法覆盖度上做了大量改进,旨在降低用户学习成本,吸引更多用户,构建自己的开源深度学习生态。本报告拟介绍计图(Jittor)平台的整体架构和多项创新技术,分享计图框架的开源历程和发展思路,并探讨中国开源深度学习框架的未来发展。
机器学习框架(平台)是人工智能的核心技术
- 负责机器学习模型的训练和推理
- 管理着人工智能应用所需要的大规模数据和模型
- 负责底层计算设备调度以及资源申请


机器学习平台的难度在哪里?
- 对机器学习算法的深刻理解
- 对图形图像应用的精准把握
- 对底层系统软件的巧妙应用


创新点一:统一计算图
- 结合静态图高效和动态图易用的特点
- 静态图(TensorFlow):一次性把全图发送到计算设备上运行
- 动态图(Pytorch):将算子动态地发送到计算设备上运行
- 动态切分 => 静态子图,静态子图做优化
- 统一计算图是完成了多种统一的计算图
- 统一动态图和静态图,易用、同时高效
- 统一管理前向反向图,支持高阶导数
- 统一管理CPU-GPU内存,突破GPU显存限制
- 统一同步异步运行接口,使得数据读取,内存拷贝,模型计算可以同时进行,提升性能
- 统一管理多次迭代的计算图,使得框架可以实现跨迭代的融合优化
- 结合静态图高效和动态图易用的特点
创新点二:18个元算子、元算子融合
- Tensorflow算子数量: 2000+,PyTorch算子数量: 700+;庞大的算子库维护,
优化困难 - 将三类元算子(重索引、重索引化简、元素级)进行融合形成深度学习所需要的算子
- 重索引算子(一对多)——广播、填补、切分
- 重索引化简算子(多对一)——累乘、累加、取均值
- 元素级算子(一对一)
- 元算子是反向传播闭包(元算子的反向传播也是元算子)
- 在反向传播过程中,算子可自动对应生成,重索引算子—重索引化简算子、元素级算子—元素级算子
- 元算子可以覆盖绝大多数深度学习算子,对于元算子无法覆盖的算子,计图提供Code算子(Python中内联C++代码),完成100%算子覆盖
- Tensorflow算子数量: 2000+,PyTorch算子数量: 700+;庞大的算子库维护,
6 大特色
- 动态编译
- 内置的元算子编译器,可将Python代码动态编译高性能C++代码
- 内置LLVM兼容的优化编译遍(Pass),根据硬件设备,自动优化动态编译的代码
- 统一内存
- 将显存和CPU内存统一,当深度学习模型将显存耗尽时,将使用CPU内存来弥补。
- 骨干网络
- 已经支持的骨干网络:AlexNet;VGG;ResNet;SqueezeNet;Incept ion;Goog leNet;Shuff leNet;Mobi leNet;MnasNet;Res2Net
- 模型库
- 2020年将发布27中主流GAN、语义分割、检测库、3D点云库、3D网格库等
- 模型转换
- 提供工具可以将Pytorch代码一键转码为Jittor
- 分布式
- 无需修改训练代码,只需修改启动命令;自动数据并行,实现多卡训练。
- 动态编译
最新进展
- Res2Net、PointNet++,DeepFaceDrawing
图形学新的机遇
- 可微编程(可微光栅化渲染、可微蒙特卡洛光线追踪、可微物理模拟)
CAD& CG 2020 胡事民教授—开源框架Jittor的创新与探索的更多相关文章
- 计算机图形学 opengl版本 第三版------胡事民 第四章 图形学中的向量工具
计算机图形学 opengl版本 第三版------胡事民 第四章 图形学中的向量工具 一 基础 1:向量分析和变换 两个工具 可以设计出各种几何对象 点和向量基于坐标系定义 拇指指向z轴正 ...
- 计算机图形学 opengl版本 第三版------胡事民 第三章更多的绘图工具
opengl 计算机图形学 第三版 第二部分 第三章更多的绘图工具 3.1 概述 第2章中 我们绘图使用的是屏幕窗口的基础坐标系 以像素为单位 屏幕坐标从左下角x从0延伸到scr ...
- “开源、共享、创新” 2020 中国.NET开发者大会小结
大会的新闻稿在2020年12月31日正式发布:开源·共享·创新|2020年中国.NET开发者大会圆满收官! , 本文是这篇新闻的补充性文章,仅代表个人对大会的各方面分享内容的一个小结. 在2019年上 ...
- CVPR 2020目标跟踪多篇开源论文(上)
CVPR 2020目标跟踪多篇开源论文(上) 1. SiamBAN:面向目标跟踪的Siamese Box自适应网络 作者团队:华侨大学&中科院&哈工大&鹏城实验室&厦门 ...
- CVPR 2020目标跟踪多篇开源论文(下)
CVPR 2020目标跟踪多篇开源论文(下) 6. Cooling-Shrinking Attack: Blinding the Tracker with Imperceptible Noises 作 ...
- Pyhton开源框架(加强版)
info:Djangourl:https://www.oschina.net/p/djangodetail: Django 是 Python 编程语言驱动的一个开源模型-视图-控制器(MVC)风格的 ...
- Python开源框架
info:更多Django信息url:https://www.oschina.net/p/djangodetail: Django 是 Python 编程语言驱动的一个开源模型-视图-控制器(MVC) ...
- 【安卓网络请求开源框架Volley源码解析系列】定制自己的Request请求及Volley框架源码剖析
通过前面的学习我们已经掌握了Volley的基本用法,没看过的建议大家先去阅读我的博文[安卓网络请求开源框架Volley源码解析系列]初识Volley及其基本用法.如StringRequest用来请求一 ...
- Android开源框架Afinal第一篇——揭开圣女的面纱
Android开源框架Afinal第一篇——揭开圣女的面纱 分类: Android开源框架哪点事2013-09-02 14:25 260人阅读 评论(0) 收藏 举报 Afinal 这是Afinal在 ...
随机推荐
- 经典SQL问题:Top 10%
学生表: create table hy_student( id number(4,0) primary key, name nvarchar2(20) not null, score number( ...
- Docker Compose 搭建 Redis Cluster 集群环境
在前文<Docker 搭建 Redis Cluster 集群环境>中我已经教过大家如何搭建了,本文使用 Docker Compose 再带大家搭建一遍,其目的主要是为了让大家感受 Dock ...
- 来讲讲你对ThreadLocal的理解
前言 面试的时候被问到ThreadLocal的相关知识,没有回答好(奶奶的,现在感觉问啥都能被问倒),所以我决定先解决这几次面试中都遇到的高频问题,把这几个硬骨头都能理解的透彻的说出来了,感觉最起码不 ...
- 判断语句 、 while循环 、 for循环
判断语句 语法结构 if 条件1: 如果条件1为真,执行语句块 elif 条件2: 如果条件2为真,执行语句块 elif 条件3: 如果条件2为真,执行语句块 elif 条件n: 如果条件n为真,执行 ...
- 《Java从入门到失业》第四章:类和对象(4.2):String类
4.2String类 这一节,我们学习第一个类:String类.String翻译成汉语就是“字符串”,是字符的序列.我们知道,在Java中,默认采用Unicode字符集,因此字符串就是Unicode字 ...
- [Java并发编程之美]第2章 并发编程的其他基础知识 补充知识
基本概念 并行与并发 并行:单位时间内多个任务同时执行(多核CPU). 并发:同一时间段内多个任务同时都在执行(CPU时间片轮转). 线程安全性问题 线程安全问题:指多个线程同时读写一个共享资源而没有 ...
- C++万能头文件的秘密
#include<bits/stdc++.h> 万能头文件,拼写怎么这么奇怪? 其实,bits表示一个文件夹,stdc++.h是里面的头文件,这表示路径. 搜索这个文件夹,找到后打开. 打 ...
- 解Bug之路-记一次对端机器宕机后的tcp行为
解Bug之路-记一次对端机器宕机后的tcp行为 前言 机器一般过质保之后,就会因为各种各样的问题而宕机.而这一次的宕机,让笔者观察到了平常观察不到的tcp在对端宕机情况下的行为.经过详细跟踪分析原因之 ...
- redis入门指南(七)—— 安全、协议、管理工具及命令属性
写在前面 学习<redis入门指南>笔记,结合实践,只记录重要,明确,属于新知的相关内容. 安全 1.可以使用bind参数绑定一个地址,使redis只接受这个地址的连接. 2.使用requ ...
- Tomcat 第四篇:请求处理流程(上)
1. 引言 既然是在讲 Tomcat ,那么一个 HTTP 请求的请求流程是无论如何也绕不开的. 首先抛开所有,使用我们现有的知识面,猜测一下一个请求被 Tomcat 处理的过程: 1. 客户端(浏览 ...