目录 论文主要信息 文章概要 背景 YOLOX-DarkNet53 实现细节 YOLOv3 baseline Decoupled head 实验 思路 story Strong data augmentation Anchor-free multi positives SimOTA End-to-end(NMS-free) YOLO 消融实验 性能对比 YOLOX-L YOLOX-Tiny & YOLOX-Nano Model size V.S. Data augmentation SOTA 参…
全球计算机视觉三大顶会之一 ECCV 2018(European Conference on Computer Vision)即将于 9 月 8 -14 日在德国慕尼黑拉开帷幕.届时,旷视首席科学家孙剑博士将带领团队远赴盛会,助力计算机视觉技术的交流与落地.本文介绍了旷视科技被 ECCV 2018 所接收的一篇论文,该论文提出了一种用于场景理解的统一感知解析网络——UPerNet. 论文名称:<Unified Perceptual Parsing for Scene Understanding>…
全球计算机视觉三大顶会之一 ECCV 2018(European Conference on Computer Vision)即将于 9 月 8 -14 日在德国慕尼黑拉开帷幕,旷视科技有多篇论文被此大会接收.在这篇论文中,旷视科技提出的一种通过学习局部单应变换实现人脸校正的全新方法——GridFace. 论文名称:<GridFace: Face Rectification via Learning Local Homography Transformations> 论文链接:https://…
基于网格曲面的几何拓扑信息可以为物体语义分析和几何建模提供较强的线索,但是,如此重要的连接性信息在点云中是缺失的.为此,旷视西雅图研究院首次提出一种全新的深度学习网络,称之为 GeoNet,可建模点云所潜在表征的网格曲面特征. 为证明这种学习型的测地表示的有效性,旷视西雅图研究院.UCLA 等机构提出一种融合方案,即把 GeoNet 与其他 baseline 和 backbone 相结合,比如 PU-Net.PointNet++,用于若干对潜在网格曲面特征理解有较高要求的点云分析任务. 得益于对…
雷锋网按:本文为旷视科技首席科学家孙剑日前在 CCF-ADL上做的题为<如何在大公司和创业公司做好计算机视觉研究>的分享,主要介绍了近期计算机视觉的发展现状,ResNet基本原理和设计,旷视科技在计算机视觉的研究进展等.最后他还分享了一些“ 如何在大公司和创业公司做好研究?”的心得. 孙剑,博士,旷视科技(Face++)首席科学家.研究负责人. 2003年毕业于西安交通大学人工智能与机器人研究所,毕业后加入微软亚洲研究院(Microsoft Research Asia),任至首席研究员.其主要…
旷视MegEngine核心技术升级 7 月 11 日,旷视研究院在 2020 WAIC · 开发者日「深度学习框架与技术生态论坛」上围绕 6 月底发布的天元深度学习框架(MegEngine)Beta 版本核心技术升级与开源生态建设进行了首次深度解读. 7 月 11 日,旷视研究院在 2020 WAIC · 开发者日「深度学习框架与技术生态论坛」上围绕 6 月底发布的天元深度学习框架(MegEngine)Beta 版本核心技术升级与开源生态建设进行了首次深度解读. 作为一款训练推理一体化.动静合一…
论文提出了结合注意力卷积的二叉神经树进行弱监督的细粒度分类,在树结构的边上结合了注意力卷积操作,在每个节点使用路由函数来定义从根节点到叶子节点的计算路径,结合所有叶子节点的预测值进行最终的预测,论文的创意和效果来看都十分不错   来源:晓飞的算法工程笔记 公众号 论文: Attention Convolutional Binary Neural Tree for Fine-Grained Visual Categorization 论文地址:https://arxiv.org/abs/1909.…
旷视MegEngine网络搭建 在 基本概念 中,介绍了计算图.张量和算子,神经网络可以看成一个计算图.在 MegEngine 中,按照计算图的拓扑结构,将张量和算子连接起来,即可完成对网络的搭建.MegEngine 提供了基于 functional 和基于 Module 的两种方式搭建网络. functional 仅提供最基本的算子功能,数据连接的工作完全由用户完成: Module 对网络模块(包含若干算子及其参数的基本单元)进行了进一步的封装,代码更易复用和维护. 基于 functional…
旷视MegEngine基本概念 MegEngine 是基于计算图的深度神经网络学习框架. 本文简要介绍计算图及其相关基本概念,以及它们在 MegEngine 中的实现. 计算图(Computational Graph) 下面通过一个简单的数学表达式 y=(w∗x)+by=(w∗x)+b 来介绍计算图的基本概念,如下图所示: 图1 从中可以看到,计算图中存在: 数据节点(图中的实心圈):如输入数据 xx . ww . bb ,运算得到的中间数据 pp ,以及最终的运算输出 yy : 计算节点(图中…
http://www.skicyyu.org/ https://zhuanlan.zhihu.com/p/61910297 俞刚,旷视研究院Detection组负责人.2014年博士毕业于新加坡南洋理工大学,加入旷视.主要负责检测,分割,跟踪,骨架,动作行为等方面的研究以及算法落地工作.俞刚博士带队参加 2017 COCO+Places 挑战赛获得检测第一名,人体姿态估计第一名:接着,带队参加 2018 COCO+Mapillary 挑战赛,获四项第一.…