全景分割:CVPR2019论文解析 Panoptic Segmentation 论文链接: http://openaccess.thecvf.com/content_CVPR_2019/papers/Kirillov_Panoptic_Segmentation_CVPR_2019_paper.pdf For results: https://arxiv.org/abs/1801.00868. 摘要 本文提出并研究了一个称为全景分割(PS)的任务.全景分割是典型的语义分割(为每个像素指定一个类标签…
全景分割pipeline搭建 整体方法使用语义分割和实例分割结果,融合标签得到全景分割结果: 数据集使用:panoptic_annotations_trainval2017和cityscapes; panoptic_annotations_trainval2017标签为全景分割的整体标签,之前想打算转换成语义和实例分割标签,在分别做各自任务,由于转换发现有一些格式损坏的样本在里面,需要挑出来才能继续转换,就暂时换成cityscpaes; cityscapes:发现val里面,test里面也有一些…
目录 Visualizing and Understanding Convolutional Networks 论文复现笔记 Abstract Introduction Approach Visualization with a Deconvnet 关于Deconvnet的实现 Convnet Visualization 对于一个给定的Feature map,论文中展示了最高的9个激活,并把每个激活投影到像素空间,同时对于可视化的像素空间,论文同样展示了相关的图片区域. 这个地方挺有意思的,也可…
全景分割是18年新推出的一个任务,它要求同时分割出目标和背景,也就是既有实例分割也有语义分割,用官方的话讲是朝着真实世界视觉系统的重要一步 如图所示,里面既有对天空,草地等stuff的分割,也有对目标实例的分割. 这项任务加入到了2018年的挑战赛,结果会在ECCV2018的workshop上展示.…
CVPR2020论文解读:三维语义分割3D Semantic Segmentation xMUDA: Cross-Modal Unsupervised Domain Adaptation  for 3D Semantic Segmentation 摘要 无监督域自适应(UDA)对于解决新域中缺少注释的问题至关重要.有许多多模态数据集,但大多数UDA方法都是单模态的.在这项工作中,我们探索如何从多模态学*,并提出跨模态UDA(xMUDA),其中我们假设存在二维图像和三维点云进行三维语义分割.这是一…
近日,PyTorch 社区发布了一个深度学习工具包 PyTorchHub, 帮助机器学习工作者更快实现重要论文的复现工作.PyTorchHub 由一个预训练模型仓库组成,专门用于提高研究工作的复现性以及新的研究.同时它还内置了对Google Colab的支持,并与Papers With Code集成.目前 PyTorchHub 包括了一系列与图像分类.分割.生成以及转换相关的模型. 可复现性是许多研究领域的基本要求,这其中当然包括基于机器学习技术的研究领域.然而, 许多机器学习相关论文要么无法复…
继续上一篇的内容,上一篇讲解了Bootstrap Your Onw Latent自监督模型的论文和结构: https://juejin.cn/post/6922347006144970760 现在我们看看如何用pytorch来实现这个结构,并且在学习的过程中加深对论文的理解. github:https://github.com/lucidrains/byol-pytorch [前沿]:这个代码我没有实际跑过,毕竟我只是一个没有GPU的小可怜. 主要模型代码 class BYOL(nn.Modul…
小白的经典CNN复现系列(一):LeNet-1989 之前的浙大AI作业的那个系列,因为后面的NLP的东西我最近大概是不会接触到,所以我们先换一个系列开始更新博客,就是现在这个经典的CNN复现啦(。・ω・。) 在开始正式内容之前,还是有些小事情提一下,免得到时候评论区的dalao们对我进行严格的批评教育······ 首先呢,我会尽可能地按照论文里面的模型参数进行复现,论文里面说的什么我就写什么.但是由于我本人还是个小白,对于有些算法(比如什么拟牛顿法什么的)实在是有点苦手,而且CNN也基本上就只…
这篇笔记,仅仅是对选择性算法介绍一下原理性知识,不对公式进行推倒. 前言: 这篇论文介绍的是,如果快速的找到的可能是物体目标的区域,不像使用传统的滑动窗口来暴力进行区域识别.这里是使用算法从多个维度对找到图片中,可能的区域目标,减少目标碎片,提升物体检测效率. 下面是这篇文章的笔记: 介绍及引言: 图片是分层次的,比如下图中a: 沙拉和匙在沙拉碗里,而碗又在桌子上,另外桌子和木头有关或者说桌子和桌子上的所有东西有关.所以图片中的目标是有层次的. 图片分割应该按层次来,也不存在使用单个策略这样通用…
摘要:LaneNet是一种端到端的车道线检测方法,包含 LanNet + H-Net 两个网络模型. 本文分享自华为云社区<[论文解读]LaneNet基于实体分割的端到端车道线检测>,作者:一颗小树x. 前言 这是一种端到端的车道线检测方法,包含LanNet+H-Net两个网络模型. LanNet是一种多任务模型,它将实例分割任务拆解成"语义分割"和"对像素进行向量表示",然后将两个分支的结果进行聚类,得到实例分割的结果. H-Net是个小网络,负责预测…