深度学*点云语义分割:CVPR2019论文阅读 Point Cloud Oversegmentation with Graph-Structured Deep Metric Learning 摘要 本文提出了一个新的超级学*框架,用于将三维点云过度分割为超点.本文将此问题转化为学*三维点的局部几何和辐射测量的深度嵌入,从而使物体边界呈现高对比度.嵌入计算使用轻量级神经网络在点的局部邻域上操作.最后,本文将点云过分集描述为一个与学*嵌入相关的图划分问题.这种新方法允许本文在密集的室内数据集(S3D…
CVPR2020:4D点云语义分割网络(SpSequenceNet) SpSequenceNet: Semantic Segmentation Network on 4D Point Clouds 论文地址: https://openaccess.thecvf.com/content_CVPR_2020/papers/Shi_SpSequenceNet_Semantic_Segmentation_Network_on_4D_Point_Clouds_CVPR_2020_paper.pdf 摘要…
多目标跟踪:CVPR2019论文阅读 Robust Multi-Modality Multi-Object Tracking  论文链接:https://arxiv.org/abs/1909.03850 代码链接:https://github.com/ZwwWayne/mmMOT 摘要 在自主驾驶系统中,多传感器感知是保证系统可靠性和准确性的关键,而多目标跟踪(MOT)则是通过跟踪动态目标的序列运动来提高系统的可靠性和准确性.目前大多数的多传感器多目标跟踪方法要么依赖于单一的输入源(如中心摄像机…
快速人体姿态估计:CVPR2019论文阅读 Fast Human Pose Estimation 论文链接: http://openaccess.thecvf.com/content_CVPR_2019/papers/Zhang_Fast_Human_Pose_Estimation_CVPR_2019_paper.pdf 摘要 现有的人体姿态估计方法通常只考虑如何提高模型的泛化性能,而忽略了显著的效率问题.这导致在实际应用中开发可扩展性和成本效益较差的重型模型.在这项工作中,我们研究了研究不足但…
一. 算法概述 本文提出的SSD算法是一种直接预测目标类别和bounding box的多目标检测算法.与faster rcnn相比,该算法没有生成 proposal 的过程,这就极大提高了检测速度.针对不同大小的目标检测,传统的做法是先将图像转换成不同大小(图像金字塔),然后分别检测,最后将结果综合起来(NMS).而SSD算法则利用不同卷积层的 个).最后将前面三个计算结果分别合并然后传给loss层. 二. Default box 文章的核心之一是作者同时采用lower和upper的featur…
一. 算法概述 本文提出的SSD算法是一种直接预测目标类别和bounding box的多目标检测算法.与faster rcnn相比,该算法没有生成 proposal 的过程,这就极大提高了检测速度.针对不同大小的目标检测,传统的做法是先将图像转换成不同大小(图像金字塔),然后分别检测,最后将结果综合起来(NMS).而SSD算法则利用不同卷积层的 feature map 进行综合也能达到同样的效果.文章的核心之一是同时采用lower和upper的feature map做检测.          …
3D点云深度学* 在自动驾驶中关于三维点云的深度学*方法应用.三维场景语义理解的方法以及对应的关键技术介绍. 1. 数据 但是对于3D点云,数据正在迅速增长.大有从2D向3D发展的趋势,比如在opencv中就已经慢慢包含了3D点云的处理的相关模块,在数据方面点云的获取也是有多种渠道, 无论是源于CAD模型还是来自LiDAR传感器或RGBD相机的扫描点云,无处不在. 另外,大多数系统直接获取3D点云而不是拍摄图像并进行处理.因此,在深度学*大火的年代,应该如何应用这些令人惊叹的深度学*工具,在3D…
CVPR2020:点云弱监督三维语义分割的多路径区域挖掘 Multi-Path Region Mining for Weakly Supervised 3D Semantic Segmentation on Point Clouds 论文地址: https://openaccess.thecvf.com/content_CVPR_2020/papers/Wei_Multi-Path_Region_Mining_for_Weakly_Supervised_3D_Semantic_Segmentat…
语义分割--全卷积网络FCN详解   1.FCN概述 CNN做图像分类甚至做目标检测的效果已经被证明并广泛应用,图像语义分割本质上也可以认为是稠密的目标识别(需要预测每个像素点的类别). 传统的基于CNN的语义分割方法是:将像素周围一个小区域(如25*25)作为CNN输入,做训练和预测.这样做有3个问题: - 像素区域的大小如何确定 - 存储及计算量非常大 - 像素区域的大小限制了感受野的大小,从而只能提取一些局部特征 为什么需要FCN? 我们分类使用的网络通常会在最后连接几层全连接层,它会将原…
  最近在调研3D算法方面的工作,整理了几篇多视角学习的文章.还没调研完,先写个大概.   基于RGBD的语义分割的工作重点主要集中在如何将RGB信息和Depth信息融合,主要分为三类:省略. 目录 1.(ICCV2017)<RDFNet: RGB-D Multi-level Residual Feature Fusion for Indoor Semantic Segmentation> 2.(2018 Arxiv)RedNet:Residual Encoder-Decoder Networ…