我们相信开发自动驾驶技术是我们这个时代最大的工程挑战之一,行业和研究团体之间的合作将扮演重要角色。由于这个原因,我们一直在通过参加学术会议,以及最近推出的自动驾驶数据集和基于语义地图的3D对象检测的Kaggle竞赛,来帮助研究社区解决自动驾驶这个挑战。

自动驾驶数据集Level5链接:https://level5.lyft.com/dataset/

Kaggle竞赛链接:https://www.kaggle.com/c/3d-object-detection-for-autonomous-vehicles/

自动驾驶研究正以惊人的速度向前进步。为了进一步研究,我们今天共享了一种资源,这种资源对参与竞争的人以及自动驾驶更广泛的研究是有用的。每次会议结束后,我们都会发送一份读者文摘,在内部分享信息,并提出与自动驾驶相关的话题。现在,我们把这些提供给你!我们将在这个文章上分享这些内容,以便从流行会议中轻松找到与自动驾驶相关的主题。

CVPR 2019

在我们的第一期《公众读者文摘》中,我们从CVPR会议上为你介绍我们最喜欢的自动驾驶主题。CVPR是世界上最受欢迎的计算机视觉会议之一,最近在加利福尼亚长滩举行。1290篇论文被提交,其中有9000多参会者,包括来自Lyft团队的28人。我们已经过滤出有关自动驾驶的论文和相关的研讨会,包括视频和代码。链接:https://sites.google.com/view/wad2019

请继续关注我们的博客,我们将从2019年跟踪过去的会议,并为你提供我们在即将到来的会议上的发现。

Lyft 5级数据集

Lyft 5级数据集,有数千个带有人工标签的3D注释帧,一个可驾驶的表面地图(可驱动曲面图),以及能为资料提供情境的高画质度空间语意图(空间语义图)

我们在此数据集上的Kaggle竞赛现已开始!

感知与跟踪

Pseudo-LiDAR from Visual Depth Estimation: Bridging the Gap in 3D Object Detection for Autonomous Driving

基于视觉深度估计的伪激光雷达:填补自动驾驶三维目标检测的空白

论文:http://openaccess.thecvf.com/content_CVPR_2019/papers/Wang_Pseudo-LiDAR_From_Visual_Depth_Estimation_Bridging_the_Gap_in_3D_CVPR_2019_paper.pdf

代码:https://github.com/mileyan/pseudo_lidar

视频:https://www.youtube.com/watch?v=mNtXTTo6wzI

Cornell公司的论文,作者使用立体摄像机生成3d点云,不是由CNN处理点云,而是插入到激光雷达管道中处理。这个简单的技巧能带来意想不到的性能提升,在立体感知方面达到了新的SOTA性能。

PointPillars: Fast Encoders for Object Detection from Point Clouds

PointPillars:用于从点云中检测对象的快速编码器

论文:http://openaccess.thecvf.com/content_CVPR_2019/papers/Lang_PointPillars_Fast_Encoders_for_Object_Detection_From_Point_Clouds_CVPR_2019_paper.pdf

代码:https://github.com/nutonomy/second.pytorch

nuTonomy的论文,这篇论文探索了一种新的方法来预处理三维激光雷达输入格式转换到一个可以被二维CNN处理的二维图像,而不是由传统的三维CNN处理。这为激光雷达检测提供了新的SOTA性能。

ROI-10D: Monocular Lifting of 2D Detection to 6D Pose and Metric Shape

ROI-10D:单眼将2D检测提升为6D姿态以及公制形状

论文:http://openaccess.thecvf.com/content_CVPR_2019/papers/Manhardt_ROI-10D_Monocular_Lifting_of_2D_Detection_to_6D_Pose_and_CVPR_2019_paper.pdf

视频:https://www.youtube.com/watch?v=wCGCJW81LQc

丰田研究院的论文—作者联合了目标检测和单目深度预测为单目车辆检测实现新的SOTA性能。结果该网络不仅可以预测车辆的三维姿态,而且可以重建车辆的(部分)三维网格模型。

CVPR其他18篇感知与追踪论文→:

https://docs.google.com/spreadsheets/d/1pOjqWwY_MGohPwxUT5LVg1WVsTLZ0n77P4lUZ4UbgQk/edit#gid=2092320208

预测与计划

End-To-End Interpretable Neural Motion Planner

端到端的可解释的神经运动规划器

论文:http://openaccess.thecvf.com/content_CVPR_2019/papers/Zeng_End-To-End_Interpretable_Neural_Motion_Planner_CVPR_2019_paper.pdf

Uber ATG的论文——这篇论文探索了端到端可训练架构。论文通过将检测、感知、预测和计划整合到单个神经网络中,该神经网络生成单个模块的输出以及用于计划的成本函数。这些输出可以被检查,从而提高最终驾驶决策的可解释性。

Rules of the Road: Predicting Driving Behavior with a Convolutional Model of Semantic Interactions

道路规则:使用语义交互卷积模型预测驾驶行为

论文:http://openaccess.thecvf.com/content_CVPR_2019/papers/Hong_Rules_of_the_Road_Predicting_Driving_Behavior_With_a_Convolutional_CVPR_2019_paper.pdf

Zoox的论文—作者描述了一个端到端的神经网络来预测未来的汽车运动。该网络能够预测复杂的动作,同时也提供了不确定性的预测。

Multi-Step Prediction of Occupancy Grid Maps with Recurrent Neural Networks

递归神经网络的占用网格图的多步预测

论文:http://openaccess.thecvf.com/content_CVPR_2019/papers/Mohajerin_Multi-Step_Prediction_of_Occupancy_Grid_Maps_With_Recurrent_Neural_Networks_CVPR_2019_paper.pdf

视频:https://www.youtube.com/watch?v=Bskd0Z7eLFE

华为的论文—该网络仅使用原始传感器数据,不需要任何人工标注,可以预测未来其他车辆的运动和车辆周围的占用网格。

阅读CVPR的另外两篇预测与计划论文→:

https://docs.google.com/spreadsheets/d/1pOjqWwY_MGohPwxUT5LVg1WVsTLZ0n77P4lUZ4UbgQk/edit?usp=sharing

地图构建和定位

L3-Net: Towards Learning-Based LiDAR Localization for Autonomous Driving

L3-Net:面向自动驾驶的基于学习的激光雷达定位

论文:http://openaccess.thecvf.com/content_CVPR_2019/papers/Lu_L3-Net_Towards_Learning_Based_LiDAR_Localization_for_Autonomous_Driving_CVPR_2019_paper.pdf

视频:https://www.youtube.com/watch?v=dptbd4D78Mk

百度论文—作者使用神经网络以厘米级的精度定位在预先构建的LIDAR地图中。他们表明,所产生的性能可与最先进的手工方法相媲美。

Understanding the Limitations of CNN-Based Absolute Camera Pose Regression

理解基于CNN的绝对摄影机姿态回归的局限性

论文:http://openaccess.thecvf.com/content_CVPR_2019/papers/Lu_L3-Net_Towards_Learning_Based_LiDAR_Localization_for_Autonomous_Driving_CVPR_2019_paper.pdf

代码:https://github.com/tsattler/understanding_apr

视频:https://www.youtube.com/watch?v=7Efueln55P4

慕尼黑工业大学的论文—姿态回归神经网络是基于相机定位的最新进展。 然而,它们的性能仍然与基于特征的方法不对应。

BAD SLAM: Bundle Adjusted Direct RGB-D SLAM

论文:http://openaccess.thecvf.com/content_CVPR_2019/papers/Schops_BAD_SLAM_Bundle_Adjusted_Direct_RGB-D_SLAM_CVPR_2019_paper.pdf

代码:https://github.com/ETH3D/badslam

视频:https://www.youtube.com/watch?v=7Efueln55P4

苏黎世联邦理工学院的论文—论文探索了一种将视觉和深度快速融合到与激光雷达相机系统相关的多模态SLAM系统中的新方法。

阅读CVPR上的其他11张地图构建和定位→:

https://docs.google.com/spreadsheets/d/1pOjqWwY_MGohPwxUT5LVg1WVsTLZ0n77P4lUZ4UbgQk/edit?usp=sharing

模拟,安全性和稀有事件的长尾

Why ReLU Networks Yield High-Confidence Predictions Far Away From the Training Data, and How to Mitigate the Problem

为什么ReLU 网络远离训练数据就能获得高可信度的预测,以及如何减轻问题的影响

论文:http://openaccess.thecvf.com/content_CVPR_2019/papers/Hein_Why_ReLU_Networks_Yield_High-Confidence_Predictions_Far_Away_From_the_CVPR_2019_paper.pdf

代码:https://github.com/joe-siyuan-qiao/NeuralRejuvenation-CVPR19

图宾根大学(University ofTübingen)的论文—自动驾驶的一个主要问题是,在“从未见过的”场景中,神经网络的性能很差,并且会产生高置信度的错误预测。 本文展示了如何使用对抗性优化过程来解决这些问题。

Latent Space Autoregression for Novelty Detection

新颖性检测的潜在空间自回归

论文:http://openaccess.thecvf.com/content_CVPR_2019/papers/Abati_Latent_Space_Autoregression_for_Novelty_Detection_CVPR_2019_paper.pdf

代码:https://github.com/joe-siyuan-qiao/NeuralRejuvenation-CVPR19

来自摩德纳大学的论文—为了检测网络是否首次看到新事物,本文探讨了将自编码器与潜在编码上的密度估计器结合使用的方法。

Parametric Noise Injection: Trainable Randomness to Improve Deep Neural Network Robustness against Adversarial Attack

论文:http://openaccess.thecvf.com/content_CVPR_2019/papers/He_Parametric_Noise_Injection_Trainable_Randomness_to_Improve_Deep_Neural_Network_CVPR_2019_paper.pdf

参数噪声注入:可训练的随机性,以提高针对对抗攻击的深度神经网络的鲁棒性

来自佛罗里达大学的论文—神经网络的问题之一是它们可能会受到对抗攻击的欺骗,这是网络产生高置信度但是是错误预测的一种特殊情况。本文展示了如何通过在训练过程中注入噪声来减轻这种情况。

另请参阅CVPR的六篇模拟,安全性和稀有事件的长尾论文→:

https://docs.google.com/spreadsheets/d/1pOjqWwY_MGohPwxUT5LVg1WVsTLZ0n77P4lUZ4UbgQk/edit?usp=sharing

机器学习效率,准确性和优化

Bag of Tricks for Image Classification with Convolutional Neural Networks

带有卷积神经网络的图像分类技巧包

论文:http://openaccess.thecvf.com/content_CVPR_2019/papers/He_Bag_of_Tricks_for_Image_Classification_with_Convolutional_Neural_Networks_CVPR_2019_paper.pdf

代码:https://github.com/weiaicunzai/Bag_of_Tricks_for_Image_Classification_with_Convolutional_Neural_Networks

来自亚马逊的论文—机器学习(ML)实践者用来调整ML系统性能的日常技术的全面收集。

Neural Rejuvenation: Improving Deep Network Training by Enhancing Computational Resource Utilization

神经复兴:通过提高计算资源的利用率来改善深层网络训练

论文:http://openaccess.thecvf.com/content_CVPR_2019/papers/Qiao_Neural_Rejuvenation_Improving_Deep_Network_Training_by_Enhancing_Computational_Resource_CVPR_2019_paper.pdf

代码:https://github.com/joe-siyuan-qiao/NeuralRejuvenation-CVPR19

来自Adobe的论文—该研究探索了一种训练神经网络的新优化方法,该方法可以在训练过程中重新分配“死神经元”以改善性能或缩小模型。如本文中所示,这大大提高了各种SOTA网络的性能。

Auto-DeepLab: Hierarchical Neural Architecture Search for Semantic Image Segmentation

Auto-DeepLab:搜索语义图像分割的分层神经架构

论文:http://openaccess.thecvf.com/content_CVPR_2019/papers/Liu_Auto-DeepLab_Hierarchical_Neural_Architecture_Search_for_Semantic_Image_Segmentation_CVPR_2019_paper.pdf

视频:https://www.youtube.com/watch?v=ltlhQXHGzgE

Google论文—有一种自动搜索最佳NN体系结构的方法,而不是经典的手动超参数调整方法。本文中用于语义分割的解决方案优于手动找到的解决方案,并且在许多基准测试中均达到了SOTA性能。

另请参阅CVPR的七篇机器学习效率,准确性和优化论文→:

https://docs.google.com/spreadsheets/d/1pOjqWwY_MGohPwxUT5LVg1WVsTLZ0n77P4lUZ4UbgQk/edit

欢迎关注磐创博客资源汇总站:

http://docs.panchuang.net/

欢迎关注PyTorch官方中文教程站:

http://pytorch.panchuang.net/

自动驾驶研究回顾:CVPR 2019摘要的更多相关文章

  1. 向通用自动驾驶部门Cruise投资22.5亿美元,软银打得什么主意?

    5月29日,加利福尼亚州的一辆特斯拉Model S撞上停在路边的警车.据透露,当时这辆特斯拉正处于自动辅助驾驶即Autopilot模式.而在今年,这已经不是第一次特斯拉自动驾驶模式出问题了.此外,Ub ...

  2. 斯坦福发布2019全球AI报告:中国论文数量超美国,自动驾驶汽车领域获投资最多

    近日,斯坦福联合MIT.哈佛.OpenAI等院校和机构发布了一份291页的<2019年度AI指数报告>. 这份长达291页的报告从AI的研究&发展.会议.技术性能.经济.教育.自动 ...

  3. CVPR 2019轨迹预测竞赛冠军方法总结

    背景 CVPR 2019 是机器视觉方向最重要的学术会议,本届大会共吸引了来自全世界各地共计 5160 篇论文,共接收 1294 篇论文,投稿数量和接受数量都创下了历史新高,其中与自动驾驶相关的论文. ...

  4. <转载> 从算法上解读自动驾驶是如何实现的?

     科技新闻小鹏汽车2016-03-28 10:42 [摘要]车辆路径规划问题中路网模型.路径规划算法和交通信息的智能预测为关键点. 由于驾驶员的驾驶工作繁重,同时随着汽车拥有量的增加,非职业驾驶员的数 ...

  5. 深度学习与自动驾驶领域的数据集(KITTI,Oxford,Cityscape,Comma.ai,BDDV,TORCS,Udacity,GTA,CARLA,Carcraft)

    http://blog.csdn.net/solomon1558/article/details/70173223 Torontocity HCI middlebury caltech 行人检测数据集 ...

  6. Waymo在美国推出自动驾驶汽车共享服务

    导读 经过数月的测试和数百万英里的无人驾驶汽车技术开发,Waymo 正式在美国推出了具有商业性质的自动驾驶汽车的共享服务. 该公司的 Waymo One 项目将为客户提供 24 小时自动驾驶汽车服务. ...

  7. 开源自动驾驶仿真平台 AirSim (1) - Unreal Engine

    AirSim 官方Github: https://github.com/Microsoft/AirSim AirSim 是微软的开源自动驾驶仿真平台(其实它还能做很多事情,这里主要用于自动驾驶仿真研究 ...

  8. julia应用于自动驾驶汽车、机器人、3D 打印、精准医疗、增强现实、基因组学、能源交易、机器学习、金融风控和太空任务设计等多个领域

    编程界的新宠 Julia 发布 1.0 正式版本,多种优势集于一身2018-08-14 14:14 公司Julia 的累积下载次数超过 200 万,已被应用于自动驾驶汽车.机器人.3D 打印.精准医疗 ...

  9. Preparing Cities for Robot Cars【城市准备迎接自动驾驶汽车】

    Preparing Cities for Robot Cars The possibility of self-driving robot cars has often seemed like a f ...

随机推荐

  1. C++走向远洋——63(项目二2、两个成员的类模板)

    */ * Copyright (c) 2016,烟台大学计算机与控制工程学院 * All rights reserved. * 文件名:text.cpp * 作者:常轩 * 微信公众号:Worldhe ...

  2. 位运算基础(Uva 1590,Uva 509题解)

    逻辑运算 规则 符号 与 只有1 and 1 = 1,其他均为0 & 或 只有0 or 0 = 0,其他均为1 | 非 也就是取反 ~ 异或 相异为1相同为0 ^ 同或 相同为1相异为0,c中 ...

  3. Deepin环境下启动Pycharm没有启动图标解决办法

    小伙伴们在deepin下运行pycharm时,是不是需要通过sh文件启动? 下面告诉大家如何将pycharm图标放在桌面上: 1.在桌面打开终端,输入命令: sudo gedit /usr/share ...

  4. springmvc.xml 中报错:Start state is missing. Add at least one state to the flow

    最近一个学弟问我关于整合springMVC和spring出现的配置文件springmvc.xml出现的Start state is missing. Add at least one state to ...

  5. 峰哥说技术:07-SpringBoot 正好Thymeleaf视图

    Spring Boot深度课程系列 峰哥说技术—2020庚子年重磅推出.战胜病毒.我们在行动 07  峰哥说技术:SpringBoot 正好Thymeleaf视图 Spring Boot视图介绍 虽然 ...

  6. Java easyui 下拉框默认选中第一个

    html代码: <tr> <td> <div style="margin-bottom:5px">计价方式:   <%--下拉框默认选中第 ...

  7. Fabric 源码学习:如何实现批量管理远程服务器?

    前不久,我写了一篇<Fabric教程>,简单来说,它是一个用 Python 开发的轻量级的远程系统管理工具,在远程登录服务器.执行 Shell 命令.批量管理服务器.远程部署等场景中,十分 ...

  8. 《即时消息技术剖析与实战》学习笔记12——IM系统如何提升图片、音视频消息发送、浏览的体验

    IM系统如何提升用户发送.浏览图片和音视频消息的体验呢?一是保证图片.音视频消息发送得又快又稳,二是保证用户浏览播放图片.音视频消息时流畅不卡顿. 一.提升用户发送图片.音视频的体验 1. 多上传接入 ...

  9. 简单配置Vue路由

    简单配置Vue路由 1.  创建一个单文件组件Test.vue <template> <div>Test</div> </template> <s ...

  10. 简说Python之IO

    闺女,你在玩电脑什么游戏? 爸爸,我在玩植物大战僵尸呢. 闺女,你知道什么是输入输出设备吗? 爸爸,??? 你看,咱们的键盘和鼠标 ,就是可以控制那些植物的工具.这些发出指令的就是输入设备.咱们可以用 ...