3d图像识别基础论文:pointNet阅读笔记
PointNet 论文阅读:
主要思路:输入独立的点云数据,进行变换不变性处理(T-net)后,通过pointNet网络训练后,最后通过最大池化和softMax分类器,输出评分结果。
摘要:
相较于之前其他处理点云数据的论文,将数据转换为三维体素网格或者图象集合,pointNet最大的不同是,对于点云数据,会直接进行处理,而非将点云数据进行格式化处理,从而避免了将点云数据格式化后,产生的unnecessarily voluminous以及像素点失真的问题。
点云的问题:
- 无序。与图像中的像素阵列或体积网格中的体素阵列不同,点云是一组没有特定顺序的点。 换句话说,处理N个3D点集合就会有n!种排列方式。
处理方法:
提出了三种方法:
1)将输入排序为规范的顺序;(对于扰动不稳定)
2)将输入作为一个序列来训练一个RNN,但是用各种排列来增加训练数据; (顺序无法被完全忽视)
3)使用简单的对称函数来汇总每个点的信息。
首先采取mlp提取特征(只有*和+的对称函数)并且采用最大池化函数,导致输出结果不受集合中点的排列顺序影响。
深度网络模拟通用对称函数:

输入总共n个点的无序云图点集({x1,x2 … , xn}), 通用函数f 输出该云图分类(汽车,书桌,飞机)。其中h函数用MLP网络模拟:g用最大池化模拟。
2.点之间的相互作用。点来自具有距离度量的空间。这意味着点不是孤立的,相邻点形成一个有意义的子集。 因此,该模型需要能够从附近的点捕获局部结构,以及局部结构之间的组合相互作用。分割和语义分析需要考虑到点之间的相互作用。
处理方法:在分割网络中,将局部特征和全局特征连接,并进行进一步的特征提取,最终提取的结果与局部和全局特征相关。
3.变换下的不变性。 作为一个几何对象,点集的学习表示对某些变换应该是不变的。 例如,旋转点和平移点不应该修改全局点云类别或点的分割。对于一个3D图像,当我们进行例如旋转、上移等操作时,不论是目标分类还是部分分割,都应保证其结果不变。
处理方法:论文作者提出了在进行特征提取之前,先对点云数据进行对齐的方式来保证不变性。对齐操作是通过训练一个小型的网络(T-net,类似于大型网络,由点独立特征提取,最大池化和全连接层的基本模块组成)来得到转换矩阵,并将之和输入点云数据相乘来实现.相当于在数据预处理阶段直接进行处理,保证其后的结果不变性。
4.点云具有稀疏性(信息点提取)。
处理方法:网络高效地学习一组优化功能/标准,选择点云的信息点,并对其选择原因进行编码。
方法:
- 网络分析:

1.三个初始纬度。 2.T-net对齐处理 3.最大池化合并特征,解决无序性 4.连接全局和局部特征 4.softmax分类器
- 两个定理:

和神经网络一样,该网络也可以拟合任意的连续集合函数。

对噪声和缺失的鲁棒性。

创新点:
- 对称函数处理无序性处理。
- t-net微型网络进行变换不变性处理。
- 全局变量和局部变量合并处理相关性。
应用:神经网络对于无序的信息点的处理。
问题:
1.正则项:相较于前一个3 * 3变换矩阵,后面的变换矩阵为64 * 64 = 4096,由于变换矩阵过大,通过添加正则项,使变换矩阵近似于正交矩阵,此时所需要的参数将大大减少。
2.T-net网络实现的细节:(如何具体实现对齐和变换不变性)。
3.两个定理的证明过程。
3d图像识别基础论文:pointNet阅读笔记的更多相关文章
- 关于 AlphaGo 论文的阅读笔记
这是Deepmind 公司在2016年1月28日Nature 杂志发表论文 <Mastering the game of Go with deep neural networks and tre ...
- 论文阅读笔记“Attention-based Audio-Visual Fusion for Rubust Automatic Speech recognition”
关于论文的阅读笔记 论文的题目是“Attention-based Audio-Visual Fusion for Rubust Automatic Speech recognition”,翻译成中文为 ...
- 论文阅读笔记(七)【TIP2018】:Video-Based Person Re-Identification by Simultaneously Learning Intra-Video and Inter-Video Distance Metrics
是由一篇 IJCAI2016 扩的期刊. 该篇会议论文的阅读笔记[传送门] 期刊扩充的部分:P-SI2DL 1.问题描述: 在会议论文中介绍的SI2DL方法采用了视频三元组作为视频关系(是否匹配)的逻 ...
- [论文阅读笔记] GEMSEC,Graph Embedding with Self Clustering
[论文阅读笔记] GEMSEC: Graph Embedding with Self Clustering 本文结构 解决问题 主要贡献 算法原理 参考文献 (1) 解决问题 已经有一些工作在使用学习 ...
- [论文阅读笔记] Fast Network Embedding Enhancement via High Order Proximity Approximati
[论文阅读笔记] Fast Network Embedding Enhancement via High Order Proximity Approximation 本文结构 解决问题 主要贡献 主要 ...
- [论文阅读笔记] Are Meta-Paths Necessary, Revisiting Heterogeneous Graph Embeddings
[论文阅读笔记] Are Meta-Paths Necessary? Revisiting Heterogeneous Graph Embeddings 本文结构 解决问题 主要贡献 算法原理 参考文 ...
- 论文阅读笔记 - YARN : Architecture of Next Generation Apache Hadoop MapReduceFramework
作者:刘旭晖 Raymond 转载请注明出处 Email:colorant at 163.com BLOG:http://blog.csdn.net/colorant/ 更多论文阅读笔记 http:/ ...
- 论文阅读笔记 - Mesos: A Platform for Fine-Grained ResourceSharing in the Data Center
作者:刘旭晖 Raymond 转载请注明出处 Email:colorant at 163.com BLOG:http://blog.csdn.net/colorant/ 更多论文阅读笔记 http:/ ...
- 论文阅读笔记 Word Embeddings A Survey
论文阅读笔记 Word Embeddings A Survey 收获 Word Embedding 的定义 dense, distributed, fixed-length word vectors, ...
随机推荐
- BZOJ2277[Poi2011]Strongbox——数论
题目描述 Byteasar is a famous safe-cracker, who renounced his criminal activity and got into testing and ...
- BZOJ1283 序列(费用流)
不妨看做是先用k个指针指向被选择的前k个元素,然后每次将选中当前第一个元素的指针移到最后,并且需要满足位置变化量>=m.显然这样可以构造出所有的合法方案.那么可以以此建立费用流模型,以一条流量k ...
- 睡前小dp-poj1276-多重背包+二进制优化
http://poj.org/problem?id=1276 简单的多重背包,不过需要优化一下才能过.网上还有暴力的做法. 二进制优化在背包九讲里讲的比较清楚.对于多重背包的每一件物品,使用二进制的形 ...
- MT【39】构造二次函数证明
这种构造二次函数的方法最早接触的应该是在证明柯西不等式时: 再举一例: 最后再举个反向不等式的例子: 评:此类题目的证明是如何想到的呢?他们都有一个明显的特征$AB\ge(\le)C^2$,此时构造二 ...
- BUPT2017 wintertraining(15) #1 题解
拖了一周才完成的题解,抛出一个可爱的表情 (っ'-')╮ =͟͟͞͞❤️.对我来说E.F比较难,都是线段树的题,有点久没写了. A - Infinite Sequence CodeForces - 6 ...
- 【UOJ#275】组合数问题(卢卡斯定理,动态规划)
[UOJ#275]组合数问题(卢卡斯定理,动态规划) 题面 UOJ 题解 数据范围很大,并且涉及的是求值,没法用矩阵乘法考虑. 发现\(k\)的限制是,\(k\)是一个质数,那么在大组合数模小质数的情 ...
- 51nod 1462 树据结构 | 树链剖分 矩阵乘法
题目链接 51nod 1462 题目描述 给一颗以1为根的树. 每个点有两个权值:vi, ti,一开始全部是零. Q次操作: 读入o, u, d o = 1 对u到根上所有点的vi += d o = ...
- Elasticsearch 常见问题的解决思路
本文为es性能监控基础的扩展,大家可以先看下性能监控基础,熟悉下es的基本原理.为翻译性质文档,感谢原作者,原始文档地址 类似于汽车的运行方式,Elasticsearch旨在让用户快速上手和运行,而无 ...
- bzoj3545 Peaks
题意:多次求从点x出发经过边权不超过k的边能走到的点中第k大的权值. 解:离线排序 + 并查集 + 线段树合并. 题面有锅...是第k大的权值不是第k大的山. #include <cstdio& ...
- CF321E Ciel and Gondolas
题意:给定序列,将其分成k段.如果[l, r]在一段,那么每对不相同的i,j∈[l, r]都会有ai,j的代价.求最小总代价. 解:提供两种方案.第三种去bzoj贞鱼的n²算法. 决策单调性优化: 对 ...