视觉SLAM中的数学基础 第四篇 李群与李代数(2)
前言
理解李群与李代数,是理解许多SLAM中关键问题的基础。本讲我们继续介绍李群李代数的相关知识,重点放在李群李代数的微积分上,这对解决姿态估计问题具有重要意义。
回顾
为了描述三维空间里的运动,我们使用3$\times $3的旋转矩阵$\mathbf{R}$来描述一个刚体的旋转,并且,用4$\times$4的变换矩阵来描述六自由度的旋转+平移。这两种矩阵在传统的欧氏空间$\mathbb{R}^{3 \times 3}$和$\mathbb{R}^{4 \times 4}$中,不存在加法运算,只有乘法运算,故无法构成线性空间,只能构成群。也就是我们说的李群$SO(3)$和$SE(3)$:
\[\begin{equation}
SO(3) = \{ \mathbf{R} \in \mathbb{R}^{3 \times 3} | \mathbf{R R}^T = \mathbf{I}, det(\mathbf{R})=1 \}
\end{equation}\]
\[\begin{equation}
SE(3) = \left\{ \mathbf{T} = \left[ {\begin{array}{*{20}{c}}
\mathbf{R} & \mathbf{t} \\
{{\mathbf{0}^T}} & 1
\end{array}} \right]
\in \mathbb{R}^{4 \times 4} | \mathbf{R} \in SO(3), \mathbf{t} \in \mathbb{R}^3\right\}
\end{equation}\]
在李群中,我们使用矩阵来表达一个旋转和平移,这存在冗余的自由度。三维空间的旋转只有三自由度,旋转+平移有六自由度。因此,我们希望寻找一个没有冗余自由度(但是相应的存在奇异性)的表示,也就是李代数$\mathfrak{so}(3)$和$\mathfrak{se}(3)$:
\[\begin{equation}
\mathfrak{so}(3) = \{ \mathbf{\phi} \in \mathbb{R}^{3} \}
\end{equation}\]
\[\begin{equation}
\mathfrak{se}(3) = \{ \mathbf{\xi } \in \mathbb{R}^{6} \}
\end{equation}\]
怎么将李代数和李群元素对应起来呢?我们说,从李代数到李群,通过指数映射;反之,从李群到李代数,则通过对数映射。
$\mathfrak{so}(3)$的一个元素$\mathbf{\phi}=\mathbf{a} \theta $的指数映射为:
\[\begin{equation} exp\left( {{\phi ^ \wedge }} \right) = \cos \theta {\bf{I}} + (1 - \cos \theta ){\bf{a}}{{\bf{a}}^T} + \sin \theta {{\bf{a}}^ \wedge } \end{equation}\]
其中$\wedge$算符把一个三维向量变换为它对应的反对称矩阵(3$\times $3)。
该式和Rodrigues(罗德里格斯)公式是一致的。说明李代数$\mathfrak{so}(3)$里的向量,其方向指向旋转轴,而模长表示转过的角度。因此,平时用的rpy欧拉角,实际上是李代数之一。另一点需要说明的是,指数映射是一个满射而非单射。由于旋转具有周期性,多转360度和不转,表示的是同一个旋转。如果我们把旋转限制在正负180度内,那么李群到李代数就是一一对应的。
反之,对数映射$\ln {\left( \mathbf{R} \right)^ \vee }$将一个旋转矩阵转换为一个李代数。但由于对数的泰勒展开不是很优雅,通常直接按照下式计算李代数向量的大小和方向:
\[ \begin{equation} \begin{array}{l}
\theta = {\cos ^{ - 1}}\frac{{tr\left( \mathbf{R} \right) - 1}}{2} + 2k\pi \\
\mathbf{Ra = a}
\end{array} \end{equation} \]
根据该结果得到的$\mathbf{\phi} = \theta \mathbf{a}$就是对应的李代数了。到这为止的内容都在上一讲中介绍过,本讲我们就接着往下说。
$SE(3)$中的指数映射和对数映射
$\mathfrak{se}(3)$里的向量经常写成$\mathbf{\xi}$。它是一个六维向量,通常前三维为平移,后三维为旋转(也就是$\mathfrak{so}(3)$里的元素)。请注意,有些地方的定义是倒过来的,即前三维为旋转,后三维为平移,在使用的时候一定要小心!例如g2o的李代数和Sohpus的李代数定义就不一样。
记$\mathbf{\xi}=[\mathbf{\rho}, \mathbf{\phi}]^T$,它们各为三维向量,一共组成了六维,构成一个李代数。我们的记法里$\rho$为平移,$\phi$为旋转,与$SO(3)$中一致。
与$SO(3)$类似,$\mathfrak{se}(3)$到$SE(3)$的指数映射为:
\[ \begin{equation} \begin{array}{lll}
\exp \left( {{\xi ^ \wedge }} \right) &=& \sum\limits_{n = 0}^\infty {\frac{1}{{n!}}{{\left( {{\xi ^ \wedge }} \right)}^n}} \\
&=& \left[ {\begin{array}{*{20}{c}}
{\exp \left( {{\phi ^ \wedge }} \right)}&{ \mathbf{J\rho} }\\
{{0^T}}&1
\end{array}} \right]
\end{array} \end{equation} \]
请注意该式左上即 $SO(3)$ 的指数映射,右上较特殊一些,是平移量 $\mathbf{\rho}$ 的线性表示。其系数$\mathbf{J}_{3\times 3}$的计算方式如下:
\[\begin{array}{lll}
\mathbf{J} &=& \sum\limits_{n = 0}^\infty {\frac{1}{{\left( {n + 1} \right)!}}{{\left( {{ \mathbf{\phi} ^ \wedge }} \right)}^n}} \\
&=& \frac{{\sin \theta }}{\theta }I + \left( {1 - \frac{{\sin \theta }}{\theta }} \right) \mathbf{a}{\mathbf{a}^T} + \frac{{1 - \cos \theta }}{\theta }{\mathbf{a}^ \wedge }
\end{array}\]
它与Rodrigues相似但有差别,实际上是对$\phi$求了一次导数,所以这个阵也就记成了$\mathbf{J}$,意为一个雅可比阵。它在后续许多地方会用到,所以现在单独提一下它。
这个矩阵是可逆的,它的逆形式如下:
\[\begin{equation} {\mathbf{J}^{ - 1}} = \frac{\theta }{2}\cot \frac{\theta }{2}I + \left( {1 - \frac{\theta }{2}\cot \frac{\theta }{2}} \right)a{a^T} - \frac{\theta }{2}{a^ \wedge } \end{equation}\]
嗯,现在我们说清了$SE(3)$上的指数映射。那么它的对数映射怎么计算呢?也就是一个$SE(3)$中的矩阵怎么找到对应的向量呢?我们并不需要实际地计算一个矩阵对数,而只需要计算:
对于
\[\mathbf{T} = \left[ {\begin{array}{*{20}{c}}
\mathbf{R} & \mathbf{t}\\
{{0^T}}&1
\end{array}} \right]\]
它对应的李代数 $\mathbf{\xi}=[\mathbf{\rho}, \mathbf{\phi}]^T$ 为:
\[ \begin{equation} \phi = \ln {\left( R \right)^ \vee },\rho = {J^{ - 1}}t \end{equation} \]
因为已经有了$SO(3)$上的计算方式,这里的式子就变得十分简单了。
Baker-Campbell-Hausdorff公式
小萝卜:师兄我还有个问题啊。
师兄:嗯你说。
小萝卜:李群和李代数的对应关系倒是不难啦。但实际用的时候,我经常在李群上做两个矩阵的乘法。例如,做$\mathbf{R_1} \cdot \mathbf{R_2}$时,它们对应的李代数发生了什么呢?是不是直接加起来啊?
对,这就是我们要讨论的问题,即:
\[ \begin{equation} \exp \left( {\phi _1^ \wedge } \right)\exp \left( {\phi _2^ \wedge } \right) = \exp \left( {{{\left( {{\phi _1} + {\phi _2}} \right)}^ \wedge }} \right) \end{equation} \]
成立吗?
如果该式成立的话,李群和李代数的结构就很方便了。因为我们可以直接把李群的乘法变成李代数的加法,而不需要改变任何东西。直观上,两个指数函数相乘,也确实等于把幂加起来,再取指数。唯一不同的是,这里我们不是对一个数求指数,而是求一个反对称矩阵的指数。
但是成不成立呢?
很遗憾,虽然我们非常希望该式成立,但是实质上它是不满足的。Baker-Campbell-Hausdorff公式(https://en.wikipedia.org/wiki/Baker%E2%80%93Campbell%E2%80%93Hausdorff_formula)给出了这个运算的答案:
\[\ln \left( {\exp \left( A \right)\exp \left( B \right)} \right) = \sum\limits_{n = 1}^\infty {\frac{{{{\left( { - 1} \right)}^{n - 1}}}}{n}\sum\limits_{{r_i} + {s_i} > 0,i \in \left[ {1,n} \right]}^{} {\frac{{{{\left( {\sum\limits_{i = 1}^n {\left( {{r_i} + {s_i}} \right)} } \right)}^{ - 1}}}}{{\prod\limits_{i = 1}^n {{r_i}!{s_i}!} }}\left[ {{A^{{r_1}}}{B^{{s_1}}}{A^{{r_2}}}{B^{{s_2}}} \cdots {A^{{r_n}}}{B^{{s_n}}}} \right]} } \]
那么这式子在说什么鬼呢?
为了避免过于冗长的解释,我们就直接看它的近似式好了:
\[\ln \left( {\exp \left( A \right)\exp \left( B \right)} \right) = A + B + \frac{1}{2}\left[ {A,B} \right] + \frac{1}{{12}}\left[ {A,\left[ {A,B} \right]} \right] - \frac{1}{{12}}\left[ {B,\left[ {A,B} \right]} \right] + \cdots \]
这里的方括号指的是李括号,也就是:
\[\left[ {A,B} \right] = AB - BA\]
特别地,在$SO(3)$上,我们可以求它关于某一个变量的一阶近似:
\[ \begin{equation} \ln {\left( {{R_1}{R_2}} \right)^ \vee } \approx \left\{ \begin{array}{l}
{J_l}{\left( {{\phi _2}} \right)^{ - 1}}{\phi _1} + {\phi _2}\\
{J_r}{\left( {{\phi _1}} \right)^{ - 1}}{\phi _2} + {\phi _1}
\end{array} \right. \end{equation} \]
对我们用处最大的就是这个近似式。在 $\phi_1$ 较小时,使用第一个式;在在 $\phi_2$ 较小时,使用第二个式。这里的 $J_l$ 和 $J_r$ 也称为左/右雅可比——从而李代数就分成了左右两种模型(因此,李代数程序库会声明它使用的是左乘模型还是右乘模型)。
那么这俩雅可比是啥类?
事实上,前面已经提到过它了:
\[ \begin{equation} {J_l} = J = \sum\limits_{n = 0}^\infty {\frac{1}{{\left( {n + 1} \right)!}}{{\left( {{\phi ^ \wedge }} \right)}^n}} ,{J_r} = J\left( { - \phi } \right) \end{equation}\]
在这个近似下,我们只保留了和小量相关的一阶信息,而舍弃了它的高阶项。因此,可以把这个过程类比于保留泰勒展开的一阶项而舍弃高阶项的过程,其中泰勒展开类比于BCH公式。
BCH近似的直观意义
以左乘形式($\phi_1$较小)为例。我们给一个旋转矩阵 $\mathbf{R}$ 左乘一个微小扰动 $\Delta R = \exp \left( {\Delta {\phi ^ \wedge }} \right)$,得到了$\Delta R \cdot R$。那么,对应到李代数上的变化量为:
\[ \begin{equation} \ln {\left( {\Delta R \cdot R} \right)^ \vee } = \phi + J_l^{ - 1}\left( \phi \right)\Delta \phi \end{equation} \]
反过来说,如果对某个固定的李代数$\phi$增加一个小量$\delta \phi$,对应到李代数上,为:
\[ \begin{equation} \exp {\left( {\phi + \delta \phi } \right)^ \wedge } = \exp {\left( {{J_l}\delta \phi } \right)^ \wedge } \cdot \exp {\left( \phi \right)^ \wedge } \end{equation} \]
相当于左乘一个 $J_l \phi$ 对应的旋转阵。类似地,由于左右对称,有:
\[ \begin{equation} \exp {\left( {\phi + \delta \phi } \right)^ \wedge } = \exp {\left( {{J_l} \delta \phi } \right)^ \wedge } \cdot \exp {\left( \phi \right)^ \wedge } = \exp {\left( \phi \right)^ \wedge }\exp {\left( {{J_r}\delta \phi } \right)^ \wedge } \end{equation} \]
从这两个式子可以清楚地看到,BCH近似为我们指明了,李群与李代数微小量之间的关系——即,在BCH线性近似的意义下,它们只差一个雅可比矩阵。当区别左右乘时,这两个雅可比自变量差一个符号。
应用:微分模型和扰动模型
实际中,我们经常考虑这样一个问题(我们先讨论$SO(3)$上,再讨论$SE(3)$上):
设一个空间点$P=[x,y,z]$,它经过一次旋转,变成$RP$。问$RP$随着$R$是如何变化的?
由于$SO(3)$上面没有加法,我们无法使用传统导数的定义(因为 $R+\Delta R$ 不再是旋转矩阵):
\[\frac{{d\left( {RP} \right)}}{{dR}} = \mathop {\lim }\limits_{\Delta R \to 0} \frac{{\left( {R + \Delta R} \right)P - RP}}{{\Delta R}}\]
为了解决这个问题,有两种方式:一是把增量定义在李代数上,对应于微分模型;二是把增量直接乘在$R$上,对应于扰动模型。如果读者熟悉了前面的公式,那这件事情是很轻松的。
定义在李代数上的增量
在这个意义下,导数的含义为(最后一步跳过了若干过程,实际需要分开对各分量计算导数):
\[\begin{array}{lll}
\frac{{d\left( {RP} \right)}}{{d\phi }} &=& \mathop {\lim }\limits_{\delta \phi \to 0} \frac{{\exp {{\left( {\phi + \delta \phi } \right)}^ \wedge }P - \exp {{\left( \phi \right)}^ \wedge }P}}{{\delta \phi }}\\
&=& \mathop {\lim }\limits_{\Delta \phi \to 0} \frac{{(\exp {{\left( {{J_l}\delta \phi } \right)}^ \wedge } - 1)exp{{\left( \phi \right)}^ \wedge }P}}{{\delta \phi }}\\
&=& - {(RP)^ \wedge }{J_l}
\end{array}\]
2. 定义在李群上的乘增量
另一种方式是将小量乘在李群上,而非加在李代数上。这种方式定义的模型称为扰动模型。由于左右的差异,需要区别这个增量是左乘在旋转阵,还是右乘在旋转阵上的。如果使用左乘,那么导数的含义为:
\[\begin{equation} \begin{array}{l}
\frac{{d\left( {RP} \right)}}{{dR}} = \mathop {\lim }\limits_{\delta \phi \to 0} \frac{{\exp {{\left( {\delta \phi } \right)}^ \wedge } \cdot RP - RP}}{{\delta \phi }}\\
= \mathop {\lim }\limits_{\Delta \phi \to 0} \frac{{(\exp {{\left( {\delta \phi } \right)}^ \wedge } - 1)RP}}{{\delta \phi }}\\
= - {\left( {RP} \right)^ \wedge }
\end{array} \end{equation} \]
可见,由于我们把小量乘在李群上(而非加在李代数上),结果中的导数将少一个雅可比矩阵。因此,扰动模型计算更为简洁,在实际上更加常用。
$SE(3)$上扰动模型
$SE(3)$上扰动模型为:考虑一个空间点$P$(必须为齐次坐标,否则维数不对)受到刚体变换 $T$ ,得到 $TP$ 。求 $TP$ 是如何随 $T$ 变化的。
类似于$SO(3)$,我们给$T$左乘一个小量$\Delta T=exp(\delta \xi)^\wedge $,得到:
\[ \begin{equation}\begin{array}{l}
\frac{{d\left( {TP} \right)}}{{dT}} = \mathop {\lim }\limits_{\delta \xi \to 0} \frac{{\exp {{\left( {\delta \xi } \right)}^ \wedge }TP - TP}}{{\delta \xi }}\\
= {(TP)^ \odot }
\end{array}\end{equation} \]
其中$^ \odot$算符把一个4$\times$4的矩阵变换成一个4$\times$6的矩阵,计算方式如下:
\[ \begin{equation} p = \left[ \begin{array}{l}
{x_{3 \times 1}}\\
{w_{1 \times 1}}
\end{array} \right], \quad {p^ \odot } = \left[ {\begin{array}{*{20}{c}}
{w{I_{3 \times 3}}}&{ - {x^ \wedge }_{3 \times 3}}\\
{{0^T}_{3 \times 1}}&{{0^T}_{3 \times 1}}
\end{array}} \right] \end{equation} \]
至此,我们明确了一个被变换之后的点,是如何随变换矩阵而变化的。注意,我们省略了$SE(3)$上BCH近似雅可比的推导(比较复杂且扰动模型里没有该雅可比),如果读者感兴趣可参考[1]。
小萝卜:师兄,知识我倒是知道了,您能讲讲$^ \odot$怎么念吗?
师兄:诶?……你看它像一个石子掉进井里,就念"dong"吧。
小萝卜:所以$SE(3)$对李代数的扰动的导数就是那个点自己的“dong”喽?
师兄:你愿意怎么记就怎么记吧……我不管了。
小结
本节介绍了以下几个关于李群代数的知识:
1. $SE(3)$的结构,指数映射和对数映射;
2. BCH公式与近似公式;
3. 李代数上的微分运算。
其中,介绍微分是介绍李代数的主要目的所在。知道了如何对位姿求导,我们才能深入地讨论姿态估计,直接法VO等话题。下一讲我们将介绍direct VO和semi-direct VO的方法。
[1]. Barfoot, State Estimation for Robotics: A Matrix-Lie-Group Approach, 2016
视觉SLAM中的数学基础 第四篇 李群与李代数(2)的更多相关文章
- 视觉SLAM中的数学基础 第三篇 李群与李代数
视觉SLAM中的数学基础 第三篇 李群与李代数 前言 在SLAM中,除了表达3D旋转与位移之外,我们还要对它们进行估计,因为SLAM整个过程就是在不断地估计机器人的位姿与地图.为了做这件事,需要对变换 ...
- 视觉SLAM中的数学基础 第二篇 四元数
视觉SLAM中的数学基础 第二篇 四元数 什么是四元数 相比欧拉角,四元数(Quaternion)则是一种紧凑.易于迭代.又不会出现奇异值的表示方法.它在程序中广为使用,例如ROS和几个著名的SLAM ...
- 第六篇 视觉slam中的优化问题梳理及雅克比推导
优化问题定义以及求解 通用定义 解决问题的开始一定是定义清楚问题.这里引用g2o的定义. \[ \begin{aligned} \mathbf{F}(\mathbf{x})&=\sum_{k\ ...
- 视觉SLAM中相机详解
视觉SLAM中,通常是指使用相机来解决定位和建图问题. SLAM中使用的相机往往更加简单,不携带昂贵的镜头,以一定的速率拍摄周围的环境,形成一个连续的视频流. 相机分类: 单目相机:只是用一个摄像头进 ...
- 视觉SLAM中的深度估计问题
一.研究背景 视觉SLAM需要获取世界坐标系中点的深度. 世界坐标系到像素坐标系的转换为(深度即Z): 深度的获取一共分两种方式: a)主动式 RGB-D相机按照原理又分为结构光测距.ToF相机 To ...
- 视觉SLAM的数学基础 第一篇 3D空间的位置表示
视觉SLAM中的数学基础 第一篇 3D空间的位置表示 前言 转眼间一个学期又将过去,距离我上次写<一起做RGBD SLAM>已经半年之久.<一起做>系列反响很不错,主要由于它为 ...
- 《视觉SLAM十四讲》第2讲
目录 一 视觉SLAM中的传感器 二 经典视觉SLAM框架 三 SLAM问题的数学表述 注:原创不易,转载请务必注明原作者和出处,感谢支持! 本讲主要内容: (1) 视觉SLAM中的传感器 (2) 经 ...
- 《视觉SLAM十四讲》学习日志(二)——初识SLAM
小萝卜机器人的例子: 就像这种机器人,它的下面有一组轮子,脑袋上有相机(眼睛),为了让它能够探索一个房间,它需要知道: 1.我在哪——定位 2.周围环境怎么样——建图 定位和建图可以理解成感知的 &q ...
- 视觉SLAM之词袋(bag of words) 模型与K-means聚类算法浅析
原文地址:http://www.cnblogs.com/zjiaxing/p/5548265.html 在目前实际的视觉SLAM中,闭环检测多采用DBOW2模型https://github.com/d ...
随机推荐
- proj01总结:spring jdbc操作
commons-collections.jar: Apache Commons包中的一个,包含了一些Apache开发的集合类,功能比java.util.*强大.必须使用的jar包. commons-l ...
- Nodejs学习笔记(十四)— Mongoose介绍和入门
目录 简介 mongoose安装 连接字符串 Schema Model 常用数据库操作 插入 更新 删除 条件查询 数量查询 根据_id查询 模糊查询 分页查询 其它操作 写在之后... 简介 Mon ...
- Maven学习总结(二)——Maven项目构建过程练习_转载
上一篇只是简单介绍了一下maven入门的一些相关知识,这一篇主要是体验一下Maven高度自动化构建项目的过程 一.创建Maven项目 1.1.建立Hello项目 1.首先建立Hello项目,同时建立M ...
- es6学习笔记5--promise
所谓Promise,简单说就是一个容器,里面保存着某个未来才会结束的事件(通常是一个异步操作)的结果.从语法上说,Promise是一个对象,从它可以获取异步操作的消息.Promise提供统一的API, ...
- 使用vs自带的性能诊断工具
visual studio是个强大的集成开发环境,内置了程序性能诊断工具.下面通过两段代码进行介绍. static void Main( string[] args) { Test1(); Test2 ...
- JSP内置对象总结
前几天学习了javaee中的jsp(Java Server Pages),即java服务器页面,其实就是在html里面写java代码. 一.概述前言 在总结九大对象之前,有必要先搞清楚几个概念:请求, ...
- Activiti 流程实例、任务、执行对象及相关的表
一个流程中,流程实例只有一个,执行对象可以有多个(如果存在分支和聚合) SELECT * FROM activiti.act_ru_execution a; #正在执行的执行对象表 SELECT * ...
- 屏蔽iOS10模拟器海量的垃圾debug信息
屏蔽iOS10模拟器海量的垃圾debug信息 不屏蔽之前 进行如下设置 OS_ACTIVITY_MODE = disable 即可屏蔽垃圾信息
- 分布式Hadoop安装(一)
本文旨在介绍通过两台物理节点,实现完全分布式hadoop程序的部署 writen by Bob Pan@20140609 环境介绍: 主机名 机器IP 用途 描述 Hadoop0 192.168.80 ...
- c#复制包含子目录文件夹代码
c#没有复制目录的代码,需要通过递归实现复制目录: 需要引用System.IO命名空间,实现代码如下: private static bool CopyDirectory(string SourceP ...