想要从二维图像中获取到场景的三维信息,相机的内参数是必须的,在SLAM中,相机通常是提前标定好的。张正友于1998年在论文:"A Flexible New Technique fro Camera Calibration"提出了基于单平面棋盘格的相机标定方法。该方法介于传统的标定方法和自标定方法之间,使用简单实用性强,有以下优点:

  • 不需要额外的器材,一张打印的棋盘格即可。
  • 标定简单,相机和标定板可以任意放置。
  • 标定的精度高。

相机的内参数

设\(P=(X,Y,Z)\)为场景中的一点,在针孔相机模型中,其要经过以下几个变换,最终变为二维图像上的像点\(p=(\mu,\nu)\):

  1. 将\(P\)从世界坐标系通过刚体变换(旋转和平移)变换到相机坐标系,这个变换过程使用的是相机间的相对位姿,也就是相机的外参数
  2. 从相机坐标系,通过透视投影变换到相机的成像平面上的像点\(p=(x,y)\)。
  3. 将像点\(p\)从成像坐标系,通过缩放和平移变换到像素坐标系上点\(p=(\mu,\nu)\)。

相机将场景中的三维点变换为图像中的二维点,也就是各个坐标系变换的组合,可将上面的变换过程整理为矩阵相乘的形式:

\[s\left(\begin{array}{c}\mu\\ \nu \\ 1\end{array}\right) = \left[\begin{array}{ccc}\alpha & 0 &c_x \\ 0 & \beta & c_y \\ 0 & 0 & 1\end{array}\right] \left[\begin{array}{cccc}f&0&0&0\\0&f&0&0\\0&0&1&0\end{array}\right] \left[\begin{array}{cc}R&t\\0^T&1\end{array}\right] \left(\begin{array}{c}X\\Y\\Z\\1\end{array}\right) \\
= \left[\begin{array}{cccC}f_x&0&c_x&0\\0&f_y&c_y&0\\0&0&1&0\end{array}\right]\left[\begin{array}{cc}R&t\\0^T&1\end{array}\right] \left(\begin{array}{c}X\\Y\\Z\\1\end{array}\right)
\]

将矩阵\(K\)称为相机的内参数,

\[K = \left[\begin{array}{ccc}f_x&0&c_x\\0&f_y&c_y\\0&0&1\end{array}\right]
\]

其中,\(\alpha,\beta\)表示图像上单位距离上像素的个数,则\(f_x = \alpha f,f_y = \beta f\)将相机的焦距\(f\)变换为在x,y方向上像素度量表示。

另外,为了不失一般性,可以在相机的内参矩阵上添加一个扭曲参数\(\gamma\),该参数用来表示像素坐标系两个坐标轴的扭曲。则内参数\(K\)变为

\[K = \left[\begin{array}{ccc}f_x&\gamma&c_x\\0&f_y&c_y\\0&0&1\end{array}\right]
\]

对于大多数标准相机来说,可将扭曲参数\(\gamma\)设为0. Multiple View Geometry in Computer Vision

张氏标定法

在上一篇博文单应矩阵,介绍的单应矩阵表示两个平面间的映射。在张氏标定法中,用于标定的棋盘格是三维场景中的一个平面\(\Pi\),其在成像平面的像是另一个平面\(\pi\),知道了两个平面的对应点的坐标,就可以求解得到两个平面的单应矩阵\(H\)。其中,标定的棋盘格是特制的,其角点的坐标是已知的;图像中的角点,可以通过角点提取算法得到,这样就可以得到棋盘平面\(\Pi\)和图像平面\(\pi\)的单应矩阵\(H\)。

通过上面的相机模型有:$$p = K[R|t]P$$

其中\(p\)是像点坐标,\(P\)是标定的棋盘坐标。 这样就可以得到下面的等式:

\[H = K[R|t]
\]

\(H\)表示的是成像平面和标定棋盘平面之间的单应矩阵。通过对应的点对解得\(H\)后,则可以通过上面的等式得到相机的内参数\(K\),以及外参旋转矩阵\(R\)和平移向量\(t\)。

棋盘平面和成像平面间的单应

将一个平面映射到另一个平面,将棋盘格所在的平面映射到相机的成像平面,则有

\[p = HP
\]

\(p\)为棋盘格所成像的像点坐标,\(P\)棋盘格角点在世界坐标系的坐标。

设棋盘格所在的平面为世界坐标系中\(Z = 0\)的平面,这样棋盘格的任一角点\(P\)的世界坐标为\((X,Y,0)\),根据小孔相机模型:

\[s\left(
\begin{array}{c} u \\ v \\1 \end{array} \right) = K\left[\begin{array}{c}R&t\end{array}\right]\left(
\begin{array}{c} X \\ Y \\ 0 \\ 1 \end{array} \right) = K[\begin{array}{c}r_1&r_2&r_3&t\end{array}]\left(\begin{array}{c} X \\ Y \\ 0 \\ 1 \end{array} \right)
= K[\begin{array}{c}r_1&r_2&t\end{array}]\left(\begin{array}{c} X \\ Y \\ 1 \end{array} \right)
\]

根据平面间的单应性,有

\[s\left(
\begin{array}{c} u \\ v \\1 \end{array} \right) = H \left(\begin{array}{c} X \\ Y \\ 1 \end{array} \right)
\]

将上面两个等式进行整合,则可以得到单应矩阵\(H\)和相机矩阵(包含内参和外参)的相等,如下:

\[H = \lambda K[\begin{array}{c}r_1&r_2&t\end{array}]
\]

这样就可以使用棋盘平面和成像平面间的单应矩阵来约束相机的内参和外参。单应矩阵\(H\)可以通过棋盘平和成像平面上对应的点计算出来。

内参的约束条件

通过平面间的单应,可以得到如下的等式

\[H =\left[\begin{array}{c}h_1&h_2&h_3\end{array}\right]= \lambda K[\begin{array}{c}r_1&r_2&t\end{array}]
\]

将旋转矩阵\(R\)的各个列向量和平移向量\(t\)使用\(H\)的列向量表示,

\[\begin{array}{l}
r_1 = \lambda K^{-1}h_1 \\
r_2 = \lambda K^{-1}h_2 \\
t = \lambda K^{-1}h_3
\end{array}
\]

又由于,\(R\)是旋转矩阵,则其是正交矩阵,也就是其任意两个列向量的内积为0,列向量的模为1。故有:

\[\begin{array}{l}
r_1^Tr_2 = 0 \\
\Arrowvert r_1 \Arrowvert = \Arrowvert r_2 \Arrowvert = 1 \\
\end{array}
\]

则对于一幅棋盘标定版的图像(一个单应矩阵)可以获得两个对内参数的约束等式:

\[\left\{
\begin{array}{l}h_1^TK^{-T}K^{-1}h_2 = 0 \\ h_1^TK^{-T}K^{-1}h_1 = h_2^TK^{-T}K^{-1}h_2 = 1\end{array}
\right.
\]

求解内参数

通过一幅标定板的图像可以的得到关于内参数的两个等式,令

\[B=K^{-T}K^{-1}=
\left[
\begin{array}{ccc}
B_{11} & B_{12} & B_{13} \\
B_{21} & B_{22} & B_{23} \\
B_{31} & B_{32} & B_{33}
\end{array}
\right]=
\left[
\begin{array}{ccc}
\frac{1}{\alpha^2} & -\frac{\gamma}{\alpha^2\beta} & \frac{v_0\gamma-u_0\beta}{\alpha^2\beta} \\
-\frac{\gamma}{\alpha^2\beta} & \frac{\gamma^2}{\alpha^2\beta^2}+\frac{1}{\beta^2} & -\frac{\gamma(v_0\gamma-u_0\beta)}{\alpha^2\beta^2}-\frac{v_0}{\beta^2} \\
\frac{v_0\gamma-u_0\beta}{\alpha^2\beta} & -\frac{\gamma(v_0\gamma-u_0\beta)}{\alpha^2\beta^2}-\frac{v_0}{\beta^2} & \frac{(v_0\gamma-u_0\beta)^2}{\alpha^2\beta^2}+\frac{v_0}{\beta^2}+1
\end{array}
\right]\]

注意,矩阵\(B\)是一个对称矩阵,其未知量只有6个,将6个未知量写为向量的形式

\[b =\left[\begin{array}{ccc}B_{11} ,B_{12} , B_{22},B_{13},B_{23},B_{33}\end{array}\right]
\]

令\(h_i\)为单应矩阵\(H\)的第\(i\)个行向量,则有

\[h_i = [h_{i1},h_{i2},h_{i3}]^T
\]

故:

\[h_iK^{-T}K^{-1}h_j = h_iBh_j = v_{ij}^Tb\\其中,v_{ij}=\left[ \begin{array}{cccccc} h_{i1}h_{j1} & h_{i1}h_{j2}+h_{i2}h_{j1} & h_{i2}h_{j2} & h_{i3}h_{j1}+h_{i1}h_{j3} & h_{i3}h_{j2}+h_{i2}h_{j3} & h_{i3}h_{j3} \end{array} \right]^T
\]

有了上边的等式,再来看从一幅标定板图像得到的等式

\[\left\{
\begin{array}{l}h_1^TK^{-T}K^{-1}h_2 = 0 \\ h_1^TK^{-T}K^{-1}h_1 = h_2^TK^{-T}K^{-1}h_2 = 1\end{array}
\right. \Rightarrow \left\{ \begin{array}{l}v_{22}^Tb = 0 \\ v_{11}b = v_{12}b \end{array}\right.
\]

写成矩阵的形式有:

\[\left[ \begin{array}{c} v_{12}^T \\ v_{11}-v_{22} \end{array}\right] b = 0
\]

上面的一幅标定板图像取得的约束等式,假如有\(n\)幅图像,则

\[Vb = 0
\]

其中,\(V\)是一个\(2n\times 6\)的矩阵,\(b\)是一个6维向量,所以

  • 当\(n \ge 3\),可以得到\(b\)的唯一解;
  • 当\(n = 2\),则可以假设扭曲参数\(\gamma=0\)作为额外的约束条件
  • 当\(n = 1\),则值能计算两个相机的内参数

对于方程\(Vb = 0\)可以使用SVD求得其最小二乘解。对\(V^TV\)进行SVD分解,其最小特征值对应的特征向量就是\(Vb = 0\)的最小二乘解,从而求得矩阵\(B\)。由于这里得到的\(B\)的估计值是在相差一个常量因子下得到的,所以有:

\[B = \lambda A^{-T}A
\]

从而可以得到相机的各个内参数:

\[\left\{
\begin{array}{l}
c_x = \gamma c_y /\beta - B_{13}\alpha^2 / \lambda \\
c_y = (B_{12}B_{13}-B_{11}B_{23})/(B_{11}B_{22}-B_{12}^2) \\
\alpha = \sqrt{\lambda /B_{11}} \\
\beta = \sqrt{\lambda B_{11}/(B_{11}B_{22}-B_{12}^2)} \\
\gamma = -B_{12}\alpha^2\beta / \lambda \\
\lambda = B_{33}-[B_{13}^2 + c_y(B_{12}B_{13}-B_{11}B_{23})]/B_{11}
\end{array}
\right.
\]

最大似然估计

上面使用最小二乘法得到估计得到的解,并没有物理上的实际意义,。为了进一步增加标定结果的可靠性,可以使用最大似然估计(Maximum likelihood estimation)来优化上面估计得到的结果。

假设同一相机从\(n\)个不同的角度的得到了\(n\)幅标定板的图像,每幅图像上有\(m\)个像点。\(M_{ij}\)表示第\(i\)幅图像上第\(j\)个像点对应的标定板上的三维点,则

\[\hat{m}(K,R_i,t_i,M_{ij}) = K[\begin{array}{c}R&t\end{array}]M_{ij}
\]

\(\hat{m}(K,R_i,t_i,M_{ij})\)表示\(M_{ij}\)的像点。其中,\(R_i,t_i\)表示第\(i\)幅图像对应相机的旋转矩阵和平移向量,\(K\)是相机的内参数。则像点\(m_{ij}\)的概率密度函数是

\[f(m_{ij})=\frac{1}{\sqrt{2\pi}}e^{\frac{-(\hat{m}(K,R_i,t_i,M_{ij})-m_{ij})^2}{\sigma^2}}
\]

构造似然函数

\[L(A,R_i,t_i,M_{ij}) = \prod^{n,m}_{i=1,j=1}f(m_{ij})=\frac{1}{\sqrt{2\pi}}e^{\frac{-\sum^n_{i=1}\sum^m_{j=1}(\hat{m}(K,R_i,t_i,M_{ij})-m_{ij})^2}{\sigma^2}}
\]

为了能够让\(L\)取得最大值,需要最小化下面的值

\[\sum^n_{i=1}\sum^m_{j=1} \| \hat{m}(K,R_i,t_i,M_{ij})-m_{ij} \|^2
\]

这是一个非线性优化问题,可以使用Levenberg-Marquardt的方法,利用上面得到的解作为初始值,迭代得到最优解。

消除径向畸变

为了取得好的成像效果,通常要在相机的镜头前添加透镜。在相机成像的过程中,透镜会对光线的传播产生影响,从而影响相机的成像效果,产生畸变:

  • 透镜自身的形状对才光线的传播产生影响,形成的畸变称为径向畸变。在小孔模型中,一条指向在成像平面上的像仍然是直线。但是在实际拍摄的过程中,由于透镜的存在,往往将一条直线投影成了曲线,越靠近图像的边缘,这种现象越明显。透镜往往是中心对称的,使得这种不规则的畸变通常是径向对称的。主要有两大类:桶形畸变和枕形畸变。如下图

  • 由于在相机组装的过程中,透镜不能和成像平面严格平行,会引入切向畸变

张氏标定法中只关注了影响较大的径向畸变。

设,\((\mu,\nu)\)是理想的无畸变的像素坐标;\((\hat{\mu},\hat{\nu})\)是畸变后的像素坐标;\((\mu_0,\nu_0)\)是相机的主点;\((x,y)\)和\((\hat{x},\hat{y})\)理想的无畸变的归一化的图像坐标和畸变后的归一化图像坐标,使用下面的式子表示径向畸变:

\[\hat{x} = x + x[k_1(x^2 + y^2) + k_2(x^2 + y^2)^2] \\
\hat{y} = y + y[k_1(x^2 + y^2) + k_2(x^2 + y^2)^2]
\]

\(k_1,k_2\)表示径向畸变的系数。径向畸变的中心和相机的主心是在相同的位置,

\[\begin{array}{l}
\hat{\mu} = \mu_0 + \alpha \hat{x} + \gamma \hat{y} \\
\hat{\nu} = \nu_0 + \beta \hat{y} \\
\end{array}
\]

假设\(\gamma = 0\),则有:

\[\hat \mu = \mu + (\mu-\mu_0)[k_1(x^2+y^2)+k_2(x^2+y^2)^2] \\
\hat \nu = \nu + (\nu-\nu_0)[k_1(x^2+y^2)+k_2(x^2+y^2)^2]
\]

将上面的式子改写为矩阵的形式

\[\left[
\begin{array}{cc}
(\mu-\mu_0)(x^2+y^2) & (\mu-\mu_0)(x^2+y^2)^2 \\
(\nu-\nu_0)(x^2+y^2) & (\nu-\nu_0)(x^2+y^2)^2
\end{array}
\right]
\left[
\begin{array}{c}
k_1 \\ k_2
\end{array}
\right]=
\left[
\begin{array}{c}
\hat \mu -\mu \\ \hat \nu -\nu
\end{array}
\right]
\]

上面的等式是从一幅图像上的一个点取得,设有\(n\)幅图像,每幅图像上有\(m\)个点,则将得到的所有等式组合起来,可以得到\(2mn\)个等式,将其记着矩阵形式

\[Dk = d
\]

则可得

\[k=[k_1\ k_2]^T = (D^TD)^{-1}D^Td \]

和上面类似利用最大似然估计取得最优解,使用LM的方法估计使得下面式子是最小值的参数值

\[\sum^n_{i=1}\sum^m_{j=1} \| \hat{m}(K,k_1,k_2,R_i,t_i,M_{ij})-m_{ij} \|^2
\]

得到畸变参数\(k_1,k_2\)后,可以先将图像进行去畸变处理,然后用去畸变后的图像坐标估计相机的内参数。

OpenCV中的张正友相机标定

OpenCV中提供了对张正友标定算法的实现,其使用步骤如下:

  • 制作标定使用标定板。 标定板很简单,如下图:

可以将其打印下来固定到一张平板上就是标定使用的标定板。 使用同一相机从不同的位置,不同的角度,不同的姿态,拍摄标定板的多张照片(一般不少于3张,以10-20张为宜)。

  • 提取标定板的内角点的世界坐标,这里需要注意标定板的大小是标定板在水平和竖直方向上内焦点的个数。内焦点指的是,标定板上不挨着表姐的角点。比如上图制作的标定板的大小是\((4,6)\),其在水平方向有4个内焦点;竖直方向有6个内焦点。标定板所在的世界坐标系为\(Z=0\),则其角点的世界坐标系如下:
        // 3D场景中的点,在棋盘坐标系中初始化棋盘角点,这些角点的坐标为(x,y,z) = (i,j,0)
// 棋盘所在的世界坐标系,X轴竖直向下,Y轴水平向右,Z = 0
for (int i = 0; i < boardSize.height; i++)
for (int j = 0; j < boardSize.width; j++)
objectCorner.push_back(Point3f(i, j, 0.0f));
  • 提取标定板的角点的图像坐标,标定板角点的提取可以调用函数findChessboardCorners(image, boardSize, imageCorner);,为了得到更高的精度,可以将提取到的像素坐标精确到亚像素。提取角点图像坐标的代码如下:
        // 2D 图像的像素坐标
Mat image; // 保存标定板的图像
int viewPointCount = 0;
// 从各个视角
for (int i = 0; i < filelist.size(); i++)
{
image = imread(filelist[i], 0);
// 取得图像的角点
bool found = findChessboardCorners(image, boardSize, imageCorner); // 获取亚像素精度
cornerSubPix(image, imageCorner, Size(5, 5), Size(-1, -1),
TermCriteria(TermCriteria::MAX_ITER + TermCriteria::EPS, 30, 0.1)); // 取得的角点数目满足要求,则将它加入数据中
if (imageCorner.size() == boardSize.area())
{
// 将3D场景点及其对应像的像点加入
addPoints(imageCorner, objectCorner);
viewPointCount++;
}
}
  • 已经取得了角点的世界坐标以及对应的像素坐标,就可以进行标定了,调用calibrateCamera(objectPoints, imagePoints, imageSize, camteraMatrix, distCoeffs, rvecs, tvecs, flag); 这里的cameraMatrix就是要求的相机的内参数矩阵。

上面只是简单的介绍下OpenCV相机标定的使用方法,具体的可以参考官方文档。

SLAM入门之视觉里程计(6):相机标定 张正友经典标定法详解的更多相关文章

  1. SLAM入门之视觉里程计(5):单应矩阵

    在之前的博文OpenCV,计算两幅图像的单应矩阵,介绍调用OpenCV中的函数,通过4对对应的点的坐标计算两个图像之间单应矩阵\(H\),然后调用射影变换函数,将一幅图像变换到另一幅图像的视角中.当时 ...

  2. SLAM入门之视觉里程计(2):相机模型(内参数,外参数)

    相机成像的过程实际是将真实的三维空间中的三维点映射到成像平面(二维空间)过程,可以简单的使用小孔成像模型来描述该过程,以了解成像过程中三维空间到二位图像空间的变换过程. 本文包含两部分内容,首先介绍小 ...

  3. SLAM入门之视觉里程计(1):特征点的匹配

    SLAM 主要分为两个部分:前端和后端,前端也就是视觉里程计(VO),它根据相邻图像的信息粗略的估计出相机的运动,给后端提供较好的初始值.VO的实现方法可以根据是否需要提取特征分为两类:基于特征点的方 ...

  4. SLAM入门之视觉里程计(2):两视图对极约束 基础矩阵

    在上篇相机模型中介绍了图像的成像过程,场景中的三维点通过"小孔"映射到二维的图像平面,可以使用下面公式描述: \[ x = MX \]其中,\(c\)是图像中的像点,\(M\)是一 ...

  5. SLAM入门之视觉里程计(3):两视图对极约束 基础矩阵

    在上篇相机模型中介绍了图像的成像过程,场景中的三维点通过"小孔"映射到二维的图像平面,可以使用下面公式描述: \[ x = MX \]其中,\(c\)是图像中的像点,\(M\)是一 ...

  6. SLAM入门之视觉里程计(4):基础矩阵的估计

    在上篇文章中,介绍了三位场景中的同一个三维点在不同视角下的像点存在着一种约束关系:对极约束,基础矩阵是这种约束关系的代数表示,并且这种约束关系独立与场景的结构,只依赖与相机的内参和外参(相对位姿).这 ...

  7. SLAM——视觉里程计(一)feature

    从现在开始下面两篇文章来介绍SLAM中的视觉里程计(Visual Odometry).这个是我们正式进入SLAM工程的第一步,而之前介绍的更多的是一些基础理论.视觉里程计完成的事情是视觉里程计VO的目 ...

  8. 视觉slam十四讲个人理解(ch7视觉里程计1)

    参考博文::https://blog.csdn.net/david_han008/article/details/53560736 https://blog.csdn.net/n66040927/ar ...

  9. 第三篇 视觉里程计(VO)的初始化过程以及openvslam中的相关实现详解

    视觉里程计(Visual Odometry, VO),通过使用相机提供的连续帧图像信息(以及局部地图,先不考虑)来估计相邻帧的相机运动,将这些相对运行转换为以第一帧为参考的位姿信息,就得到了相机载体( ...

随机推荐

  1. ES6中Promise对象个人理解

    Promise是ES6原生提供的一个用来传递异步消息的对象.它减少了传统ajax金字塔回调,可以将异步操作以同步操作的流程表达出来使得代码维护和可读性方面好很多. Promise的状态: 既然是用来传 ...

  2. QT中定时器的使用方法

    前言:因为QT中用死循环会开销很多内存容易崩溃,这时候使用定时器可以很好解决这个问题. 使用定时器需要用到头文件:include<QTimer> (1)定义定时器 QTimer *upda ...

  3. webpack配置报错:invalid configuration object.webpack has been initialisted using a configuration objcet that does not match thie API schema

    最近接收了别人的项目,webpack配置总是报错如下:最后找到了解决办法,在此分享一下: 错误情况: 解决办法: 将package.json里面的colors删除掉即可

  4. xampp的安装和配置

    这几天一直在做一个网站,客户要求要用PHP修改WordPress的themes,目的是交付完成后,客户自己管理方便. 以前从没有涉及过PHP,用的是jsp,但是,既然已经选择接受,就只能让自己去适应客 ...

  5. python中星号的意义(**字典,*列表或元组)

    传递实参和定义形参(所谓实参就是调用函数时传入的参数,形参则是定义函数是定义的参数)的时候,你还可以使用两个特殊的语法:*.** . 调用函数时使用* ,** test(*args)中 * 的作用:其 ...

  6. shell的含义

    shell:壳,是操作linux最直接的方式,通过shell中输入命令和linux系统进行交互. shell是一个小盒子,每一个有独立的命名空间,登录后的操作就是一个shell(有可能是bash,zs ...

  7. Python学习_06_文件、IO

    文件对象 python中的文件操作和c语言比较类似,包括一些缓冲.偏移量的方式. 文件对象可以通过open().file()两个内建方法创建,两个方法并没有什么不同,使用方法和c语言中的fopen() ...

  8. 15个超强悍的CSS3圆盘时钟动画赏析

    在网页上,特别是个人博客中经常会用到时钟插件,一款个性化的时钟插件不仅可以让页面显得美观,而且可以让访客看到当前的日期和时间.今天我们给大家收集了15个超强悍的圆盘时钟动画,很多都是基于CSS3,也有 ...

  9. Qt创建停靠悬浮窗口

    1.Qt实现窗口停靠和悬浮使用类QDockWidget,它有两个重要方法用来设置停靠特性以及停靠区域, dw1->setFeatures(QDockWidget::DockWidgetMovab ...

  10. MapReduce Tutorial(划重点)

    Mapper Mapper的maps阶段将输入键值对经过计算得到中间结果键值对,框架会将中间结果按照key进行分组,然后传递给reducer以决定最终的输出.用户可以通过Job.setGrouping ...