将学习到什么

从 Schur 的酉三角化定理可以收获一批结果,在这一部分介绍重要的几个.

 


迹与行列式

相似矩阵具有相同的特征多项式, 从特征多项式一节中, 我们又知道,相似矩阵的迹以及行列式都是相同的,且分别用所有特征值的和与积表示,所以对于矩阵 \(A\in M_n\), \(\mathrm{tr}\,A\) 和 \(\mathrm{det}\,A\) 都可以用任何与 \(A\) 相似矩阵来计算,酉三角化中的上三角矩阵 \(T\) 的主对角线元素就是矩阵 \(A\) 的特征值,所以计算非常方便。

 

\(A\) 的多项式的特征值

假设 \(A\in M_n\) 有特征值 \(\lambda_1,\cdots\,\lambda_n\), 并设 \(p(t)\) 是一个给定的多项式,从特征值的特征向量的定理 1.1 知:对每一个 \(i=1,\cdots,n\), \(p(\lambda_i)\) 都是 \(p(A)\) 的特征值,又如果 \(\mu\) 是 \(p(A)\) 的特征值,那么就存在某个 \(i\in \{1,\cdots,n\}\), 使得 \(\mu=p(\lambda_i)\). 这些结论给出了 \(p(A)\) 的特征值,但没有给出它们的重数,Schur 定理揭示出它们的重数.

设 \(A=UTU^*\), 其中 \(U\) 是酉矩阵,而 \(T=[t_{ij}]\) 是上三角矩阵,其主对角元素是 \(t_{11}=\lambda_1,t_{22}=\lambda_2,\cdots,t_{nn}=\lambda_n\). 这样就有 \(p(A)=p(UTU^*)=Up(T)U^*\), \(p(T)\) 的主对角元素是 \(p(\lambda_1),p(\lambda_2),\cdots,p(\lambda_n)\), 故而由矩阵 \(T\) 的对角元素算出 \(p(T)\) 的特征值重数. 特别地,对每个 \(k=1,\cdots\), 矩阵 \(A^k\) 的特征值是 \(\lambda_1^k,\cdots,\lambda_n^k\), 且
\begin{align}
\mathrm{tr}\, A^k=\lambda_1^k+\cdots+\lambda_n^k
\end{align}
假设 \(A\in M_n\), 如果对某个正整数 \(k\) 有 \(A^k=0\), 那么 \(\sigma(A)=\{0\}\), 所以 \(A\) 的特征多项式是 \(p_A(t)=t^n\), 其逆命题也成立,即如果 \(\sigma(A)=\{0\}\), 那么存在一个酉矩阵 \(U\) 以及一个严格上三角矩阵 \(T\), 使得 \(A=UTU^*\), 于是如下结论等价:\(A\) 是幂零的\(\Leftrightarrow A^n=0 \Leftrightarrow \sigma(A)=\{0\}\).

 

Cayley-Hamilton 定理

这个定理是说:设 \(p_A(t)\) 是 \(A\) 的特征多项式,那么 \(p_A(A)=0\).
通过多项式分解和酉相似,利用归纳法可以证明. 这个定理常常被解释成每个方阵都满足它自己的特征方程,不过这需要仔细加以理解:纯量多项式 \(p_A(t)\) 首先是作为 \(p_A(t)=\mathrm{det}\, (tI-A)\) 计算的,然后才是通过代换 \(t \rightarrow A\) 来计算矩阵 \(p_A(A)\).
Cayley-Hamilton 定理的一项重要用途是将 \(A\in M_n\) 的幂 \(A^k\) (对 \(k \geqslant n\))写成 \(I,A,A^2,\cdots,A^{n-1}\) 的线性组合. 比如 \(A=\begin{bmatrix} 3 & 1 \\ -2 & 0 \end{bmatrix}\). 那么 \(p_A(t)=t^2-3t+2\), 所以 \(A^2-3A+2I=0\), 从而 \(A^2=3A-2I\),\(A^3=(3A-2I)A=3A^2-2A=3(3A-2I)-2A=7A-6I\), 类似可计算 \(A^4,A^5,\cdots\) 等等. 还可以将非奇异矩阵 \(A\) 的负次数幂表示成 \(A\) 与 \(I\) 的线性组合,将 \(A^2-3A+2I=0\) 写成 \(I=A\Big[ \dfrac 12 (-A+3I) \Big]\), 从而 \(A^{-1}=-\dfrac 12 A+\dfrac 32 I\),同样可写出 \(A^{-2},A^{-3}\) 等等.

 

关于线性矩阵方程的 Sylvester 定理

与交换性有关的方程 \(AX-XA=0\) 是线性矩阵方程 \(AX-XB=C\) 的一个特例,通常称为Sylvester 方程.

这个定理不证明了,要了解定理中的那个充分必要条件.

 

Schur 三角化定理中的唯一性

对给定和 \(A \in M_n\),酉三角化 中定理 1.1 描述的那种可以通过酉相似得到的上三角型 \(T\) 不一定是唯一的. 也就是说,有相同主对角线的不同的上三角矩阵可能是酉相似的.
如果 \(T,T' \in M_n\) 是上三角的,且有相同的主对角线,主对角线上相同的元素归并在一起,关于使得 \(T'=WTW^*\) (也就是 \(WT=T'W\))成立的酉矩阵 \(W \in M_n\), 有什么特点?下面的定理说的是:\(W\) 必定是分块对角的,而且在关于 \(T\) 的超对角元素的某种假设之下,\(W\) 必定是对角矩阵,甚至是一个纯量矩阵,在后一种情形有 \(T=T'\).

 

每一个方阵都可以分块对角化


  证明: 将 \(T\) 分划成
\begin{align}
T=\begin{bmatrix} T_{11} & Y \\ 0 & S_2 \end{bmatrix} \notag
\end{align}
其中 \(S_2=[T_{ij}]_{i,j=2}^d\). 注意 \(T_{11}\) 的仅有的特征值是 \(\lambda_1\), 而 \(S_2\) 的特征值是 \(\lambda_2,\cdots,\lambda_n\). Sylvester 定理保证了方程 \(T_{11}X-XS=-Y\) 有一个解 \(X\),用它来构造
\begin{align}
M=\begin{bmatrix} I_{n_1} & X \\ 0 & I \end{bmatrix} \qquad \text{以及其逆} \qquad M^{-1}=\begin{bmatrix} I_{n_1} & -X \\ 0 & I \end{bmatrix}\notag
\end{align}
那么
\begin{align}
M^{-1}TM=\begin{bmatrix} I_{n_1} & -X \\ 0 & I \end{bmatrix} \begin{bmatrix} T_{11} & Y \\ 0 & S_2 \end{bmatrix} \begin{bmatrix} I_{n_1} & X \\ 0 & I \end{bmatrix}=\begin{bmatrix} T_{11} & T_{11}X-XS_2+Y \\ 0 & S_2 \end{bmatrix} = \begin{bmatrix} T_{11} & 0 \\ 0 & S_2 \end{bmatrix} \notag
\end{align}
如果 \(d=2\), 这就是所要的分块对角化. 如果 \(d>2\), 重复这一化简过程来证明 \(S_2\) 与 \(T_{22}\oplus S_3\) 相似,其中 \(S_3=[T_{ij}]_{i,j=3}^d\). 经过 \(d-1\) 次化简,我们就得知 \(T\) 相似于 \(T_{11}\oplus \cdots\oplus T_{dd}\).
如果 \(A\) 是实的且有实特征值,那么它与一个刚刚考虑过的实的分块上三角矩阵实正交相似,每一步的化简都可以用实相似来实现.

 

秩 1 摄动的特征值


  证明: 设 \(\xi = x/ \lVert x \rVert _2\), 并令 \(U=[\xi \quad u_2 \quad \cdots \quad u_n]\) 是酉矩阵. 那么由 Schur 定理知
\begin{align}
U^*AU=\begin{bmatrix} \lambda & \bigstar \\ 0 & A_1 \end{bmatrix} \notag
\end{align}
其中 \(A_1 \in M_{n-1}\) 有特征值 \(\lambda_2,\cdots,\lambda_n\). 又有
\begin{align}
U^*xv^*U=\begin{bmatrix} \xi^*x \\ u_2^*x \\ \vdots \\ u_n^*x \end{bmatrix} v^* U = \begin{bmatrix} \lVert x \rVert _2 \\0 \\ \vdots \\ 0 \end{bmatrix} \begin{bmatrix}v^*\xi & v^*u_2 & \cdots & v^*u_n \end{bmatrix}=\begin{bmatrix} \lVert x \rVert _2 v^*\xi & \bigstar \\ 0 & 0 \end{bmatrix} = \begin{bmatrix} v^*x & \bigstar \\ 0 & 0 \end{bmatrix} \notag
\end{align}
这样一来,
\begin{align}
U^*(A+xv^*)U= \begin{bmatrix}\lambda+ v^*x & \bigstar \\ 0 & A_1 \end{bmatrix} \notag
\end{align}
就有特征值 \(\lambda+v^*x,\lambda_2,\cdots,\lambda_n\).

 


应该知道什么

  • 酉三角化对于求矩阵的迹与行列式是方便的
  • \(A\) 的多项式的特征值可以通过酉相似容易辨别出来
  • 每个方阵都满足它自己的特征方程
  • 每一个方阵都可以分块对角化
  • 秩 1 摄动的特征值

Schur 三角化定理的推论的更多相关文章

  1. 用canvas 实现个图片三角化(LOW POLY)效果

    之前无意中看到Ovilia 用threejs做了个LOW POLY,也就是图片平面三角化的效果,觉得很惊艳,然后就自己花了点时间尝试了一下. 我是没怎么用过threejs,所以就直接用canvas的2 ...

  2. [CGAL]带岛多边形三角化

    CGAL带岛多边形三角化,并输出(*.ply)格式的模型 模型输出的关键是节点和索引 #include <CGAL/Triangulation_vertex_base_with_id_2.h&g ...

  3. 三角化---深度滤波器---单目稠密重建(高翔slam---十三讲)

    一.三角化 [1]三角化得到空间点的三维信息(深度值) (1)三角化的提出 三角化最早由高斯提出,并应用于测量学中.简单来讲就是:在不同的位置观测同一个三维点P(x, y, z),已知在不同位置处观察 ...

  4. 多视几何——三角化求解3D空间点坐标

    VINS-Mono / VINS-Fusion中triangulatePoint()函数通过三角化求解空间点坐标,代码所体现的数学描述不是很直观,查找资料,发现参考文献[1]对这个问题进行详细解释,记 ...

  5. PCL贪婪投影三角化算法

    贪婪投影三角化算法是一种对原始点云进行快速三角化的算法,该算法假设曲面光滑,点云密度变化均匀,不能在三角化的同时对曲面进行平滑和孔洞修复. 方法: (1)将三维点通过法线投影到某一平面 (2)对投影得 ...

  6. Delaunay三角化算法

    参考:<平面域中的Delaunay三角算法>

  7. Jordan 标准型定理

    将学习到什么 就算两个矩阵有相同的特征多项式,它们也有可能不相似,那么如何判断两个矩阵是相似的?答案是它们有一样的 Jordan 标准型.   Jordan 标准型定理 这节目的:证明每个复矩阵都与一 ...

  8. How Many Sets I(容斥定理)

    题目链接:http://acm.zju.edu.cn/onlinejudge/showProblem.do?problemCode=3556 How Many Sets I Time Limit: 2 ...

  9. 【bzoj2219-数论之神】求解x^a==b(%n)-crt推论-原根-指标-BSGS

    http://www.lydsy.com/JudgeOnline/problem.php?id=2219 弄了一个晚上加一个午休再加下午一个钟..终于ac..TAT 数论渣渣求轻虐!! 题意:求解 x ...

随机推荐

  1. C#基础:使用Thread创建线程

    Thread类可以创建和控制线程,Thread类的构造函数重载为接受ThreadStart和ParameterizedThreadStart类型的委托参数.下面我们用一个例子来解释怎样用Thread类 ...

  2. 如何成为一个优秀的高级C++程序员

    C++这门语言从诞生到今天已经经历了将近 30 个年头.不可否认,它的学习难度都比其它语言较高.而它的学习难度,主要来自于它的复杂性.现在 C++ 的使用范围比以前已经少了很多,java.C#.pyt ...

  3. bzoj 3876: [Ahoi2014&Jsoi2014]支线剧情【有上下界有源汇最小费用最大流】

    每条边流量有下界有费用,很显然是有上下界有源汇最小费用最大流 连边(s,1,(0,inf),0),(i,t,(0,inf),0),表示从1出发inf次从每个点结束inf次 连边(i,j,(1,inf) ...

  4. PJzhang:百度网盘是如何泄露公司机密的?

    猫宁!!! 参考链接:https://mp.weixin.qq.com/s/PLELMu8cVleOLlwRAAYPVg 百度网盘在中国一家独大,百度超级会员具有很多特权,尤其是在下载速度上,是普通会 ...

  5. 初入Three.js 第一章

    一.什么是WebGL? 1.WebGL是在浏览器中实现三维效果的一套规范. 二.什么是threejs? 1.你将它理解成three + js就可以了.three表示3D的意思,js表示javascri ...

  6. Markdown - 如何使用上标、下标

    解决方法 Markdown可以和HTML的语法兼容,可以通过HTML的上标和下标标签来实现效果: 标签 写法 效果 上标 2<sup>10</sup> 210 下标 H< ...

  7. MarkdownPad - win10环境下无法渲染HTML问题

    问题 在win10平台安装了MarkdownPad 2之后,发现在渲染md文件时报错,在预览页面无法正常渲染HTML: 安装报错提示前往官网,可以看到如下的解决方法: LivePreview is n ...

  8. centos 7 安装node.js

    Node.js v10.x安装命令 curl --silent --location https://rpm.nodesource.com/setup_10.x | bash - Node.js v5 ...

  9. IP服务-4-HSRP,VRRP和GLBP

    HSRP(热备份路由器协议).VRRP(虚拟路由器冗余协议)和GLBP(网关负载均衡协议) 当主机只知道一个IP地址能够用来访问子网外部时,可能会出现一些问题,这些协议正好解决了这一隐患. HSRP允 ...

  10. traceback异常打印

    traceback模块 traceback模块被用来跟踪异常返回信息. 如下例所示: import traceback try: raise SyntaxError, "traceback ...