众所周知,对一个$n$阶方阵求取特征值需要解一个一元$n$次方程,当$n$很大时,这是很难实现的。但是,在有些涉及矩阵的实际问题中,我们并不需要知道矩阵特征值的准确值而只需要知道其大概范围就行了,例如判定一个线性系统最终是否会趋于稳定时,只需要看其特征方程的所有特征根是否均有负实部,即所有的特征根是否均落在$x$轴负半轴上就行了;判定一个$n$阶方阵是否半正定,只需要考察其所有特征值是否均非负,类似的例子还有很多,就不一一赘述了。那么对于这类问题,我们迫切地需要这样一个工具,相比于解$n$次的特征方程,它可以很轻松地估计出特征值的大概范围,下面将要介绍的Gershgorin圆盘定理就是这样一个工具。

  该定理基于下面这样一段简单的推导:考虑$n$阶方阵$\boldsymbol{A}$的特征值$\lambda$及其对应的特征向量$\boldsymbol{x} = [x_1, \cdots, x_n]^\top \neq \boldsymbol{0} $,显然有$\boldsymbol{A} \boldsymbol{x} = \lambda \boldsymbol{x}$,设$|x_i| = \|\boldsymbol{x}\|_\infty$,于是\begin{align*} \lambda x_i = [\lambda \boldsymbol{x}]_i = [\boldsymbol{A} \boldsymbol{x}]_i = \sum_{j=1}^n a_{ij} x_j \Longrightarrow x_i (\lambda - a_{ii}) = \sum_{j=1, j \neq i}^n a_{ij} x_j \end{align*}两边同时取模,由三角不等式得\begin{align*} |x_i| |\lambda - a_{ii}| \leq \sum_{j=1, j \neq i}^n |a_{ij}| |x_j| \leq |x_i| \sum_{j=1, j \neq i}^n |a_{ij}| = |x_i| R_i \end{align*}其中$R_i = \sum_{j=1, j \neq i}^n |a_{ij}|$是$\boldsymbol{A}$的第$i$行除对角线元素外,剩余元素的模的和。由于$\boldsymbol{x}$是非零向量,必然有$|x_i| \neq 0$,所以\begin{align*} |\lambda - a_{ii}| \leq R_i \end{align*}这意味着$\lambda$包含在复平面上以$a_{ii}$为圆心、$R_i$为半径的圆盘中。于是由$\lambda$的任意性知,$\boldsymbol{A}$ 的所有特征值必然属于如下这$n$个圆盘的并集\begin{align*} G(\boldsymbol{A}) = \bigcup_{i=1}^n \left\{ z \in \mathbb{C} \ | \ |z - a_{ii}| \leq R_i(\boldsymbol{A}) = \sum_{j=1, j \neq i}^n |a_{ij}| \right\} \end{align*}这就是Gershgorin行圆盘定理。由于$\boldsymbol{A}^\top$和$\boldsymbol{A}$有相同的特征值,于是对$\boldsymbol{A}^\top$应用Gershgorin行圆盘定理,可以得到如下的Gershgorin列圆盘定理:$\boldsymbol{A}$的所有特征值必然属于如下这$n$个圆盘的并集\begin{align*} G(\boldsymbol{A}^\top) = \bigcup_{i=1}^n \left\{ z \in \mathbb{C} \ | \ |z - a_{jj}| \leq C_j(\boldsymbol{A}) = \sum_{i=1, i \neq j}^n |a_{ij}| \right\} \end{align*}对比一下可以发现,区别仅仅是每个圆盘的半径变了。

  根据圆盘定理,我们立马可以得到如下两个推论:

  • 由三角不等式可知,若特征值$\lambda_i$属于第$i$个圆盘,那么该特征值的模不超过$|a_{ii}| + R_i = \sum_{j=1}^n |a_{ij}|$,于是有\begin{align*} \rho(\boldsymbol{A}) = \max_i \lambda_i \leq \max_i \left\{ \sum_{j=1}^n |a_{ij}| \right\} = \|\boldsymbol{A}\|_\infty \end{align*}其中$\rho(\boldsymbol{A})$是$\boldsymbol{A}$的谱半径。同理有\begin{align*} \rho(\boldsymbol{A}) = \max_i \lambda_i \leq \max_i \left\{ \sum_{j=1}^n |a_{ji}| \right\} = \|\boldsymbol{A}\|_1 \end{align*}这两个不等式从几何的角度证明了谱半径小于等于矩阵的无穷范数和1范数
  • 若方阵$\boldsymbol{A}$满足对于任意$i$有$|a_{ii}| > \sum_{i=1, i \neq j}^n |a_{ij}|$,则称其为严格对角占优矩阵。显然对于任意严格对角占优矩阵,原点必然不属于它的任意圆盘,因此原点不是它的特征值,也即严格对角占优矩阵必然是可逆矩阵

  下面让我们回到开始的那个问题:特征值估计。显然,圆盘定理是可以给出特征值的估计范围的,就是那些圆盘嘛。那么如何判断估计地好不好呢?这当然取决于圆盘半径的大小,如果圆盘的半径普遍很小,则特征值都被限定在比较小的范围里了,极限情况圆盘半径都是零,那就相当于直接得到所有特征值了。下面介绍一个小技巧,可以改进圆盘的半径,它基于的是相似矩阵有相同特征值这一结论。注意$\boldsymbol{A}$的所有相似矩阵都可以写成$\boldsymbol{S}^{-1} \boldsymbol{A} \boldsymbol{S}$的形式,其中$\boldsymbol{S}$是某个可逆矩阵。那么考虑$\boldsymbol{S}$为对角阵这个最简单的情况,即$\boldsymbol{S} = \boldsymbol{D} = diag (p_1, p_2, \cdots , p_n)$,易知$\boldsymbol{D}^{-1}\boldsymbol{A}\boldsymbol{D}$的第$i$行第$j$列的元素为$p_j a_{ij} / p_i$,于是由圆盘定理可知$\boldsymbol{A}$的所有特征值属于如下这$n$个圆盘的并集\begin{align*} \bigcup_{i=1}^n \left\{ z \in \mathbb{C} \ | \ |z - a_{ii}| \leq \frac{1}{p_i} \sum_{j \neq i} p_j |a_{ij}| \right\} = G(\boldsymbol{D}^{-1} \boldsymbol{A} \boldsymbol{D}) \end{align*}通过优化$p_1, p_2, \cdots , p_n$的取值,我们可以得到更小的圆盘,从而估计地更好。


  最后再让我们看两个圆盘定理的扩展,其中第一个扩展基于以下的推导。回忆之前对于$n$阶方阵$\boldsymbol{A}$的特征值$\lambda$及其对应的特征向量$\boldsymbol{x} = [x_1, \cdots, x_n]^\top \neq \boldsymbol{0} $,我们有\begin{align*} |x_i| |\lambda - a_{ii}| \leq \sum_{j=1, j \neq i}^n |a_{ij}| |x_j| \end{align*}将$|a_{ij}| |x_j|$写作$|a_{ij}|^\alpha |a_{ij}|^{1-\alpha}|x_j|$,于是\begin{align*} |x_i| |\lambda - a_{ii}| \leq \sum_{j=1, j \neq i}^n \left(|a_{ij}|^\alpha\right) \left(|a_{ij}|^{1-\alpha}|x_j|\right) \leq \left[\sum_{j=1, j \neq i}^n \left(|a_{ij}|^\alpha\right)^{1/\alpha} \right]^\alpha \left[\sum_{j=1, j \neq i}^n \left(|a_{ij}|^{1-\alpha}|x_j|\right)^{1/(1-\alpha)} \right]^{1-\alpha} = R_i^\alpha \left[\sum_{j=1, j \neq i}^n \left(|a_{ij}|^{1-\alpha}|x_j|\right)^{1/(1-\alpha)} \right]^{1-\alpha} \end{align*}其中第二个不等号是基于Hoder不等式。移项整理有\begin{align*} \left(\frac{|\lambda - a_{ii}|}{R_i^\alpha}\right)^{1/(1-\alpha)} |x_i|^{1/(1-\alpha)} \leq \sum_{j=1, j \neq i}^n |a_{ij}| |x_j|^{1/(1-\alpha)} \end{align*}两边对$i$求和有\begin{align*} \sum_{i=1}^n \left(\frac{|\lambda - a_{ii}|}{R_i^\alpha}\right)^{1/(1-\alpha)} |x_i|^{1/(1-\alpha)} \leq \sum_{i=1}^n \sum_{j=1, j \neq i}^n |a_{ij}| |x_j|^{1/(1-\alpha)} = \sum_{j=1}^n \sum_{i=1, j \neq i}^n |a_{ij}| |x_j|^{1/(1-\alpha)} = \sum_{j=1}^n C_j |x_j|^{1/(1-\alpha)} \end{align*}也即\begin{align} \label{equ1} \sum_{i=1}^n \left( \left(\frac{|\lambda - a_{ii}|}{R_i^\alpha}\right)^{1/(1-\alpha)} - C_i \right) |x_i|^{1/(1-\alpha)} \leq 0 \end{align}注意对于任意非零的$x_i$有$|x_i|^{1/(1-\alpha)} > 0$,若对于所有的这些$i$有\begin{align*} \left(\frac{|\lambda - a_{ii}|}{R_i^\alpha}\right)^{1/(1-\alpha)} - C_i > 0 \end{align*}则式(\ref{equ1})不可能成立,所以必然存在某个$k$,满足$|x_k|^{1/(1-\alpha)} > 0$且\begin{align*} \left(\frac{|\lambda - a_{kk}|}{R_k^\alpha}\right)^{1/(1-\alpha)} - C_k \leq 0 \end{align*}于是有\begin{align*} |\lambda - a_{kk}| \leq R_k^\alpha C_k^{1-\alpha} \end{align*}由$\lambda$的任意性知,$\boldsymbol{A}$的所有特征值必然属于如下这$n$个圆盘的并集\begin{align*} \bigcup_{i=1}^n \left\{ z \in \mathbb{C} \ | \ |z - a_{ii}| \leq R_i^\alpha C_i^{1-\alpha} \right\} \end{align*}这就是Ostrowski定理,可以看出当$\alpha=1$时,就是Gershgorin行圆盘定理,当$\alpha=0$时,就是Gershgorin列圆盘定理,因此它是比圆盘定理更强的一个结论。

  第二个扩展考虑$\boldsymbol{x}$的模最大的两个元素的下标,不妨设分别为$p$和$q$,也即$\min \{|x_p|,|x_q|\} \geq |x_i|, i \neq \{p,q\}$,于是有\begin{align*} |x_p| |\lambda - a_{pp}| & \leq \sum_{j=1, j \neq p}^n |a_{pj}| |x_j| \leq \sum_{j=1, j \neq p}^n |a_{pj}| |x_q| = |x_q| \sum_{j=1, j \neq p}^n |a_{pj}| = |x_q| R_p \\ |x_q| |\lambda - a_{qq}| & \leq \sum_{j=1, j \neq q}^n |a_{qj}| |x_j| \leq \sum_{j=1, j \neq q}^n |a_{qj}| |x_p| = |x_p| \sum_{j=1, j \neq q}^n |a_{qj}| = |x_p| R_q \end{align*}将上面两式相乘可得\begin{align*} |\lambda - a_{pp}| |\lambda - a_{qq}| \leq R_p R_q \end{align*}由$\lambda$的任意性知,$\boldsymbol{A}$的所有特征值必然属于如下这$n(n-1)/2$个Cassini椭圆形的并集\begin{align*} \bigcup_{i \neq j}^n C_{ij} = \bigcup_{i \neq j}^n \left\{ z \in \mathbb{C} \ | \ |z - a_{ii}| |z - a_{jj}| \leq R_i R_j \right\} \end{align*}这就是Brauer定理。不难看出有$C_{ij} \subseteq G_i \cup G_j$,其中$G_i$和$G_j$分别是第$i$个和第$j$个Gershgorin圆盘,否则若对于任意$z \in C_{ij}$有$z \not \in G_i$且$z \not \in G_j$,则必然有$|z - a_{ii}| |z - a_{jj}| > R_i R_j$,这与$C_{ij}$的定义矛盾。由此可知,$n(n-1)/2$个Cassini椭圆形的并集是$n$个Gershgorin圆盘的并集的子集,因此Brauer定理也是比圆盘定理更强的一个结论。

Gershgorin圆盘定理的更多相关文章

  1. Gersgorin 圆盘

    将学习到什么 好多.   Gersgorin 圆盘定理   对任何 \(A \in M_n\),我们总可以记 \(A=D+B\),其中 \(D=\mathrm{diag}(a_{11},\cdots, ...

  2. 随机矩阵(stochastic matrix)

          最近一个月来一直在看Google排序的核心算法---PageRank排序算法[1][2],在多篇论文中涉及到图论.马尔可夫链的相关性质说明与应用[3][4][5],而最为关键,一直让我迷惑 ...

  3. 压缩感知——SP(subspace pursuit)重构算法前言翻译

    压缩感知是一种採样方法,它和变换编码类似,后者被广泛用于涉及到大规模数据採样的现代通信系统中.变换编码将高维空间中的输入信号.转换成很低的低维空间中的信号.变换编码器的样例有著名的小波变换和普遍存在的 ...

  4. [组合数学] 圆排列和欧拉函数为啥有关系:都是polya定理的锅

    本文是一个笨比学习组合数学的学习笔记,因为是笨比,所以写的应该算是很通俗易懂了. 首先,我们考虑这么一个问题:你有无穷多的\(p\)种颜色的珠子,现在你想要的把他们中的\(n\)个以圆形的形状等间距的 ...

  5. 【HDU 3037】Saving Beans Lucas定理模板

    http://acm.hdu.edu.cn/showproblem.php?pid=3037 Lucas定理模板. 现在才写,noip滚粗前兆QAQ #include<cstdio> #i ...

  6. Mittag-Leffler定理,Weierstrass因子分解定理和插值定理

    Mittag-Leffler定理    设$D\subset\mathbb C$为区域,而$\{a_{n}\}$为$D$中互不相同且无极限点的点列,那么对于任意给定的一列自然数$\{k_{n}\}$, ...

  7. 【转】Polya定理

    转自:http://endlesscount.blog.163.com/blog/static/82119787201221324524202/ Polya定理 首先记Sn为有前n个正整数组成的集合, ...

  8. hdu 4704 Sum (整数和分解+快速幂+费马小定理降幂)

    题意: 给n(1<n<),求(s1+s2+s3+...+sn)mod(1e9+7).其中si表示n由i个数相加而成的种数,如n=4,则s1=1,s2=3.                  ...

  9. poj1006Biorhythms(同余定理)

    转自:http://blog.csdn.net/dongfengkuayue/article/details/6461298 本文转自head for better博客,版权归其所有,代码系本人自己编 ...

随机推荐

  1. Swift3.0基础语法学习<三>

    枚举和结构体: // // ViewController3.swift // SwiftBasicDemo // // Created by 思 彭 on 16/11/16. // Copyright ...

  2. HDOJ 1512 几乎模板的左偏树

    题目大意:有n个猴子.每个猴子有一个力量值,力量值越大表示这个猴子打架越厉害.如果2个猴子不认识,他们就会找他们认识的猴子中力量最大的出来单挑,单挑不论输赢,单挑的2个猴子力量值减半,这2拨猴子就都认 ...

  3. Andorid开发学习---ubuntu 12.04下搭建超好用的安卓模拟器genymotion 安装卸载virtualbox 4.3

    什么是Genymotion? Genymotion是一套完整的工具,它提供了Android虚拟环境.它简直就是开发者.测试人员.推销者甚至是游戏玩家的福音. Genymotion支持Windows.L ...

  4. RTX2010服务器端的主要通信端口有哪些?

    RTX服务端程序在安装之后,如果安装服务端电脑的操作系统有防火墙(如Windows XP.Windows2003等)或者安装了防火墙(如瑞星.Norton等),那么需要在防火墙上打开RTX所需要使用的 ...

  5. 問題排查:.NETSystem.Runtime.Remoting.RemotingException: TCP 信道协议冲突: 应为报头。

    這個錯誤訊息是在一個 Web Serveice 的偵錯階段發生的 目前還未找到原因,環境如下: 作業系統:Windows 10 x64 企業版 (簡中) 開發工具:Visual Studio 2013 ...

  6. 统计学习方法笔记 Logistic regression

    logistic distribution 设X是连续随机变量,X服从逻辑斯谛分布是指X具有下列分布函数和密度函数: 式中,μ为位置参数,γ>0为形状参数. 密度函数是脉冲函数 分布函数是一条S ...

  7. 团队作业week2

    软件分析和用户需求调查 (2013) 具体内容参看邹欣老师的博客:http://www.cnblogs.com/xinz/p/3308608.html. 作业提交期限:2013年9月25日上课前.

  8. Action类为何要继承ActionSupport

    Action类为何要继承ActionSupport   理论上Struts 2.0的Action无须实现任何接口或继承任何类型,但是,我们为了方便实现Action,大多数情况下都会继承com.open ...

  9. 【JSP】自定义标签开发入门

    JSP 自定义标签 自定义标签是用户定义的JSP语言元素.当JSP页面包含一个自定义标签时将被转化为servlet,标签转化为对被 称为tag handler的对象的操作,即当servlet执行时We ...

  10. MS SQL还原备份数据出错

    MS SQL还原 XXXX.bak文件时候,数据库中出现如下的错误. 错误提示: 还原 对于 服务器“SAM-PC\SQLEXPRESS”失败.  (Microsoft.SqlServer.SmoEx ...