众所周知,对一个$n$阶方阵求取特征值需要解一个一元$n$次方程,当$n$很大时,这是很难实现的。但是,在有些涉及矩阵的实际问题中,我们并不需要知道矩阵特征值的准确值而只需要知道其大概范围就行了,例如判定一个线性系统最终是否会趋于稳定时,只需要看其特征方程的所有特征根是否均有负实部,即所有的特征根是否均落在$x$轴负半轴上就行了;判定一个$n$阶方阵是否半正定,只需要考察其所有特征值是否均非负,类似的例子还有很多,就不一一赘述了。那么对于这类问题,我们迫切地需要这样一个工具,相比于解$n$次的特征方程,它可以很轻松地估计出特征值的大概范围,下面将要介绍的Gershgorin圆盘定理就是这样一个工具。

  该定理基于下面这样一段简单的推导:考虑$n$阶方阵$\boldsymbol{A}$的特征值$\lambda$及其对应的特征向量$\boldsymbol{x} = [x_1, \cdots, x_n]^\top \neq \boldsymbol{0} $,显然有$\boldsymbol{A} \boldsymbol{x} = \lambda \boldsymbol{x}$,设$|x_i| = \|\boldsymbol{x}\|_\infty$,于是\begin{align*} \lambda x_i = [\lambda \boldsymbol{x}]_i = [\boldsymbol{A} \boldsymbol{x}]_i = \sum_{j=1}^n a_{ij} x_j \Longrightarrow x_i (\lambda - a_{ii}) = \sum_{j=1, j \neq i}^n a_{ij} x_j \end{align*}两边同时取模,由三角不等式得\begin{align*} |x_i| |\lambda - a_{ii}| \leq \sum_{j=1, j \neq i}^n |a_{ij}| |x_j| \leq |x_i| \sum_{j=1, j \neq i}^n |a_{ij}| = |x_i| R_i \end{align*}其中$R_i = \sum_{j=1, j \neq i}^n |a_{ij}|$是$\boldsymbol{A}$的第$i$行除对角线元素外,剩余元素的模的和。由于$\boldsymbol{x}$是非零向量,必然有$|x_i| \neq 0$,所以\begin{align*} |\lambda - a_{ii}| \leq R_i \end{align*}这意味着$\lambda$包含在复平面上以$a_{ii}$为圆心、$R_i$为半径的圆盘中。于是由$\lambda$的任意性知,$\boldsymbol{A}$ 的所有特征值必然属于如下这$n$个圆盘的并集\begin{align*} G(\boldsymbol{A}) = \bigcup_{i=1}^n \left\{ z \in \mathbb{C} \ | \ |z - a_{ii}| \leq R_i(\boldsymbol{A}) = \sum_{j=1, j \neq i}^n |a_{ij}| \right\} \end{align*}这就是Gershgorin行圆盘定理。由于$\boldsymbol{A}^\top$和$\boldsymbol{A}$有相同的特征值,于是对$\boldsymbol{A}^\top$应用Gershgorin行圆盘定理,可以得到如下的Gershgorin列圆盘定理:$\boldsymbol{A}$的所有特征值必然属于如下这$n$个圆盘的并集\begin{align*} G(\boldsymbol{A}^\top) = \bigcup_{i=1}^n \left\{ z \in \mathbb{C} \ | \ |z - a_{jj}| \leq C_j(\boldsymbol{A}) = \sum_{i=1, i \neq j}^n |a_{ij}| \right\} \end{align*}对比一下可以发现,区别仅仅是每个圆盘的半径变了。

  根据圆盘定理,我们立马可以得到如下两个推论:

  • 由三角不等式可知,若特征值$\lambda_i$属于第$i$个圆盘,那么该特征值的模不超过$|a_{ii}| + R_i = \sum_{j=1}^n |a_{ij}|$,于是有\begin{align*} \rho(\boldsymbol{A}) = \max_i \lambda_i \leq \max_i \left\{ \sum_{j=1}^n |a_{ij}| \right\} = \|\boldsymbol{A}\|_\infty \end{align*}其中$\rho(\boldsymbol{A})$是$\boldsymbol{A}$的谱半径。同理有\begin{align*} \rho(\boldsymbol{A}) = \max_i \lambda_i \leq \max_i \left\{ \sum_{j=1}^n |a_{ji}| \right\} = \|\boldsymbol{A}\|_1 \end{align*}这两个不等式从几何的角度证明了谱半径小于等于矩阵的无穷范数和1范数
  • 若方阵$\boldsymbol{A}$满足对于任意$i$有$|a_{ii}| > \sum_{i=1, i \neq j}^n |a_{ij}|$,则称其为严格对角占优矩阵。显然对于任意严格对角占优矩阵,原点必然不属于它的任意圆盘,因此原点不是它的特征值,也即严格对角占优矩阵必然是可逆矩阵

  下面让我们回到开始的那个问题:特征值估计。显然,圆盘定理是可以给出特征值的估计范围的,就是那些圆盘嘛。那么如何判断估计地好不好呢?这当然取决于圆盘半径的大小,如果圆盘的半径普遍很小,则特征值都被限定在比较小的范围里了,极限情况圆盘半径都是零,那就相当于直接得到所有特征值了。下面介绍一个小技巧,可以改进圆盘的半径,它基于的是相似矩阵有相同特征值这一结论。注意$\boldsymbol{A}$的所有相似矩阵都可以写成$\boldsymbol{S}^{-1} \boldsymbol{A} \boldsymbol{S}$的形式,其中$\boldsymbol{S}$是某个可逆矩阵。那么考虑$\boldsymbol{S}$为对角阵这个最简单的情况,即$\boldsymbol{S} = \boldsymbol{D} = diag (p_1, p_2, \cdots , p_n)$,易知$\boldsymbol{D}^{-1}\boldsymbol{A}\boldsymbol{D}$的第$i$行第$j$列的元素为$p_j a_{ij} / p_i$,于是由圆盘定理可知$\boldsymbol{A}$的所有特征值属于如下这$n$个圆盘的并集\begin{align*} \bigcup_{i=1}^n \left\{ z \in \mathbb{C} \ | \ |z - a_{ii}| \leq \frac{1}{p_i} \sum_{j \neq i} p_j |a_{ij}| \right\} = G(\boldsymbol{D}^{-1} \boldsymbol{A} \boldsymbol{D}) \end{align*}通过优化$p_1, p_2, \cdots , p_n$的取值,我们可以得到更小的圆盘,从而估计地更好。


  最后再让我们看两个圆盘定理的扩展,其中第一个扩展基于以下的推导。回忆之前对于$n$阶方阵$\boldsymbol{A}$的特征值$\lambda$及其对应的特征向量$\boldsymbol{x} = [x_1, \cdots, x_n]^\top \neq \boldsymbol{0} $,我们有\begin{align*} |x_i| |\lambda - a_{ii}| \leq \sum_{j=1, j \neq i}^n |a_{ij}| |x_j| \end{align*}将$|a_{ij}| |x_j|$写作$|a_{ij}|^\alpha |a_{ij}|^{1-\alpha}|x_j|$,于是\begin{align*} |x_i| |\lambda - a_{ii}| \leq \sum_{j=1, j \neq i}^n \left(|a_{ij}|^\alpha\right) \left(|a_{ij}|^{1-\alpha}|x_j|\right) \leq \left[\sum_{j=1, j \neq i}^n \left(|a_{ij}|^\alpha\right)^{1/\alpha} \right]^\alpha \left[\sum_{j=1, j \neq i}^n \left(|a_{ij}|^{1-\alpha}|x_j|\right)^{1/(1-\alpha)} \right]^{1-\alpha} = R_i^\alpha \left[\sum_{j=1, j \neq i}^n \left(|a_{ij}|^{1-\alpha}|x_j|\right)^{1/(1-\alpha)} \right]^{1-\alpha} \end{align*}其中第二个不等号是基于Hoder不等式。移项整理有\begin{align*} \left(\frac{|\lambda - a_{ii}|}{R_i^\alpha}\right)^{1/(1-\alpha)} |x_i|^{1/(1-\alpha)} \leq \sum_{j=1, j \neq i}^n |a_{ij}| |x_j|^{1/(1-\alpha)} \end{align*}两边对$i$求和有\begin{align*} \sum_{i=1}^n \left(\frac{|\lambda - a_{ii}|}{R_i^\alpha}\right)^{1/(1-\alpha)} |x_i|^{1/(1-\alpha)} \leq \sum_{i=1}^n \sum_{j=1, j \neq i}^n |a_{ij}| |x_j|^{1/(1-\alpha)} = \sum_{j=1}^n \sum_{i=1, j \neq i}^n |a_{ij}| |x_j|^{1/(1-\alpha)} = \sum_{j=1}^n C_j |x_j|^{1/(1-\alpha)} \end{align*}也即\begin{align} \label{equ1} \sum_{i=1}^n \left( \left(\frac{|\lambda - a_{ii}|}{R_i^\alpha}\right)^{1/(1-\alpha)} - C_i \right) |x_i|^{1/(1-\alpha)} \leq 0 \end{align}注意对于任意非零的$x_i$有$|x_i|^{1/(1-\alpha)} > 0$,若对于所有的这些$i$有\begin{align*} \left(\frac{|\lambda - a_{ii}|}{R_i^\alpha}\right)^{1/(1-\alpha)} - C_i > 0 \end{align*}则式(\ref{equ1})不可能成立,所以必然存在某个$k$,满足$|x_k|^{1/(1-\alpha)} > 0$且\begin{align*} \left(\frac{|\lambda - a_{kk}|}{R_k^\alpha}\right)^{1/(1-\alpha)} - C_k \leq 0 \end{align*}于是有\begin{align*} |\lambda - a_{kk}| \leq R_k^\alpha C_k^{1-\alpha} \end{align*}由$\lambda$的任意性知,$\boldsymbol{A}$的所有特征值必然属于如下这$n$个圆盘的并集\begin{align*} \bigcup_{i=1}^n \left\{ z \in \mathbb{C} \ | \ |z - a_{ii}| \leq R_i^\alpha C_i^{1-\alpha} \right\} \end{align*}这就是Ostrowski定理,可以看出当$\alpha=1$时,就是Gershgorin行圆盘定理,当$\alpha=0$时,就是Gershgorin列圆盘定理,因此它是比圆盘定理更强的一个结论。

  第二个扩展考虑$\boldsymbol{x}$的模最大的两个元素的下标,不妨设分别为$p$和$q$,也即$\min \{|x_p|,|x_q|\} \geq |x_i|, i \neq \{p,q\}$,于是有\begin{align*} |x_p| |\lambda - a_{pp}| & \leq \sum_{j=1, j \neq p}^n |a_{pj}| |x_j| \leq \sum_{j=1, j \neq p}^n |a_{pj}| |x_q| = |x_q| \sum_{j=1, j \neq p}^n |a_{pj}| = |x_q| R_p \\ |x_q| |\lambda - a_{qq}| & \leq \sum_{j=1, j \neq q}^n |a_{qj}| |x_j| \leq \sum_{j=1, j \neq q}^n |a_{qj}| |x_p| = |x_p| \sum_{j=1, j \neq q}^n |a_{qj}| = |x_p| R_q \end{align*}将上面两式相乘可得\begin{align*} |\lambda - a_{pp}| |\lambda - a_{qq}| \leq R_p R_q \end{align*}由$\lambda$的任意性知,$\boldsymbol{A}$的所有特征值必然属于如下这$n(n-1)/2$个Cassini椭圆形的并集\begin{align*} \bigcup_{i \neq j}^n C_{ij} = \bigcup_{i \neq j}^n \left\{ z \in \mathbb{C} \ | \ |z - a_{ii}| |z - a_{jj}| \leq R_i R_j \right\} \end{align*}这就是Brauer定理。不难看出有$C_{ij} \subseteq G_i \cup G_j$,其中$G_i$和$G_j$分别是第$i$个和第$j$个Gershgorin圆盘,否则若对于任意$z \in C_{ij}$有$z \not \in G_i$且$z \not \in G_j$,则必然有$|z - a_{ii}| |z - a_{jj}| > R_i R_j$,这与$C_{ij}$的定义矛盾。由此可知,$n(n-1)/2$个Cassini椭圆形的并集是$n$个Gershgorin圆盘的并集的子集,因此Brauer定理也是比圆盘定理更强的一个结论。

Gershgorin圆盘定理的更多相关文章

  1. Gersgorin 圆盘

    将学习到什么 好多.   Gersgorin 圆盘定理   对任何 \(A \in M_n\),我们总可以记 \(A=D+B\),其中 \(D=\mathrm{diag}(a_{11},\cdots, ...

  2. 随机矩阵(stochastic matrix)

          最近一个月来一直在看Google排序的核心算法---PageRank排序算法[1][2],在多篇论文中涉及到图论.马尔可夫链的相关性质说明与应用[3][4][5],而最为关键,一直让我迷惑 ...

  3. 压缩感知——SP(subspace pursuit)重构算法前言翻译

    压缩感知是一种採样方法,它和变换编码类似,后者被广泛用于涉及到大规模数据採样的现代通信系统中.变换编码将高维空间中的输入信号.转换成很低的低维空间中的信号.变换编码器的样例有著名的小波变换和普遍存在的 ...

  4. [组合数学] 圆排列和欧拉函数为啥有关系:都是polya定理的锅

    本文是一个笨比学习组合数学的学习笔记,因为是笨比,所以写的应该算是很通俗易懂了. 首先,我们考虑这么一个问题:你有无穷多的\(p\)种颜色的珠子,现在你想要的把他们中的\(n\)个以圆形的形状等间距的 ...

  5. 【HDU 3037】Saving Beans Lucas定理模板

    http://acm.hdu.edu.cn/showproblem.php?pid=3037 Lucas定理模板. 现在才写,noip滚粗前兆QAQ #include<cstdio> #i ...

  6. Mittag-Leffler定理,Weierstrass因子分解定理和插值定理

    Mittag-Leffler定理    设$D\subset\mathbb C$为区域,而$\{a_{n}\}$为$D$中互不相同且无极限点的点列,那么对于任意给定的一列自然数$\{k_{n}\}$, ...

  7. 【转】Polya定理

    转自:http://endlesscount.blog.163.com/blog/static/82119787201221324524202/ Polya定理 首先记Sn为有前n个正整数组成的集合, ...

  8. hdu 4704 Sum (整数和分解+快速幂+费马小定理降幂)

    题意: 给n(1<n<),求(s1+s2+s3+...+sn)mod(1e9+7).其中si表示n由i个数相加而成的种数,如n=4,则s1=1,s2=3.                  ...

  9. poj1006Biorhythms(同余定理)

    转自:http://blog.csdn.net/dongfengkuayue/article/details/6461298 本文转自head for better博客,版权归其所有,代码系本人自己编 ...

随机推荐

  1. SQLNestedException: Cannot create JDBC driver of class '' for connect URL 'null' 解决办法

    当跑jndi项目时抛出:org.apache.tomcat.dbcp.dbcp.SQLNestedException: Cannot create JDBC driver of class '' fo ...

  2. Java 在某一个时间点定时执行任务(转载)

    java定时任务,每天定时执行任务.以下是这个例子的全部代码. public class TimerManager { //时间间隔 private static final long PERIOD_ ...

  3. [转载] 2. JebAPI 之 jeb.api.dex

    本文转载自: https://www.zybuluo.com/oro-oro/note/142842 1. jeb.api.dex.Dex 这个类代表正在被JEB处理的DEX文件. 要想更好的了解这个 ...

  4. Python-实现对表插入百万条数据

    新手小白写的,我自己都不知道对不对,先写下来记着,以后掌握更多Python知识后,再来看下写的对不对. 题目:造一百万条大学生的基本信息(学校.专业.姓名.学号) 分析思路:利用Python的MySQ ...

  5. H5-表格、表单

    一.表格 1.表格标签 a.table 表格 b.thead 表格头 c.tbody 表格主体 d.tr 表格行 e.th 元素定义表头 f.td 元素定义表格单元 2.表格样式重置 a.table{ ...

  6. 一个使用高并发高线程数 Server 使用异步数据库客户端造成的超时问题

    现象 今天在做一个项目时, 将 tomcat 的 maxThreads 加大, 加到了 1024, tomcat 提供的服务主要是做一些运算, 然后插入 redis, 查询 redis, 最后将任务返 ...

  7. jquery实现标签上移、下移、置顶

    eg:如在后台的标签列表中,实现上移.下移.置顶功能 思路: 1.先用到的克隆方法.clone(true): 即把当前要移动的项先保存好,备于后用. 2.找到当前标签所对应的相关元素及其相关方法: 如 ...

  8. Git克隆

    用法1:Git clone <repository> <directory> 将<repository>指向的版本库创建一个克隆到<directory> ...

  9. $watch监听数据变化和run方法

    angular中$watch方法可以监听数据的变化. $scope.$watch('phone',function(){ $scope.phone.fre = $scope.phone.num> ...

  10. 【转载】PHP.INI配置:Session配置详细说明教程

    网上有很多PHP.INI文件配置的中文说明,但是对于PHP初学者来说在进行PHP运行环境搭建配置时还是容易一头雾水,今天换一种角度来分享如何进行php.ini配置,以求达到解决实际问题的效果,开篇以P ...