主要内容

  • 矩阵
  • 特征值和特征向量
  • 矩阵求导

矩阵

SVD的提法

  • 奇异值分解(Singular Value Decomposition)是一种重要的矩阵分解方法,可以看做对称方阵在任意矩阵上的推广。

  • 假设A是一个\(m\times n\)阶实矩阵,则存在一个分解使得:

    • 通常将奇异值从大到小排列,这样\(\sum\)就能由A唯一确定了。
  • 与特征值、特征向量的概念相对应

    • \(\sum\)在对角线上的元素称为矩阵A的奇异值;
    • U的第i列称为A的关于的左奇异向量;
    • V的第i列称为A的关于的右奇异向量。

例子:


线性代数

方阵的行列式

  • 一阶方阵的行列式为该元素本身

  • n阶方阵的行列式等于它的任意行(或列)的各元素与其对应的代数余子式乘积之和

  • \(2\times 2\)的方阵

代数余子式

在n阶行列式D中划去任意选定的k行、k列后,余下的元素按原来顺序组成的n-k阶行列式M,称为行列式D的k阶子式A的余子式。如果k阶子式A在行列式D中的行和列的标号分别为i1,i2,…,ik和j1,j2,…,jk。则在A的余子式M前面添加符号:

后,所得到的n-k阶行列式,称为行列式D的k阶子式A的代数余子式。

伴随矩阵

对于\(n\times n\)方阵的任意元素\(a_{ij}\)都有各自的代数余子式\(A_{ij}=(-1)^{i+j}M_{ij}\),构造\(n \times n\)的方阵\(A^*\);

\(A^*\)是A的伴随矩阵。

方阵的逆

范德蒙行列式Vandermonde

范德蒙行列式:

第n行是\(x_1,x_2,...,x_n\)的n-1次幂。

如果我们能使得\(x_1,x_2,...,x_n\)互不相等,那么矩阵\(D\)不为0,则存在\(D^{-1}\)

矩阵的乘法

A为\(m \times s\)阶矩阵,B为\(s\times n\)阶的矩阵,那么,\(C=A \times B\)是\(m\times n\)阶的矩阵,其中:

矩阵模型

考虑随机过程\(\pi\),它的状态有n个,用1~n表示。记在当前时刻t时刻时位于i状态,它在t+1时刻处于j状态的概率为P(i,j)=P(j|i)。

即状态转移的概率只依赖于前一个状态

(思考马尔可夫过程?)

举例:

假定按照经济状况将人群分为上中下三个阶层,用123表示。假定当前处于某阶层只和上一代有关,即,考察父代为第i阶层,则子代为第j阶层的概率。假定为如下转移概率矩阵:

图解为:

概率转移矩阵

第n+1代处于第j个阶层的概率为:

矩阵P即为(条件)概率转移矩阵。

第i行元素表示,在上一状态为i时的分布概率,每一行元素的和为1.

那么思考:初始概率分布对最终分布的影响?

Think!

初始概率\(\pi =[0.21,0.68,0.1]\)迭代

初始概率\(\pi =[0.75,0.15,0.1]\)迭代

平稳分布

初始概率不同,但经过若干次迭代,\(\pi\)最终稳定收敛在某个分布上。这是转移概率矩阵P的性质,而非初始分布的性质。

上例中,矩阵P的n次幂,每行都是,这实际上就是特征向量。

如果一个非周期马尔可夫随机过程具有转移概率矩阵P,且它的任意两个状态都是连通的,则存在,记作

In Fect,下面两种写法等价:

同时,若某概率分布\(\pi P=\pi\),说明

  • 该多项分布是状态转移矩阵P的平稳分布;

矩阵和向量的乘法

矩阵和向量的乘法应用

矩阵的秩

在\(m\times n\)矩阵A中,任取k行k列,不改变这\(k^2\)个元素在A中的次序,得到k阶方阵,称为矩阵A的k阶子式。

设在矩阵A中有一个不等于0的r阶子式D,且所有r+1阶子式(如果存在)全等于0,那么,D称为A的最高阶非零子式,r称为A的秩,记作R(A)=r

秩与线性方程组解的关系


推论

  • Ax=0有非零解的充要条件是R(A)<n
  • Ax=b有解的充要条件是R(A)=R(A,b)

向量组等价

系数矩阵

将向量组A,B所构成的矩阵依次记作\(A(a_1,a_2,...,a_m)\)和\(B(b_1,b_2,...,b_m)\),B组能由A组线性表示,即对于每个向量\(b_i\),存在\(k_{1j},k_{2j},...,k_{mj}\)

使得:

从而得到系数矩阵K

对C=AB的重新认识

由上,若\(C= A\times B\),则矩阵C的列向量由A的列向量线性表示,B即为这一表示的系数矩阵;C同样由B的行向量线性表示,A为这一表示的系数矩阵。

向量组\(B:b_1,b_2,...,b_n\)能由向量组\(A:a_1,a_2,...,a_n\)线性表示的充要条件是矩阵\(A=(a_1,a_2,...,a_n)\)的秩等于矩阵\((A,B)=(a_1,a_2,...,a_n,b_1,b_2,...,b_n)\)的秩。

正交阵

若n阶矩阵A满足\(A^TA=I\),称A为正交矩阵,简称正交阵。

I为对角线为1,其他为0的矩阵

A是正交阵,x为向量,则Ax称作正交变换。

正交变换不改变向量长度。

特征值和特征向量

A是n阶矩阵,若数\(\lambda\)和n纬非0列向量x满足\(Ax=\lambda x\),那么数\(\lambda\)称为A的特征值,x称为对应于特征值的特征向量。

特征值的性质

设n阶矩阵\(A(a_{ij})\)的特征值为\(\lambda_1,\lambda_2,...,\lambda_n\),则:

\(\lambda_1+\lambda_2+...+\lambda_n=a_{11}+a_{22}+...+a_{nn}\)

\(\lambda_1\lambda_2...\lambda_n=|A|\)

矩阵A主对角线行列式的元素和,称作矩阵A的

不同特征值对应的特征向量

  • 不同特征值对应的特征向量,线性无关。

  • 若方阵A是对称阵,结论是否加强?

引理

实对称阵的特征值是实数

应用:

将实数\(\lambda\)带入方程组\((A-\lambda I)x=0\),该方程组为实系数方程组,因此,实对称阵的特征向量可以取实向量

实对称阵的不同特征值的特征向量正交

令实对称阵为A,其两个不同的特征值\(\lambda_1 \lambda_2\)对应的特征向量分别是\(\mu_1\mu_2\);

最终结论

正定阵

对于n阶方阵A,若任意n阶向量x,都有\(x^TAx>0\)则称A是正定阵。

若条件变为\(x^TAx\ge0\),则A称作半正定阵。

类似的还有负定阵,半负定阵。

给定任意\(m\times n\)的矩阵A,证明\(A^TA\)一定是半正定阵。

正定阵的判定

  • 对称阵A为正定阵;
  • A的特征值都为正;
  • A的顺序主子式大于0;
  • 以上三个命题等价。

例题:

定义证明:

向量的导数

A为\(m\times n\)的矩阵,x为\(n \times1\)的列向量,则Ax为\(m\times1\)的列向量,记为:

推导

令:

从而:

结论与直接推广

注意

关于列向量求导,资料中有如下方案:

以上公式将会导致向量间求导得到“超越矩阵”-矩阵的每个元素仍然是一个矩阵,不利于应用。

标量对向量的导数

推导公式:

标量对方阵的导数

(邹博ML)矩阵和线性代数的更多相关文章

  1. (邹博ML)凸优化

    目录 凸集的基本概念 凸函数的基本概念 凸优化的一般提法 凸集基本概念 思考两个不能式 两个正数的算术平均数大于等于几何平均数 给定可逆对称阵Q,对于任意向量x,y,有: 思考凸集和凸函数 在机器学习 ...

  2. (邹博ML)数学分析与概率论

    机器学习入门 深度学习和机器学习? 深度学习在某种意义上可以认为是机器学习的一个分支,只是这个分支非常全面且重要,以至于可以单独作为一门学科来进行研究. 回忆知识 求解S. 对数函数的上升速度 我们使 ...

  3. Python 矩阵(线性代数)

    Python 矩阵(线性代数) 这里有一份新手友好的线性代数笔记,是和深度学习花书配套,还被Ian Goodfellow老师翻了牌. 笔记来自巴黎高等师范学院的博士生Hadrien Jean,是针对& ...

  4. (ML邹博)回归

    目录 线性回归 高斯分布 最大似然估计 最小二乘法的本质 Logistic回归 工具 梯度下降算法 最大似然估计 线性回归 对于单个变量: y=ax+b 对于多个变量: 使用极大似然估计解释最小二乘法 ...

  5. 理解矩阵与线性代数<转>

    作者:张帅链接:https://www.zhihu.com/question/21082351/answer/34361293来源:知乎著作权归作者所有.商业转载请联系作者获得授权,非商业转载请注明出 ...

  6. loj#6040. 「雅礼集训 2017 Day5」矩阵(线性代数+递推)

    题面 传送门 题解 我的线代学得跟屎一样看题解跟看天书一样所以不要指望这题我会写题解 这里 //minamoto #include<bits/stdc++.h> #define R reg ...

  7. OPENGL之矩阵

    前面的若干重要概念中描述了OPENGL中的几个重要变换,而矩阵是线性代数中的重要数学工具,它被用来对这些变换进行数学上的实现. 矩阵主要有以下几种: 模型视图矩阵:模型视图矩阵是个4*4的矩阵,代表经 ...

  8. A Simple Math Problem(矩阵快速幂)(寒假闭关第一题,有点曲折啊)

    A Simple Math Problem Time Limit: 3000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Other ...

  9. Numpy的线性代数

    线性代数的矩阵乘法 线性代数(如矩阵乘法.矩阵分解.行列式以及其他方阵数学等)是任何数组库的重要组成部分.不想某些语言(如MATLAB), 通过*对两个二维数组相乘得到的是一个元素级的积,而不是一个矩 ...

随机推荐

  1. WPF 基础 - xaml 语法总结

    Attribute 与 Property 之间的区别 Property 对应着抽象对象身上的性状: Attribute 是针对标签的特征: 往往一个标签具有的 Attribute 对于它所代表的对象的 ...

  2. vue Element-ui el-menu 左侧导航条

    <template> <!--实现左侧导航条动态渲染(三级)--> <el-menu class="el-menu-vertical-demo" @o ...

  3. JSP、EL表达式、JSTL标签库干货(建议收藏)

    JSP(Java Server Pages)类似于ASP技术,它是在传统的网页HTML文件(.htm,.html)中插入Java程序段(Scriptlet)和JSP标记(tag),从而形成JSP文件, ...

  4. python torndb模块

    一.torndb概述 torndb是一个轻量级的基于MySQLdb封装的一个模块,其是tornado框架的一部分.其项目主页为:https://github.com/bdarnell/torndb . ...

  5. HTML5中window.postMessage,在两个页面之间的数据传递

    HTML5中window.postMessage,在两个页面之间的数据传递 2015年11月3日 8536次浏览 关于postMessage window.postMessage虽然说是html5的功 ...

  6. logging日志的使用和设置过期自动删除

    一.logging的基础使用 1.logging的级别 import logging logging.debug('debug message') # 计算或者工作的细节 logging.info(' ...

  7. ElementUI Tree控件在懒加载模式下的重新加载和模糊查询

    之所以使用懒加载是为了提高性能,而且只有在懒加载模式下默认会给所有显示节点设置展开按钮.leaf也可以做到,但是要操作数据比较麻烦. 要实现懒加载模式下的模糊查询以及重新加载必须要使用data与laz ...

  8. 攻防世界 reverse BABYRE

    BABYRE   XCTF 4th-WHCTF-2017 int __cdecl main(int argc, const char **argv, const char **envp) { char ...

  9. vue 快速入门 系列 —— 侦测数据的变化 - [基本实现]

    其他章节请看: vue 快速入门 系列 侦测数据的变化 - [基本实现] 在 初步认识 vue 这篇文章的 hello-world 示例中,我们通过修改数据(app.seen = false),页面中 ...

  10. filesort排序原理

    在执行计划中,可能经常看到有Extra列有filesort,这就是使用了文件排序,这当然是不好的,应该优化,但是,了解一下他排序的原理也许很有帮助,下面看一下filesort的过程: 1.根据表的索引 ...