阅读翻译Mathematics for Machine Learning之2.5 Linear Independence
阅读翻译Mathematics for Machine Learning之2.5 Linear Independence
关于:
- 首次发表日期:2024-07-18
- Mathematics for Machine Learning官方链接: https://mml-book.com
- ChatGPT和KIMI机翻,人工润色
- 非数学专业,如有错误,请不吝指出
2.5 线性无关( Linear Independence)
接下来,我们将仔细看看如何操作向量(向量空间的元素)。特别是,我们可以将向量相加并用标量相乘。闭合性(closure property)保证了我们最终得到的还是同一向量空间中的另一个向量。我们可以找到一组(set)向量,通过相加和缩放这些向量,我们可以表示向量空间中的每一个向量。这组向量称为基(base),我们将在第2.6.1节讨论它们。在此之前,我们需要介绍线性组合和线性无关的概念。
定义 2.11(线性组合)。考虑一个向量空间 \(V\) 和有限数量的向量 \(\boldsymbol{x}_1, \ldots, \boldsymbol{x}_k \in V\)。那么,每一个 \(\boldsymbol{v} \in V\) 形式如下的向量
\tag{2.65}
\]
其中 \(\lambda_1, \ldots, \lambda_k \in \mathbb{R}\) 是向量 \(\boldsymbol{x}_1, \ldots, \boldsymbol{x}_k\) 的线性组合。
零向量 \(\mathbf{0}\) 总是可以写成 \(k\) 个向量 \(\boldsymbol{x}_1, \ldots, \boldsymbol{x}_k\) 的线性组合,因为 \(\mathbf{0}=\sum_{i=1}^k 0 \boldsymbol{x}_i\) 总是成立的。接下来,我们对一组向量的非平凡(non-trivial)线性组合表示 \(\mathbf{0}\) 感兴趣,即向量 \(\boldsymbol{x}_1, \ldots, \boldsymbol{x}_k\) 的线性组合,其中不是所有系数 \(\lambda_i\) 在 (2.65) 中都为 0。
定义 2.12(线性(不)相关性)。让我们考虑一个向量空间 \(V\) 以及 \(k \in \mathbb{N}\) 和 \(\boldsymbol{x}_1, \ldots, \boldsymbol{x}_k \in V\)。如果存在一个非平凡的线性组合,使得 \(\mathbf{0}=\sum_{i=1}^k \lambda_i \boldsymbol{x}_i\) 且至少有一个 \(\lambda_i \neq 0\),则向量 \(\boldsymbol{x}_1, \ldots, \boldsymbol{x}_k\) 是线性相关的。如果只存在零解,即 \(\lambda_1=\ldots=\lambda_k=0\),则向量 \(\boldsymbol{x}_1, \ldots, \boldsymbol{x}_k\) 是线性无关的。
线性无关是线性代数中最重要的概念之一。直观上,一组线性无关的向量由没有冗余的向量组成,即,如果我们从集合中移除任何一个向量,我们将失去一些东西。在接下来的章节中,我们将更正式地讨论这一直觉。
注释 以下性质对于判断向量是否线性无关是有用的:
\(k\) 个向量要么线性相关,要么线性无关,没有第三种可能。
如果向量 \(\boldsymbol{x}_1, \ldots, \boldsymbol{x}_k\) 中至少有一个是零向量 \(\mathbf{0}\),那么它们是线性相关的。如果有两个向量相同,也成立。
向量 \(\left\{\boldsymbol{x}_1, \ldots, \boldsymbol{x}_k : \boldsymbol{x}_i \neq \mathbf{0}, i=1, \ldots, k\right\}, k \geqslant 2\) 是线性相关的,当且仅当(至少)其中一个是其他向量的线性组合。特别地,如果一个向量是另一个向量的倍数,即 \(\boldsymbol{x}_i=\lambda \boldsymbol{x}_j, \lambda \in \mathbb{R}\),那么集合 \(\left\{\boldsymbol{x}_1, \ldots, \boldsymbol{x}_k : \boldsymbol{x}_i \neq \mathbf{0}, i=1, \ldots, k\right\}\) 是线性相关的。
检查向量 \(\boldsymbol{x}_1, \ldots, \boldsymbol{x}_k \in V\) 是否线性无关的一种实用方法是使用高斯消元法:将所有向量作为矩阵 \(\boldsymbol{A}\) 的列,并进行高斯消元,直到矩阵处于行阶梯形态(这里不需要行简化阶梯形态(reduced row-echelon form)):
- 枢轴列(pivot columns)表示与其左边的向量线性无关的向量。注意,在构建矩阵时向量是有顺序的。
- 非枢轴列可以表示为左边枢轴列的线性组合。例如,行阶梯形态
\[\left[\begin{array}{lll}
1 & 3 & 0 \\
0 & 0 & 2
\end{array}\right]
\]告诉我们第一列和第三列是枢轴列。第二列是非枢轴列,因为它是第一列的三倍。
所有列向量是线性无关的当且仅当所有列都是枢轴列。如果至少有一个非枢轴列,则这些列(因此,相应的向量)是线性相关的。
注释 考虑一个向量空间 \(V\),其中有 \(k\) 个线性无关的向量 \(\boldsymbol{b}_1, \ldots, \boldsymbol{b}_k\) 和 \(m\) 个线性组合
\boldsymbol{x}_1=\sum_{i=1}^k \lambda_{i1} \boldsymbol{b}_i, \\
\vdots \\
\boldsymbol{x}_m=\sum_{i=1}^k \lambda_{im} \boldsymbol{b}_i .
\end{gathered}
\tag{2.7.0}
\]
定义 \(\boldsymbol{B}=\left[\boldsymbol{b}_1, \ldots, \boldsymbol{b}_k\right]\) 为一个矩阵,其列是线性无关的向量 \(\boldsymbol{b}_1, \ldots, \boldsymbol{b}_k\),我们可以更紧凑地写成
\boldsymbol{x}_j=\boldsymbol{B} \boldsymbol{\lambda}_j, \quad \boldsymbol{\lambda}_j=\left[\begin{array}{c}
\lambda_{1j} \\
\vdots \\
\lambda_{kj}
\end{array}\right], \quad j=1, \ldots, m,\\
\end{gathered}
\tag{2.7.1}
\]
我们想要检验 \(\boldsymbol{x}_1, \ldots, \boldsymbol{x}_m\) 是否线性无关。为此,我们遵循检验 \(\sum_{j=1}^m \psi_j \boldsymbol{x}_j=\mathbf{0}\) 的一般方法。通过 (2.71),我们得到
\tag{2.7.2}
\]
这意味着当且仅当列向量 \(\left\{\boldsymbol{\lambda}_1, \ldots, \boldsymbol{\lambda}_m\right\}\) 是线性无关的, \(\left\{\boldsymbol{x}_1, \ldots, \boldsymbol{x}_m\right\}\) 是线性无关的。
注释:在一个向量空间 \(V\) 中,\(m\) 个由 \(k\) 个向量 \(\boldsymbol{x}_1, \ldots, \boldsymbol{x}_k\) 线性组合而成的向量是线性相关的,如果 \(m>k\)。
阅读翻译Mathematics for Machine Learning之2.5 Linear Independence的更多相关文章
- How do I learn mathematics for machine learning?
https://www.quora.com/How-do-I-learn-mathematics-for-machine-learning How do I learn mathematics f ...
- machine learning(14) --Regularization:Regularized linear regression
machine learning(13) --Regularization:Regularized linear regression Gradient descent without regular ...
- Note for video Machine Learning and Data Mining——Linear Model
Here is the note for lecture three. the linear model Linear model is a basic and important model in ...
- Machine Learning - week 2 - Multivariate Linear Regression
Multiple Features 上一章中,hθ(x) = θ0 + θ1x,表示只有一个 feature.现在,有多个 features,所以 hθ(x) = θ0 + θ1x1 + θ2x2 + ...
- Andrew Ng 的 Machine Learning 课程学习 (week2) Linear Regression
这学期一直在跟进 Coursera上的 Machina Learning 公开课, 老师Andrew Ng是coursera的创始人之一,Machine Learning方面的大牛.这门课程对想要了解 ...
- 【机器学习|数学基础】Mathematics for Machine Learning系列之线性代数(1):二阶与三阶行列式、全排列及其逆序数
@ 目录 前言 二阶与三阶行列式 二阶行列式 三阶行列式 全排列及其逆序数 全排列 逆序数 结语 前言 Hello!小伙伴! 非常感谢您阅读海轰的文章,倘若文中有错误的地方,欢迎您指出- 自我介绍 ...
- Machine Learning 学习笔记2 - linear regression with one variable(单变量线性回归)
一.Model representation(模型表示) 1.1 训练集 由训练样例(training example)组成的集合就是训练集(training set), 如下图所示, 其中(x,y) ...
- [Machine Learning] 单变量线性回归(Linear Regression with One Variable) - 线性回归-代价函数-梯度下降法-学习率
单变量线性回归(Linear Regression with One Variable) 什么是线性回归?线性回归是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方 ...
- 【机器学习Machine Learning】资料大全
昨天总结了深度学习的资料,今天把机器学习的资料也总结一下(友情提示:有些网站需要"科学上网"^_^) 推荐几本好书: 1.Pattern Recognition and Machi ...
- 机器学习(Machine Learning)&深度学习(Deep Learning)资料
<Brief History of Machine Learning> 介绍:这是一篇介绍机器学习历史的文章,介绍很全面,从感知机.神经网络.决策树.SVM.Adaboost到随机森林.D ...
随机推荐
- Stemciljs学习之组件生命周期
组件有许多生命周期方法,可用于了解组件何时"将"和"执行"加载.更新和呈现.可以将这些方法添加到组件中,以便在正确的时间挂接到操作中. 在组件类中实现以下方法之 ...
- 【题解】A566.三点共线
题目大意,给定在平面直角坐标系中的多个点,判断有多少个三元组 \((A, B, C)\) 满足共线性质. 题目链接:A566.三点共线. 大题思路就是暴力所有的三元组,判断三个元素的斜率是否相同即可. ...
- 一种基于E3处理器平台的NAS完整方案(从电脑组装到网站部署)
一种基于E3处理器平台的NAS完整方案(从电脑组装到网站部署) 本文将简要简要介绍本人自建NAS的完整配置,截至发文此NAS已经连续良好运行一年,应当说具有良好的稳定性. 本文所述配置包含洋垃圾成分, ...
- itest work(爱测试) 开源接口测试&敏捷测试管理平台 9.5.0 发布,接口测试及脑图用例升级
(一)itest work 简介 itest work (爱测试) 一站式工作站让测试变得简单.敏捷,"好用.好看,好敏捷" ,是itest wrok 追求的目标.itest w ...
- react表单处理 受控组件
将state与表单项中的value值绑定在一起,有state的值来控制表单元素的值,称为受控组件. 绑定步骤: 在state中添加一个状态,作为表单元素的value值 给表单元素绑定change事件, ...
- SELinux 安全模型——TE
首发公号:Rand_cs SELinux 安全模型--TE 通过前面的示例策略,大家对 SELinux 应该有那么点感觉认识了,从这篇开始的三篇文章讲述 SELinux 的三种安全模型,会涉及一些代码 ...
- The solution of P5339
problem 容斥好题,结果题解里面一堆 \(\text{NTT}\). 如果我们去掉有多少个人喜欢什么东西的条件,那么这个题就直接枚举有 \(i\) 组同学会一起讨论蔡徐坤.这一个问题十分容易. ...
- 一个简单可分享的web数据透视分析
我推荐一个简单可分享的在线数据透视分析网站,首先看效果: 在线数据透视展示 用户上传一个Excel或csv文件后,把指标拖拽到左右两侧,再选择合适的分析方式,在中间展示区域就会出现分析数据或者图形了, ...
- es创建索引及别名更新mapping方法 elasticsearch [nested] nested object under path [XXX] is not of nested type
[nested] nested object under path [XXX] is not of nested type这是因为在创建索引时没有指定类型为数组,这就是一个大坑,ES官方说可以不用指定 ...
- Linux高级命令
重定向 重定向也称为输出重定向,用于将命令的输出保存到目标文件. 使用方法:> 文件名 或 >> 文件名.前者会覆盖文件内容,后者会追加内容到文件. 查看文件内容命令 cat: 显示 ...