目录 背景 Notation Sparse PCA Semidefinite Relaxation Low Rank Optimization Sorting and Thresholding 背景 懒得说了,毕竟和上一篇作者都是一个人,有特殊的情况是,上次做的复杂度过大,这次降低了复杂度. Notation Sparse PCA 在上篇论文里面,也提到了这个式子.上次是用它来进行一个robust的解释,这一次,是来试图解决这个问题. \(\Sigma_{ii} \quad i=1,2,\ldo…
目录 对以往一些SPCA算法复杂度的总结 Notation 论文概述 原始问题 问题的变种 算法 固定\(X\),计算\(R\) 固定\(R\),求解\(X\) (\(Z =VR^{\mathrm{T}}\)) \(T-\ell_0\)(新的初始问题) T-sp 考虑稀疏度的初始问题 T-en 考虑Energy的问题 代码 SPCArt算法,利用旋转(正交变换更为恰当,因为没有体现出旋转这个过程),交替迭代求解sparse PCA. 对以往一些SPCA算法复杂度的总结 注:\(r\)是选取的主成…
目录 背景: 部分符号 创新点 文章梗概 The LASSO AND THE ELASTIC NET 将PCA改造为回归问题 定理二 单个向量(无需进行SVD版本) 定理三 多个向量(无需进行SVD, 非LASSO,非elastic net) 目标函数(最终版) 算法一 方差计算 复杂度 \(p \gg n\) 算法改进 数值实验(pitprops) 背景: sparse PCA 较 PCA来说更具可解释性,泛化性. 部分符号 \(\mathrm{X} \in \mathbb{R}^{n \ti…
目录 重点 算法 这篇文章,看的晕晕的,但是被引用了400多次了,就简单地记一笔. 这个东西,因为\(\ell_1\)范数,所以会稀疏化,当然,和\(\gamma\)有关. 重点 我想重点写的地方是下面这个改写: 他们这些人都太会玩了. 还有一些别的约束方法,比如\(\ell_0\): 这个问题不知道该怎么求解, 接下来,把单一向量的求解扩展到了块求解,这里只做一个记号. 算法…
目录 前言 文章概述 固定\(\widetilde{\mathrm{v}}\) 固定\(\widetilde{\mathrm{u}}\) Adjusted Variance 前言 这篇文章用的也是交替算法,不得不说,这个东西太好用了,变来变去怎么都能玩出花来.这篇论文的关键之处,我感觉是对adjusted variance的算法,比较让人信服. 文章概述 \(X是中心化的样本矩阵\) 考虑下面的一个最优分解(F-范数). 本文采取的也是一种搜索算法,每次计算一个载荷向量,所以,每次都处理的是ra…
目录 问题 重要的定义 距离 支撑树 交树 序 tree-line path 重要的性质 其它 Alfaro C A, Aydin B, Valencia C E, et al. Dimension reduction in principal component analysis for trees[J]. Computational Statistics & Data Analysis, 2014: 157-179. Aydin B, Pataki G, Wang H, et al. A p…
Principal Component Analysis(PCA) algorithm summary mean normalization(ensure every feature has sero mean) Sigma = 1/m∑(xi)(xi)T [U,S,V] = svd(Sigma)  ureduce = u(:,1:K) Z = ureduce ' * X Pick smallest value of k for which  ∑ki=1 Sii / ∑i=mi=1 Sii  >…
目录 引 一些微弱的假设: 问题的解决 理论 去随机 Dual Certificates(对偶保证?) Golfing Scheme 数值实验 代码 Candes E J, Li X, Ma Y, et al. Robust principal component analysis[J]. Journal of the ACM, 2011, 58(3). 引 这篇文章,讨论的是这样的一个问题: \[ M = L_0 + S_0 \] 有这样的一个矩阵\(M \in \mathbb{R}^{n_1…
Abstract A cataract is lens opacification caused by protein denaturation which leads to a decrease in vision and even results in complete blindness at later stages. The concept of a classification system of automatic cataract detecting based on retin…
PCA的数学原理(非常值得阅读)!!!!   PCA(Principal Component Analysis)是一种常用的数据分析方法.PCA通过线性变换将原始数据变换为一组各维度线性无关的表示,可用于提取数据的主要特征分量,常用于高维数据的降维.网上关于PCA的文章有很多,但是大多数只描述了PCA的分析过程,而没有讲述其中的原理.这篇文章的目的是介绍PCA的基本数学原理,帮助读者了解PCA的工作机制是什么. 当然我并不打算把文章写成纯数学文章,而是希望用直观和易懂的方式叙述PCA的数学原理,…