ALS数学点滴

其中，$n_{u_i}$表示用户$i$评分的电影数目，$n_{m_j}$表示对电影$j$评分的用户数目。设$I_i$表示用户$i$所评分的电影集合，则$n_{u_i}$是$I_i$的基数，同样的，$I_j$表示对电影$j$评分的用户集合，$n_{m_j}$是$I_j$的基数。这对应于Tikhonov正则化中的$\Gamma_U=diag(n_{u_i})$和$\Gamma_M=diag(n_{m_j})$

设$U=[\mathbf{u}_i]$为用户特征矩阵，$M=[\mathbf{m}_j]$为电影特征矩阵。

我们在$M$给定的情况下来求解$U$。$U$中某一列$u_i$是通过求解一个正则化线性最小二乘问题确定的，该问题的求解需要已知的用户$i$的评分，以及用户$i$参与评分的电影的特征向量$m_j$.

用户特征矩阵的每一列的解$\mathbf{u}_i$如下：
$$\mathbf{u}_i=A_i^{-1}V_i$$
该解对应的原始方程为:$$A_i \mathbf{u}_i=V_i$$

其中，$A_i=M_{I_i}M_{I_i}^T+\lambda n_{u_i}E$ ，$V_i=M_{I_i}R^T(i,I_i)$。$E$是一个$n_f\times n_f$单位矩阵。$M_{I_i}$是电影特征矩阵的一个子矩阵，其中只选取$j\in I_i$的列。$I_i$是用户$i$所评分的电影集合。$R(i,I_i)$是原始user-movie矩阵$R$中第$i$行的向量，该行中只选取$j\in I_i$的列中的元素。

同样的，更新电影特征矩阵$M$的公式为：

$$\mathbf{m}_j=A_j^{-1}V_j,\forall j$$

其中，$A_j=U_{I_j}U_{I_j}^T+\lambda n_{m_j}E$，$V_j=U_{I_j}R(I_j,j)$。$U_{I_j}$是用户特征矩阵$U$的子矩阵，其中只选取$i\in I_j$的列。$I_j$表示对电影$j$评过分的用户集合。$R(I_j,j)$是原始user-movie矩阵$R$的第$j$列向量，该列中只选取$i\in I_j$的行中的元素。

设用户矩阵和电影矩阵的特征数量为$n_f$，对电影$j$评过分的用户有$k$个，则$U_{I_j}$为一个$n_f\times k$的矩阵，$R(I_j,j)$为一个$k\times 1$的列向量。$V_j=U_{I_j}R(I_j,j)$为一个$f\times k \cdot k\times 1=f\times 1$的矩阵。

设用户数量$n_u=3$，电影数量$n_m=4$，用户以及电影的特征维度$n_f=2$。则user-movie评分矩阵$R$(Rating)为：

$$R=\begin{bmatrix}
r_{11} & r_{12} & r_{13} & r_{14} \\
r_{21} & r_{22} & r_{23} & r_{24} \\
r_{31} & r_{32} & r_{33} & r_{34}
\end{bmatrix}$$

若矩阵$R$是稀疏的，那么其形式可能如下：
$$R=\begin{bmatrix}
& r_{12} & r_{13} & r_{14} \\
r_{21} & & & r_{24} \\
& r_{32} & r_{33} &
\end{bmatrix}$$

用户特征矩阵$U$为：
$$U=\begin{bmatrix}
u_{11} & u_{12} & u_{13} \\
u_{21} & u_{22} & u_{23}
\end{bmatrix}$$

电影特征矩阵$M$为：
$$M=\begin{bmatrix}
m_{11} & m_{12} & m_{13} & m_{14} \\
m_{21} & m_{22} & m_{23} & m_{24}
\end{bmatrix}$$

显然，我们要求解的是用户特征矩阵$U$和电影特征矩阵$M$。

求解用户特征矩阵$U$的时候要固定电影特征矩阵$M$，用求得的$U$再去求$M$，如此迭代，直到$RMSE$在设定范围之内即可，此时$U$和$M$收敛到一个局部最优解。

可将$U$表为$U=[\mathbf{u}_i], i=1,2,3$。即：
$$U=
\begin{bmatrix}
\mathbf{u}_1 & \mathbf{u}_2& \mathbf{u}_3
\end{bmatrix}
$$

调用上面的求解公式$\mathbf{u}_i=A_i^{-1}V_i$，其中$A_i=M_{I_i}M_{I_i}^T+\lambda n_{u_i}E$ ，$V_i=M_{I_i}R^T(i,I_i)$，则：
$$\mathbf{u}_1=A_1^{-1}V_1$$
以上面的稀疏矩阵为例，求解$[\mathbf{u}_i], i=1,2,3$时，$I_1=\{2,3,4\}$，$I_2=\{1,4\}$，$I_3=\{2,3\}$。$n_{u_1}=3$，表示用户$u_1$评过分的电影有3部，设用户$u_i$评过分的电影有$k$部，那么$I_i$的个数为$k$，$M_{I_i}$为一个$n_f \times k$的矩阵，$M_{I_i}M_{I_i}^T$为一个$n_f \times n_f$的矩阵。$R(i,I_i)$为$u_i$所对应的评分向量，该向量的维度为$k$，因为只取了$j \in I_i$中的元素，所以$R(i,I_i)$为$1 \times k$行向量，$R^T(i,I_i)$为$k \times 1$列向量。

例如：
$$
\begin{align*}
A_1 &= M_{I_1}M_{I_1}^T+\lambda n_{u_1}E \\
&= \begin{bmatrix}
m_{12} & m_{13} & m_{14} \\
m_{22} & m_{23} & m_{24}
\end{bmatrix}
\cdot
\begin{bmatrix}
m_{12} & m_{22} \\
m_{13} & m_{23} \\
m_{14} & m_{24}
\end{bmatrix}
+\lambda n_{u_1}
\cdot
\begin{bmatrix}
1 & 0 \\
0 & 1
\end{bmatrix} \\
\\
V_1 &= M_{I_1}R^T(1,I_1) \\
&= \begin{bmatrix}
m_{12} & m_{13} & m_{14} \\
m_{22} & m_{23} & m_{24}
\end{bmatrix}
\cdot
\begin{bmatrix}
r_{12} & r_{13} & r_{14}
\end{bmatrix}^T \\
&= \begin{bmatrix}
m_{12} & m_{13} & m_{14} \\
m_{22} & m_{23} & m_{24}
\end{bmatrix}
\cdot
\begin{bmatrix}
r_{12} \\
r_{13} \\
r_{14}
\end{bmatrix}
\end{align*}
$$

这样即可求出$\mathbf{u}_1$，类似可求出$\mathbf{u}_2, \mathbf{u}_3$

好了，这样就求出了$U$，此时在用$U$去求解$M$，求解公式为：$\mathbf{m}_j=A_j^{-1}V_j,\forall j$。其中，$A_j=U_{I_j}U_{I_j}^T+\lambda n_{m_j}E$，$V_j=U_{I_j}R(I_j,j)$。需要注意的是这里的$I_j$与上面的$I_i$指代的内容有所区别，上面的$I_i$表示用户$u_i$所评分的电影集合，$I_i$中的元素个数小于等于电影的总数，即$size(I_i)\le n_m$，而这里的$I_j$表示对电影$j$评过分的用户个数，所以$I_j$中的元素个数小于等于用户的总数，即$size(I_j)\le n_u$。

这次以求解$\mathbf{m}_3$为例。$I_3=\{1,3\}$，$n_{m_3}=2$表示给电影$m_3$评过分的用户有2个。

$$
\begin{align*}
A_3 &= U_{I_3}U_{I_3}^T+\lambda n_{m_3}E \\
&= \begin{bmatrix}
u_{11} & u_{13} \\
u_{21} & u_{23}
\end{bmatrix}
\cdot
\begin{bmatrix}
u_{11} & u_{13} \\
u_{21} & u_{23}
\end{bmatrix}^T
+\lambda n_{m_3}
\cdot
\begin{bmatrix}
1 & 0 \\
0 & 1
\end{bmatrix}\\
\\
V_3 &=U_{I_j}R(I_j,j) \\
&＝\begin{bmatrix}
u_{11} & u_{13} \\
u_{21} & u_{23}
\end{bmatrix}
\cdot
\begin{bmatrix}
r_{13} \\
r_{33}
\end{bmatrix}
\end{align*}
$$

如此，便可求出$\mathbf{m}_3=A_3^{-1}V_3$。类似可求出$\mathbf{m}_1, \mathbf{m}_2, \mathbf{m}_4$。

原始论文：http://www.grappa.univ-lille3.fr/~mary/cours/stats/centrale/reco/paper/MatrixFactorizationALS.pdf

ALS数学点滴的更多相关文章

数学复习 ---- Mathematics Notes: A Programmer's Perspective ---- by Orzer ---- 我是沙茶
今年是好没长进的一年呢..只学了些基本的方法.. 本文记号0] x:p x类型为p1] f(x) 表示一个函数2] (n_1,n_2,...) 表示多元组,特别的,(n)表示一个一元组3] x 表示一 ...
SQL点滴25—T-SQL面试语句，练练手
原文:SQL点滴25-T-SQL面试语句,练练手 1. 用一条SQL语句查询出每门课都大于80分的学生姓名 name kecheng fenshu 张三语文 81张三 ...
ALS音乐推荐（上）
本篇文章的开头笔者提出一个疑问,何为数据科学,数据科学是做什么的?大家带着这个疑问去读接下来的这篇音乐推荐的公众号. 从经验上讲,推荐引擎属于大规模机器学习,在日常购物中大家或许深有体会,比如:你在淘 ...
【机器学习笔记一】协同过滤算法 - ALS
参考资料 [1]<Spark MLlib 机器学习实践> [2]http://blog.csdn.net/u011239443/article/details/51752904 [3]线性 ...
Spark MLlib回归算法------线性回归、逻辑回归、SVM和ALS
Spark MLlib回归算法------线性回归.逻辑回归.SVM和ALS 1.线性回归: (1)模型的建立: 回归正则化方法(Lasso,Ridge和ElasticNet)在高维和数据集变量之间多 ...
Spark Mllib里的协调过滤的概念和实现步骤、LS、ALS的原理、ALS算法优化过程的推导、隐式反馈和ALS-WR算法
不多说,直接上干货! 常见的推荐算法 1.基于关系规则的推荐 2.基于内容的推荐 3.人口统计式的推荐 4.协调过滤式的推荐 (广泛采用) 协调过滤的概念在现今的推荐技术和算法中,最被大家广泛认可和 ...
机器学习（十三）——机器学习中的矩阵方法（3）病态矩阵、协同过滤的ALS算法（1）
http://antkillerfarm.github.io/ 向量的范数(续) 范数可用符号∥x∥λ表示. 经常使用的有: ∥x∥1=|x1|+⋯+|xn| ∥x∥2=x21+⋯+x2n−−−−−− ...
spark 机器学习 ALS原理(一)
1.线性回归模型线性回归是统计学中最常用的算法,当你想表示两个变量间的数学关系时,就可以用线性回归.当你使用它时,你首先假设输出变量(相应变量.因变量.标签)和预测变量(自变量.解释变量.特征)之间存 ...
数学思想：为何我们把 x²读作x平方
要弄清楚这个问题,我们得先认识一个人.古希腊大数学家欧多克索斯,其在整个古代仅次于阿基米德,是一位天文学家.医生.几何学家.立法家和地理学家. 为何我们把 x²读作x平方呢? 古希腊时代,越来越多的 ...

随机推荐

vs2008 下编译jrtplib-3.9.0成功
jrtplib-3.9.0的编译,终于搞通了.网上搜集了很多资料,自己也调试了很久. 首先,jrtplib-3.9.0是什么不用多说吧,它是一个很牛的老外用C++写的一个开源的RTP协议库,用它可以进 ...
C# 窗体靠近屏幕边缘自动隐藏*学习（类似于QQ）
using System; using System.Collections.Generic; using System.Drawing; using System.Windows.Forms; us ...
php之上传小案例，根据时间:月日分创建目录并随机生成文件名
<?php /* 接收文件,并分目录存储,生成随机文件名 1.根据时间戳,并按一定规则创建目录 2.获取文件名的后缀名 3.判断大小 */ //根据月日分计算并创建目录 function mk_ ...
Django框架学习-Model进阶用法
Model进阶用法回顾访问外键访问多对多关系更改数据库结构当处理数据库结构改变时,需要注意到几点: 增加字段首先在开发环境中: 再到产品环境中: 删除字段删除多对多字段删除model ...
F题 - A+B for Input-Output Practice (V)
Time Limit:1000MS Memory Limit:32768KB 64bit IO Format:%I64d & %I64u Description You ...
BZOJ 1046 上升序列
Description 对于一个给定的S={a1,a2,a3,…,an},若有P={ax1,ax2,ax3,…,axm},满足(x1 < x2 < … < xm)且( ax1 < ...
Eclipse中查找接口实现类快捷键
就是点击某个接口某个方法名字的时候,直接跳到它的某个实现类里面,一般我们习惯对着那个接口的方法按F3,但是这会直接跳到接口类的源码中,那么呵呵,我们换一个ctrl+T 然后自己选择一下实现类就进去了. ...
ReiserFS与EXT3的比较
ReiserFS与EXT3的比较最近,我刚从ReiserFS文件系统转到了ext3日志文件系统.我是一个ReiserFS的忠实追随者,并且直到现在我也没有改变我对该文件系统的看法.我之所以转而使用e ...
shell command使用技巧
1窗口可以merge 2.可以通过 control+t打开窗口
实战weblogic集群之应用部署
一.创建应用发布目录,上传应用包. 1.在10.70.52.11-14的/app/sinova目录下建立applications目录(名称可以自定义),作为我们应用的发布目录. $ mkdir /ap ...

ALS数学点滴

ALS数学点滴的更多相关文章

随机推荐

热门专题