推荐系统实践 0x11 NeuralCF

前言

这一篇文章我们来谈一下2017年新加坡国立大学提出的基于深度学习的系统过滤模型NeuralCF。我们在之前讲过矩阵分解技术，将协同过滤中的共现矩阵分解成用户向量矩阵以及物品向量矩阵。那么Embedding的思路也是一样的，只不过不是通过矩阵分解的形式，而是通过多层神经网络使用Embedding构造用户隐向量以及物品隐向量。用户隐向量与物品隐向量的內积，就是用户对物品的评分。这个內积的操作，同样可以使用神经网络层来实现，也就是前一篇文章所用的Scoring层，得到所谓的“相似度”，也就得到了评分。在实际使用中，我们往往会发现矩阵分解的模型会得到欠拟合的结果，所以深度学习可以弥补矩阵分解的结构简单，拟合不充分的弊端。论文原文以及我找到的一篇全文翻译的博文我贴在参考里面了，有兴趣的读者可以阅读一下。

网络结构

NeuralCF的网络结构如下图所示：

这里使用一个用户和一个物品作为输入特征，它使用one-hot编码将它们转化为二值化稀疏向量。注意到，对输入使用这样的通用特征表示，可以很容易地使用的内容特征来表示用户和物品，以调整解决冷启动问题。文章使用了多层感知机（Layer1-X）来代替了之前的内机操作，最终得到了评分。这样做的原因：

可以使得用户向量和物品向量充分交叉，得到更多有价值的特征组合
可以引入更多的非线性特征让模型的表达能力更强

输入层上面是嵌入层（Embedding Layer）;它是一个全连接层，用来将输入层的稀疏表示映射为一个稠密向量（dense vector）。所获得的用户（物品）的Embedding（就是一个稠密向量）可以被看作是在潜在因素模型的上下文中用于描述用户（项目）的潜在向量。然后我们将用户Embedding和物品Embedding送入多层神经网络结构，我们把这个结构称为神经协作过滤层，它将潜在向量映射为预测分数。NCF层的每一层可以被定制，用以发现用户-物品交互的某些潜在结构。最后一个隐含层Layer X的维度大小决定了模型的能力。

实际上，用户和商品的互操作可以使用任意的互操作形式，这也就是广义矩阵分解（GMF）。那么，这篇文章使用了元素积，也就是逐元素点乘（element-wise product）的形式，将用户向量和物品向量映射到同等维度大小的空间当中，然后对应维度相乘，这样就实现了互操作，最后再送入逻辑回归层等输出层，拟合最终的预测目标。GMF，它应用了一个线性内核来模拟潜在的特征交互；MLP，使用非线性内核从数据中学习交互函数。接下来的问题是：我们如何能够在NCF框架下融合GMF和MLP，使他们能够相互强化，以更好地对复杂的用户-物品交互建模？为了解决这个问题，这篇文章将多种互操作结合起来，如传统矩阵分解，多层感知机映射这两种形式进行，然后也是用了两种互操作，逐元素点乘以及多层感知机，如下图所示。

对于结合GMF和单层MLP的模型形成数学公式的话如下所示：

\[\widehat{y}_{ui}=\sigma({\bf h}^{T}a({\bf p}_u\odot{\bf q}_i)+{\bf W}\begin{bmatrix}{{\bf p}_u}\\{{\bf q}_i}\end{bmatrix}+{\bf b})
\]

整体的框架中的公式可以如下：

\[\phi^{GMF}={\bf p}_u^G\odot{\bf q}_i^G,\\\phi^{MLP}=a_{L}(W_L^T(a_{L-1}(...a_{2}(W_2^T\begin{bmatrix}{{\bf p}_u^M}\\{{\bf q}_i^M}\end{bmatrix}+{\bf b}_2)...))+{\bf b}_L),\\\widehat{y}_{ui}=\sigma({\bf h}^T\begin{bmatrix}{\phi^{GMF}}\\{\phi^{MLP}}\end{bmatrix})
\]

这里的$p^G_u$和$p^M_u$分别表示GMF部分和MLP部分的用户嵌入（user embedding）；同样的，$q^G_i$和$q^M_i$分别表示项目的Embedding。

小结

多种用户向量、物品向量的Embedding，以及多种互操作形式进行特征的交叉组合，可以灵活的进行拼接，同时也利用了神经网络对任意函数的拟合能力，按需增加复杂度或者减小复杂度。但是NeuralCF并没有引入其他类型的特征，使得很多有价值的信息浪费。同时，互操作的选取也没有给出更多说明，只有在实践中进行探讨了。

参考

Neural Collaborative Filtering

【翻译】Neural Collaborative Filtering--神经协同过滤

随机推荐

思维导图MindManager的过滤主题功能如何使用
MindManager是一款多功能思维导图工具软件.但有的思维导图繁杂,用户只需要查看自己感兴趣的主题该怎么办呢?接下来,我就为大家详细介绍MindManager思维导图2020版的过滤主题功能,可以 ...
会声会影使用教程：剪辑Vlogo短视频
随着抖音.快手等视频分享软件的兴起,很多人已经开始尝试制作短视频分享.那么,对于视频制作新手来说,短视频的制作难度大吗?其实,只要选对了视频制作软件,视频制作将会变得相当简单. 在众多视频制作软件中, ...
FL studio系列教程（十）：FL Studio中如何新建样本
FL Studio中强调以样本为核心的编曲模式.样本其实就是一个小的音序片段,可以是单独的乐器或单独的打击乐,还可以是他们组合的一个小音序片段,它是我们学习编曲的最基础知识.所以本文主要为大家讲解的是 ...
zabbix 监控域名证书到期时间！！！！
在客户端机器上创建脚本 vim /etc/zabbix/zabbix_agentd.d/check-cert-expire.sh #!/bin/sh host=$1port=$2end_date=`o ...
蓝桥杯——递增三元组（2018JavaB-第6题，11分）
递增三元组(18JB-6-11') 给定三个整数数组 A = [A1, A2, ... AN], B = [B1, B2, ... BN], C = [C1, C2, ... CN], 请你统计有多少 ...
LeetCode 020 Valid Parentheses
题目描述:Valid Parentheses Given a string containing just the characters '(', ')', '{', '}', '[' and ']' ...
paddleocr安装笔记
下载解压安装 wget http://npm.taobao.org/mirrors/python/3.7.6/Python-3.7.6.tgztar xvf Python-3.7.6.tgzcd Py ...
moviepy音视频开发：使用volumex调节音量大小及其花式用法
☞ ░ 前往老猿Python博文目录 ░ 一.概述音频数据的音量体现为声音的振幅,振幅越大则声音越大,具体到音频帧数据上,体现为声音的绝对值越大则振幅越大音量越大,调节音量大小的本质是调整帧数据的绝 ...
第15.43节、PyQt输入部件：QAbstractSpinBox派生类QSpinBox、 QDoubleSpinBox、QDateTimeEdit、QDateEdit和QTimeEdit功能简介
专栏:Python基础教程目录专栏:使用PyQt开发图形界面Python应用专栏:PyQt入门学习老猿Python博文目录老猿学5G博文目录一.概述 Designer输入部件中的Spin B ...
PyQt（Python+Qt）学习随笔：QToolBox工具箱的currentItemName和tabSpacing属性
老猿Python博文目录专栏:使用PyQt开发图形界面Python应用老猿Python博客地址在Designer中,toolBox的属性中有currentItemName和tabSpacing属 ...

推荐系统实践 0x11 NeuralCF

前言

网络结构

小结

参考

推荐系统实践 0x11 NeuralCF的更多相关文章

随机推荐

热门专题