推荐中的多任务学习-ESMM

本文将介绍阿里发表在 SIGIR’18 的论文ESMM《Entire Space Multi-Task Model: An Eﬀective Approach for Estimating Post-Click Conversion Rate》。文章提出使用多任务学习解决CVR（转化率）预估时的样本选择偏差和数据稀疏问题。

背景

在推荐系统、在线广告等应用中，CVR预估比CTR预估更加重要，CTR预估聚焦于点击率预估，即预测用户会不会点击，但是用户点击后进行消费才是最终目标。传统的CVR预估任务通常采用类似于CTR预估的技术，然而，这种做法存在两个重大问题：1) 样本选择偏差；2) 训练数据稀疏

1.样本选择偏差

转化是在点击之后发生，传统CVR预估模型在clicked数据上训练，但是在推理时使用了整个样本空间见图。训练样本和实际数据不服从同一分布，不符合机器学习中训练数据和测试数据独立同分布的假设。直观的说，会产生转化的用户不一定都是进行了点击操作的用户，如果只使用点击后的样本来训练，会导致CVR学习产生偏置。具体的实验结果可以见原论文[1]

2.训练数据稀疏

训练数据稀疏问题很明显，点击样本在整个样本空间中只占了很小一部分，而转化样本更少，高度稀疏的训练数据使得模型的学习变得相当困难。

ESMM

首先明确CTR、CVR、CTCVR。CTR表示点击率、CVR表示假设用户点击后的转化率、CTCVR表示用户点击并且成功转化。

如何解决上述问题？ESMM 引入点击率（CTR）和点击转化率（CTCVR）作为辅助任务，将CVR作为一个中间变量。它们的关系如下
\[
\underbrace{p(y=1, z=1 | x)}_{p C T C V R}=\underbrace{p(y=1 | x)}_{p C T R} \times \underbrace{p(z=1 | y=1, x)}_{p C V R}
\]
可以看出，\(pCTR\)和\(pCTCVR\)是在整个样本空间上进行学习得到的，只是label不同，\(pCVR\)是中间变量，这样就解决了样本选择偏差问题。模型架构如下

可以看出在 ESMM 中，CVR 与 CTR 任务共享Embedding 参数。这种参数共享机制使 ESMM 中的 CVR 网络可以从未点击的样本中学习，在一定程度缓解了数据稀疏性问题。

至此，两个问题已经被解决了，下面看下ESMM如何学习，模型的损失函数如下：
\[
\begin{aligned}L\left(\theta_{c v r}, \theta_{c t r}\right) &=\sum_{i=1}^{N} l\left(y_{i}, f\left(x_{i} ; \theta_{c t r}\right)\right)+\sum_{i=1}^{N} l\left(y_{i} \& z_{i}, f\left(x_{i} ; \theta_{c t r}\right) \times f\left(x_{i} ; \theta_{c v r}\right)\right)\end{aligned}
\]
第一项是CTR预估的损失，点击label为1否则为0；第二项是CTCVR预估的损失，点击且转化的label为1，否则为0。

这里还有一个问题，既然\(pCTCVR\)可以由\(pCTR\)和\(pCVR\)相乘得到，那么从理论上说，转化为除法也可以，即
\[
p(z=1 | y=1, x)=\frac{p(y=1, z=1 | x)}{p(y=1 | x)}
\]
这样可以分别训练两个模型，CTR和CVCTR，最终也可以得到CVR。论文对这种情况做了实验分析，发现实际上\(pCTR\)的值较小，会引起数值不稳定。

discussion

巧妙的引入了两个辅助任务解决CVR预估，解决了样本选择偏置问题，共享参数可以缓解数据稀疏

多任务学习在其他领域已经有很多应用，但在推荐中，更应该结合具体的数据和任务设计。例如，在跨领域任务中，不同领域的环境样本是不一样的，但用户信息可能有重复，那么针对这种场景怎么设计多任务学习，样本信息的利用需要更多得考虑。

references:

[1] Xiao Ma, Liqin Zhao, Guan Huang, Zhi Wang, Zelin Hu, Xiaoqiang Zhu, and Kun Gai. 2018. Entire Space Multi-Task Model: An Effective Approach for Estimating Post-Click Conversion Rate. SIGIR (2018).

[2] https://github.com/alibaba/x-deeplearning/wiki/%E5%85%A8%E7%A9%BA%E9%97%B4%E5%A4%9A%E4%BB%BB%E5%8A%A1%E6%A8%A1%E5%9E%8B(ESMM)

随机推荐

redis 清除缓存
meta标签、常用的文字类标签及其区别
常用的文字类基本标签段落:p标题文字 :h1~h6超链接:a,必须属性href,后跟跳转地址图片:img,必须属性src,后跟图片地址字体斜体:em.i 文字加粗:b.strong文字下划线:u文字 ...
Python--day70--csrf简单用法、跨站请求伪造和csrf_token使用
1,csrf简单用法 2,Django里面的setting加入了防跨站伪造:这段代码帮你生成特殊字符串,帮你塞到html页面中来 3,csrf_token使用:
Python--day47--mysql慢日志记录
POJ 1321 深搜dfs
思路其实挺简单的,为什么我想不到呢!!! 原因分析:(1)题目还是做少了 (2)做题目的时候在放音乐 (3)最近脑袋都不愿意想思路总是想一些无用的改进:(1)以后做题目坚决不开音乐,QQ直接挂隐身 ...
前端开发之HTML
前端编程主要就是三部分:使用数据,存储数据和处理数据. 什么是前端: 前端就是使用数据的过程,通过规定的格式将服务端的数据在浏览器上更好的展示给用户. 前端的工具: HTML CSS 和 JavaS ...
H3C 多路径网络中环路产生过程（3）
java 反射的概念
反射的引入: Object obj = new Student(); 若程序运行时接收到外部传入的一个对象,该对象的编译类型是Object,但程序又需要调用该对象运行类型的方法: 1.若编译和运行类型 ...
SpringBoot项目改变图片临时文件的存储路径
springboot项目,部署到服务器后,运行一段时间后,处理文件上传的接口时,后报异常. Could not parse multipart servlet request; nested exce ...
【u104】组合数
Time Limit: 1 second Memory Limit: 128 MB [问题描述] 组合数C(N, K)表示了N个数字不重复地选取K个作组合的方案数. C(N, K) = N!/(N-M ...

推荐中的多任务学习-ESMM

推荐中的多任务学习-ESMM的更多相关文章

随机推荐

热门专题