阿里CTR预估：用户行为长序列建模

本文将介绍Alibaba发表在KDD’19 的论文《Practice on Long Sequential User Behavior Modeling for Click-Through Rate Prediction》。文章针对长序列用户行为建模的问题从线上系统和算法两方面进行改进，已经成功部署在阿里巴巴的广告系统。

使用深度学习对用户兴趣建模在离线评估阶段带来了显著提升，但是在线部署时面对大量的流量请求难以实时推理，尤其是在对长序列用户行为数据，系统的延时和存储代价几乎是随着行为长度线性增长。为了解决长序列建模的挑战，作者从两个方面进行考虑：

1.从线上角度考虑，引入UIC（user interest center），从整个模型中分离出最消耗资源的。UIC依赖于用户的行为触发

2.从算法角度考虑，引入记忆架构，MIMN(Multi-channel user Interest Memory Network)，捕捉长序列行为

Theoretically, the co-design solution of UIC and MIMN enables us to handle the user interest modeling with unlimited length of sequential behavior data.

无限长？带着怀疑又好奇态度拜读下这篇大作。

UIC

首先为什么需要建模用户的长序列行为？下图是使用基础模型（DIN）在不同长度行为序列上实验的结果，可以看出当长度到达1000时AUC相比长度100时增加了0.6%。

图(A)是一个典型的CTR实时预估系统架构，主要由特征管理组件、模型管理组件和预测服务器组成。为了保证系统低延时和高吞吐量，用户的行为特征通常被存储在额外的存储系统，阿里使用的是自研TAIR。当新的流量请求到达时，特征更新到预测服务器参与实时推理计算，阿里使用DIEN实验发现，当行为序列长度达到150时，系统延时和吞吐量已经到达边缘了，更不用说1000的长度。

对用户长期行为建模有两个主要的限制：

1）存储限制

阿里拥有6亿用户，如果每个用户最大行为长度为150，至少需要1T的存储空间；长度到1000时，需要6T存储空间。更大的内存消耗，将会导致计算复杂度增加

2）延时限制

CTR预估模块根据输入的候选商品集合，输出对应的概率，这个过程通常需要在10ms内完成。DIEN在行为长度达到1000时，在500QPS延时达到了200ms，难以满足在线广告系统500QPS30ms的限制。

为了解决上述提到的长序列行为建模的问题，作者设计了UIC（user interest center）模块。图(B)是UIC模块的示意，(A)(B)的区别在于用户兴趣表示计算，在(B)中，UIC会为每个用户维持一个最新的兴趣表示，UIC的更新仅取决于用户的行为，不再是流量触发，可以做到无延时。实际应用证明，UIC+DIEN将1000长度的200ms减少到19ms在500QPS下。

MIMN

从算法模型来看，建模长序列相当困难，RNN无法胜任，attention机制虽然可以更加有效的处理长序列，但是需要存储所有原始的用户行为序列，存储和计算代价太大。MIMN借鉴神经图灵机的思想，对长序列进行建模。下图是MIMN的架构

UIC存储MIMN的外部记忆，当用户产生新行为时进行更新。通过这种方式，UIC可以递增的从行为序列中捕获用户的兴趣，但是当存储资源有限时，固定维度的向量表达能力有限。作者提出了记忆利用正则化增加UIC单元的表示能力，同时提出了记忆归纳单元捕获高阶信息。

神经图灵机

神经图灵机使用一个记忆网络存储信息，通过读写控制器进行记忆读写。

记忆利用正则化

标准NTM存在记忆利用不平衡问题，导致记忆利用不充分。作者根据不同的记忆块，正则化写权重。

记忆归纳单元

记忆归纳单元将每个记忆块作为一个用户兴趣通道。在时间步t选择一个k个通道，对选中的通道更新
\[
S_t(i)=GRU(S_{t+1}(i),M_t(i),e_t)
\]
可以实现下面的结果

enen……，回家了有点懒，剩下的部分下次更新……

references：
[1] Alibaba. Practice on Long Sequential User Behavior Modeling for Click-Through Rate Prediction. KDD'19

阿里CTR预估：用户行为长序列建模的更多相关文章

0-3为变长序列建模modeling variable length sequences
在本节中,我们会讨论序列的长度是变化的,也是一个变量 we would like the length of sequence,n,to alse be a random variable 一个简单的 ...
主流CTR预估模型的演化及对比
https://zhuanlan.zhihu.com/p/35465875 学习和预测用户的反馈对于个性化推荐.信息检索和在线广告等领域都有着极其重要的作用.在这些领域,用户的反馈行为包括点击.收藏. ...
【项目】百度搜索广告CTR预估
-------倒叙查看本文. 6,用auc对测试的结果进行评估: auc代码如下: #!/usr/bin/env python import sys def auc(labels,predicted_ ...
【项目】搜索广告CTR预估（二）
项目介绍给定查询和用户信息后预测广告点击率搜索广告是近年来互联网的主流营收来源之一.在搜索广告背后,一个关键技术就是点击率预测-----pCTR(predict the click-through ...
闲聊DNN CTR预估模型
原文:http://www.52cs.org/?p=1046 闲聊DNN CTR预估模型 Written by b manongb 作者:Kintocai, 北京大学硕士, 现就职于腾讯. 伦敦大学张 ...
计算广告CTR预估系列(七)--Facebook经典模型LR+GBDT理论与实践
计算广告CTR预估系列(七)--Facebook经典模型LR+GBDT理论与实践 2018年06月13日 16:38:11 轻春阅读数 6004更多分类专栏: 机器学习机器学习荐货情报局版 ...
为什么要用深度学习来做个性化推荐 CTR 预估
欢迎大家前往腾讯云技术社区,获取更多腾讯海量技术实践干货哦~ 作者:苏博览深度学习应该这一两年计算机圈子里最热的一个词了.基于深度学习,工程师们在图像,语音,NLP等领域都取得了令人振奋的进展.而深 ...
CTR预估算法之FM, FFM, DeepFM及实践
https://blog.csdn.net/john_xyz/article/details/78933253 目录目录CTR预估综述Factorization Machines(FM)算法原理代码实 ...
深度学习在CTR预估中的应用
欢迎大家前往腾讯云+社区,获取更多腾讯海量技术实践干货哦~ 本文由鹅厂优文发表于云+社区专栏一.前言二.深度学习模型 1. Factorization-machine(FM) FM = LR+ e ...

随机推荐

SVG和canvas画图，js求数组最大最小值
windows命令行的内容怎么复制,右键选择标记,选中内容后再点击鼠标右键就复制了. 安装Node.js后再用npm install命令会出现如下warn:saveError ENOENT: no s ...
git查看当前分支所属
1.git branch -vv 2.git config --lis
深入java面向对象一：==和equals详解
本文从多篇博客笔记融合而来,系转载,非原创,参考: 1. http://www.cnblogs.com/e241138/archive/2012/09/16/2687981.html 2. htt ...
Roslyn 使用 Directory.Build.props 管理多个项目配置
在一些大项目需要很多独立的仓库来做,每个仓库之间都会有很多相同的配置,本文告诉大家如何通过 Directory.Build.props 管理多个项目配置在我的 MVVM 框架需要三个不同的库,一个是 ...
机器学习——SVM
整理自: https://blog.csdn.net/woaidapaopao/article/details/77806273?locationnum=9&fps=1 带核的SVM为什么能分 ...
Less 语法快速入门
Less 语法快速入门 Less 是一门 CSS 预处理语言其可以运行在 Node 或浏览器端. 它将传统的 css 样式结构单一的排版顺序进行了优化,让我们可以通过层级嵌套的方式将 css 类名与H ...
jquery的offset().top和js的offsetTop的区别，以及jquery的offset().top的实现方法
jquery的offset().top和js的offsetTop的区别,以及jquery的offset().top的实现方法 offset().top是JQ的方法,需要引入JQ才能使用,它获取的是你绑 ...
vue2.x+elelmentUI@3.5 表格
<template> <section> <el-row> <el-col :span="16">  ...
Linux 内核存取配置空间
在驱动已探测到设备后, 它常常需要读或写 3 个地址空间: 内存, 端口, 和配置. 特别地, 存取配置空间对驱动是至关重要的, 因为这是唯一的找到设备被映射到内存和 I/O 空间的位置的方法. 因 ...
Linux 内核存取 I/O 和内存空间
一个 PCI 设备实现直至 6 个 I/O 地址区. 每个区由要么内存要么 I/O 区组成. 大部分设备实现它们的 I/O 寄存器在内存区中, 因为通常它是一个完善的方法(如同在" I/O ...

阿里CTR预估：用户行为长序列建模

阿里CTR预估：用户行为长序列建模的更多相关文章

随机推荐

热门专题