YouTube推荐系统上的深度神经网络
【总结】
在召回模型中,用到的特征比较粗,在训练过程中,目的是训练出一个用户向量u(通过用户本身的浏览和观看信息和统计学信息,假设是N维的),用户向量的用途分两种,线下training和线上serving。训练拟合的是后验概率,在serving中,就直接利用u和训练好的视频向量v,做一个概率计算得到top。
在排序模型中,特征比召回的时候更细一些,除了用到召回模型的特征外,还认为其他候选信息,和视频本身的信息也是有用的,
【模型解读】
A.召回和排序
召回的时候采用用户的历史信息和文档信息;排序的时候不仅采用这些还需要用到视频特征和其他候选信息。
 
B.召回阶段
输入:
用户浏览历史、搜索历史、人口统计学信息concat而成的向量
输出:
分为离线训练和线上。线上直接用视频向量vj和用户向量u来查询N个。在training中,视频向量vj会在softmax中被学习出来,比如一个矩阵W(比如是M*N,M是视频的个数,那么W的第j行就是第j个视频的emb vj,类似CBOW训练词向量的方式)。离线训练softmax输出概率:
 
 
C.排序阶段
输入:
各种特征,其中重要的特征主要来源为:用户或item本身的特征,相似item之间的特征,负反馈特征;
为降低维度,对topn进行emb,其余直接是0向量。
输出:
serving采用指数,训练的时候拟合的是逻辑回归的权重,之所以这么定义是因为该模型的建模目标是期望观看时长,数学说明如下。设有点击的为正样本,无点击的为负样本,正样本需要根据观看时长进行加权,负样本权重为1,所以odds是,k是正样本数量,因为k很小,所以约等于,就是期望观看时长,故逻辑回归的odds就是可以视为是期望观看时长,那么在serving的推理阶段,可以直接采用指数形式,w为神经网络训练参数结果,x是输入的特征,计算得到期望观看的时长。
 
【参考链接】

(论文笔记)Deep Neural Network for YouTube Recommendation的更多相关文章

  1. 论文笔记系列-Neural Network Search :A Survey

    论文笔记系列-Neural Network Search :A Survey 论文 笔记 NAS automl survey review reinforcement learning Bayesia ...

  2. 论文笔记-Deep Affinity Network for Multiple Object Tracking

    作者: ShijieSun, Naveed Akhtar, HuanShengSong, Ajmal Mian, Mubarak Shah 来源: arXiv:1810.11780v1 项目:http ...

  3. Paper Reading:Deep Neural Networks for YouTube Recommendations

    论文:Deep Neural Networks for YouTube Recommendations 发表时间:2016 发表作者:(Google)Paul Covington, Jay Adams ...

  4. 【论文笔记】Malware Detection with Deep Neural Network Using Process Behavior

    [论文笔记]Malware Detection with Deep Neural Network Using Process Behavior 论文基本信息 会议: IEEE(2016 IEEE 40 ...

  5. 论文笔记——A Deep Neural Network Compression Pipeline: Pruning, Quantization, Huffman Encoding

    论文<A Deep Neural Network Compression Pipeline: Pruning, Quantization, Huffman Encoding> Prunin ...

  6. 论文笔记之:Decoupled Deep Neural Network for Semi-supervised Semantic Segmentation

    Decoupled Deep Neural Network for Semi-supervised Semantic Segmentation xx

  7. 论文阅读(XiangBai——【AAAI2017】TextBoxes_A Fast Text Detector with a Single Deep Neural Network)

    XiangBai——[AAAI2017]TextBoxes:A Fast Text Detector with a Single Deep Neural Network 目录 作者和相关链接 方法概括 ...

  8. Deep Learning 28:读论文“Multi Column Deep Neural Network for Traffic Sign Classification”-------MCDNN 简单理解

    读这篇论文“ Multi Column Deep Neural Network for Traffic Sign Classification”是为了更加理解,论文“Multi-column Deep ...

  9. 论文翻译:2022_PACDNN: A phase-aware composite deep neural network for speech enhancement

    论文地址:PACDNN:一种用于语音增强的相位感知复合深度神经网络 引用格式:Hasannezhad M,Yu H,Zhu W P,et al. PACDNN: A phase-aware compo ...

  10. 论文笔记: Deep Learning based Recommender System: A Survey and New Perspectives

    (聊两句,突然记起来以前一个学长说的看论文要能够把论文的亮点挖掘出来,合理的进行概括23333) 传统的推荐系统方法获取的user-item关系并不能获取其中非线性以及非平凡的信息,获取非线性以及非平 ...

随机推荐

  1. java异常信息打印

    如果你不仅想在日志中查看异常信息,也想把异常信息保存起来作为数据查看,那么你可以这样做 public void printException(Exception e) { ByteArrayOutpu ...

  2. 全国IP段列表

    http://ftp.apnic.net/apnic/stats/apnic/delegated-apnic-latest Linux下执行如下命令可将中国大陆ip格式化并导出 wget -c htt ...

  3. Oracle重建索引

    创建表 create table student( student_id number, name varchar2(240) ) tablespace school_data; 创建索引 creat ...

  4. 直接使用Arrays.asList()转数组,转变类型实际为AbstractList

    1.直接将数组转换为list时List的类型为AbstractList public static void main(String[] args) { String[] arr = {"A ...

  5. Hyper-v 安装openwrt

    安装注意事项: 1.只能选一代,网卡可以使用新版2.网卡高级设置,MAC地址欺骗一定要选上,不选外部交换机不能上网.3.防火墙做wan口转发4.防火墙wan口,两个reject改为 accept . ...

  6. ubuntu - 程序运行的一些基础知识

    1.指定编码格式 -finput-charset=GB2312 指定 C 程序的编码方式为 GB2312,不指定时默认编码方式为 UTF-8 -fexec-charset=GB2312 指定 可执行程 ...

  7. [JavaScript]实例化对象

    使用语法结构创建的对象 function Duck(name) { var obj = { name: name, say: function (content) { console.log(cont ...

  8. constexpr和const

    const表示一个变量的值不能改变,这个值可以使运行期间得到的const int sz = get_size(); constexpr是提示编译器,该值可以在编译期间就计算出来,并进行替换,不用等到运 ...

  9. concat()函数

    该函数可以将多个字符串连成一个字符串.使用语法concat(str1, str2, ...)返回结果参数拼接成的字符串,如果有任何一个参数为null,则返回值为null例子1.从person表查出数据 ...

  10. input点击焦点后阴影

    input[type=text]:focus { outline: none; border-color: rgba(82, 168, 236, 0.8); box-shadow:inset 0 1p ...