17、Learning and Transferring IDs Representation in E-commerce笔记
一、摘要
电子商务场景:主要组成部分(用户ID、商品ID、产品ID、商店ID、品牌ID、类别ID等)
传统的编码两个缺陷:如onehot,(1)存在稀疏性问题,维度高(2)不能反映关系,以两个不同的id为例,无论它们是否相似,两种id都具有由一个热编码测量的恒定距离。以条目ID和存储ID为例,由于它们位于不同的空间,它们之间的关系甚至无法度量。
这些IDs中,可以是同质也可以是异质的。
本文提出了一个基于嵌入的框架来学习和传输ID的表示。
1、作为用户的隐式反馈,易从交互session中收集大量的项目ID序列。
2、通过联合实验这些信息序列和IDs之间的结构连接,所有类型的IDs可以嵌入到一个低维语义空间中。
3、学习到的embedding表示可在四个场景中被利用和转移:(1)测量项目之间的相似性(2)从已知的项目转移到未知的项目(3)转移跨不同领域(4)跨不同应用场景转移
二、引言
NLP:如单词嵌入(Word2vec),将单词嵌入到低维表示中,以捕获单词之间的语法与语义关系。
item2vec通过对交互序列中的项目ID共现进行建模,将项目ID嵌入到低维表示中。
本文扩展了item2vec,并提出了一个基于嵌入的框架来学习和传输所有类型id的低维表示。除了用户的隐式反馈之外,本文还考虑了项目ID和其他类型ID之间的结构连接(如图1)。
- 衡量项目之间的相似性。
- 从已看到的项目转移到未看到的项目。(冷启动,这意味着没有历史记录的项目ID对推荐系统是不可见的。)
- 跨域传输。对于像盒马这样的新兴平台,很高比例的用户是新客户,因此个性化推荐是非常具有挑战性的。在我们的方法中,用户id的嵌入向量是通过聚合项id的嵌入向量来构造的。我们将看到这些向量可以从像淘宝这样的长期存在的平台上转移到新兴的平台上。
三、盒马平台背景
在传统的推荐框架中,点击率(CTR)是在用户和项目之间计算的。但是,由于用户项对太多,因此无法计算和存储所有用户和所有项之间的CTR分数。在本文的工作中,建议框架分为四个过程来克服这一挑战:
•准备。离线计算用户触发偏好得分(u2t)和触发项匹配得分(t2i),并将结果存储在密钥值数据库中,以实现高效的在线检索。
•匹配。对于每个用户访问,首先根据用户ID检索触发器,然后基于这些触发器获得推荐项的候选集。
•过滤。删除重复和无效的项目,如已售完的项目等。
•排名。根据综合得分对筛选出的项目进行排序,综合得分考虑了偏好得分、匹配得分和其他业务目标。
四、学习ID的表征方式
1、Skip-gram on User’s Interactive Sequences
17、Learning and Transferring IDs Representation in E-commerce笔记的更多相关文章
- 阅读记录:Learning multiple layers of representation(杂乱笔记)
典型的浅层学习结构: 传统隐马尔可夫模型(HMM).条件随机场 (CRFs).最大熵模型(Maxent).支持向量机(SVM).核回归及仅含单隐层的多层感知器(MLP)等. 局部表示,分布式表示和稀疏 ...
- 论文解读(S^3-CL)《Structural and Semantic Contrastive Learning for Self-supervised Node Representation Learning》
论文信息 论文标题:Structural and Semantic Contrastive Learning for Self-supervised Node Representation Learn ...
- Deep Reinforcement Learning for Visual Object Tracking in Videos 论文笔记
Deep Reinforcement Learning for Visual Object Tracking in Videos 论文笔记 arXiv 摘要:本文提出了一种 DRL 算法进行单目标跟踪 ...
- Learning ROS for Robotics Programming Second Edition学习笔记(六) indigo xtion pro live
中文译著已经出版,详情请参考:http://blog.csdn.net/ZhangRelay/article/category/6506865 Learning ROS for Robotics Pr ...
- Learning ROS for Robotics Programming Second Edition学习笔记(五) indigo computer vision
中文译著已经出版,详情请参考:http://blog.csdn.net/ZhangRelay/article/category/6506865 Learning ROS for Robotics Pr ...
- Learning ROS for Robotics Programming Second Edition学习笔记(四) indigo devices
中文译著已经出版,详情请参考:http://blog.csdn.net/ZhangRelay/article/category/6506865 Learning ROS for Robotics Pr ...
- Learning ROS for Robotics Programming Second Edition学习笔记(三) 补充 hector_slam
中文译著已经出版,详情请参考:http://blog.csdn.net/ZhangRelay/article/category/6506865 Learning ROS for Robotics Pr ...
- Learning ROS for Robotics Programming Second Edition学习笔记(三) indigo rplidar rviz slam
中文译著已经出版,详情请参考:http://blog.csdn.net/ZhangRelay/article/category/6506865 Learning ROS for Robotics Pr ...
- Learning ROS for Robotics Programming Second Edition学习笔记(二) indigo tools
中文译著已经出版,详情请参考:http://blog.csdn.net/ZhangRelay/article/category/6506865 Learning ROS for Robotics Pr ...
随机推荐
- 最常见的Java面试题及答案汇总(四)
反射 57. 什么是反射? 反射主要是指程序可以访问.检测和修改它本身状态或行为的一种能力 Java反射: 在Java运行时环境中,对于任意一个类,能否知道这个类有哪些属性和方法?对于任意一个对象,能 ...
- Blazor 机制初探以及什么是前后端分离,还不赶紧上车?
标签: Blazor .Net 上一篇文章发了一个 BlazAdmin 的尝鲜版,这一次主要聊聊 Blazor 是如何做到用 C# 来写前端的,传送门:https://www.cnblogs.com/ ...
- 前端与编译原理 用js去运行js代码 js2run
# 前端与编译原理 用js去运行js代码 js2run 前端与编译原理似乎相隔甚远,各种热门的框架都学不过来,那能顾及到这么多底层呢,前端开发者们似乎对编译原理的影响仅仅是"抽象语法树&qu ...
- 前端与算法 leetcode 189. 旋转数组
目录 # 前端与算法 leetcode 189. 旋转数组 题目描述 概要 提示 解析 算法 # 前端与算法 leetcode 189. 旋转数组 题目描述 189. 旋转数组 概要 把他当做一到简单 ...
- JVM的基本结构和JVM的内存结构
这里概要介绍一下JVM在启动后,作为操作系统的一个进程的基本结构,以及从操作系统角度看,JVM如何管理它从操作系统里申请来的内存的,也就是JVM的内存结构或者叫JVM内存模型. 1.JVM的基本结构 ...
- 027 SSM综合练习03--数据后台管理系统--product-list.jsp和main.jsp页面制作
1.product-list.jsp页面制作 (1)创建一个product-list1.jsp文件,清空,只保留 <%@ page contentType="text/html;cha ...
- SQL Server 中的窗口函数(2012 新函数)
简介 SQL Server 2012之后对窗口函数进行了极大的加强,但对于很多开发人员来说,对窗口函数却不甚了解,导致了这样强大的功能被浪费,因此本篇文章主要谈一谈SQL Server中窗口函数的概念 ...
- Vim 入门
Vim 简介 打开 Vim的四种模式 一些命令 插入 移动 文件 编辑 环境设置 .vimrc 更多命令 环境设置 折叠 显示 Vim 简介 Vim 是字符模式下的一种文本编辑器,不需要图形界面,它是 ...
- Mac Mini(late 2014) 添加NVMe固态组Fusion Drive
我买的是Mac Mini(late 2014)中配,内置5400转1T机械硬盘,该配置即使到了2019年安装macOS Mojave系统依旧是够用的,但硬盘严重拖累了运行的速度.之前考虑到更换内置sa ...
- [python 2.x] xml.etree.ElementTree module
XML 文件:xmlparse.xml <?xml version="1.0" encoding="UTF-8" standalone="no& ...