embedding models 是什么
embedding models 是一类机器学习模型,它们的核心功能是将高维、离散的输入数据(如词汇、类别标签、节点或实体)映射到低维、连续的向量空间中。
这些向量(即 embeddings)通常具有丰富的语义信息,并能够捕捉原始数据之间的潜在关系和相似度。以下是对 embedding models 的详细说明:
1.目的与应用场景:
降维与表征学习:Embedding models 主要用于学习从原始数据到低维向量的有效映射,降低数据维度,便于后续计算和分析。这些低维向量保留了原始数据的关键特征和结构信息。
自然语言处理 (NLP):在 NLP 中,最经典的 embedding model 是词嵌入(Word Embeddings),如 Word2Vec、GloVe 和 FastText,它们将词语映射到实数向量,使得语义相近的词在向量空间中距离较近,用于文本分类、情感分析、机器翻译等任务。
推荐系统:用户和物品的嵌入模型用于捕获用户兴趣和物品属性的相似性,常用于个性化推荐、协同过滤等场景。
知识图谱:实体和关系嵌入(如 TransE、DistMult、RotatE)将知识图谱中的节点和边表示为向量,用于链接预测、实体对齐、推理等任务。
计算机视觉:图像特征嵌入用于提取图像的紧凑表示,用于图像检索、相似性比较、分类等任务。
2.学习方法:
无监督学习:许多早期的 embedding models 采用无监督学习方式,如基于神经网络的语言模型(Word2Vec的CBOW和Skip-gram模型)或全局词频统计(GloVe),通过最大化词语上下文的预测准确性或捕获全局共现信息来学习词嵌入。
有监督学习:在特定任务(如情感分析、命名实体识别)上训练的深度学习模型(如 BERT、ELMo、GPT),其词嵌入层作为预训练模型的一部分,可在下游任务中微调,实现有监督的embedding学习。
自监督学习:近期的一些模型(如 SimCLR、Momentum Contrastive Learning)利用数据增强和对比学习策略在无标签数据上学习高质量的图像或文本嵌入。
3.模型架构与训练:
神经网络架构:embedding models 常基于简单的前馈神经网络(如 Word2Vec)、复杂深度神经网络(如 BERT)或专门设计的图神经网络(如 GraphSAGE、Graph Attention Network)。
损失函数:根据学习目标,可能使用负采样损失(如 Word2Vec)、最大似然估计(如 GloVe)、三元组损失(如知识图谱嵌入)、对比学习损失(如 SimCLR)等。
训练数据:可以是纯文本语料库、用户-物品交互记录、知识图谱数据、图像数据集等。
4.应用与使用:
直接使用预训练模型:在很多情况下,可以直接使用已训练好的、针对通用任务的 embedding 模型,如使用预训练的 Word2Vec 或 GloVe 向量作为文本特征。
微调或适应特定领域:根据实际需求,可以在特定领域数据上对预训练模型进行微调,或者使用迁移学习策略调整现有模型以适应新的语境或任务。
嵌入向量操作:在下游任务中,嵌入向量可以进行加法、减法、点积、余弦相似度计算等操作,以利用其表征的语义信息。
总之,embedding models 是一种广泛应用于各类机器学习任务的技术,通过将复杂、离散的数据转化为低维、连续的向量表示,有效地捕捉数据间的语义关系,提升模型性能和泛化能力。这些模型在 NLP、推荐系统、知识图谱推理、计算机视觉等领域均有广泛应用。
Link:https://www.cnblogs.com/farwish/p/18127206
embedding models 是什么的更多相关文章
- 论文阅读 Predicting Dynamic Embedding Trajectory in Temporal Interaction Networks
6 Predicting Dynamic Embedding Trajectory in Temporal Interaction Networks link:https://arxiv.org/ab ...
- 全网最详细中英文ChatGPT接口文档(四)30分钟快速入门ChatGPT——Models模型
@ 目录 Models Overview 概述 GPT-4 Limited beta GPT-3.5 Feature-specific models 特定功能的模型 Finding the right ...
- 翻译 | Improving Distributional Similarity with Lessons Learned from Word Embeddings
翻译 | Improving Distributional Similarity with Lessons Learned from Word Embeddings 叶娜老师说:"读懂论文的 ...
- (转)Extracting knowledge from knowledge graphs using Facebook Pytorch BigGraph.
Extracting knowledge from knowledge graphs using Facebook Pytorch BigGraph 2019-04-27 09:33:58 This ...
- 【NLP】How to Generate Embeddings?
How to represent words. 0 . Native represtation: one-hot vectors Demision: |all words| (too large an ...
- [转]NLP Tasks
Natural Language Processing Tasks and Selected References I've been working on several natural langu ...
- ICLR 2013 International Conference on Learning Representations深度学习论文papers
ICLR 2013 International Conference on Learning Representations May 02 - 04, 2013, Scottsdale, Arizon ...
- IJCAI 2019 Analysis
IJCAI 2019 Analysis 检索不到论文的关键词:retrofitting word embedding Getting in Shape: Word Embedding SubSpace ...
- basic deepwalk
Get to know How deepwalk works by this project. Two steps: 1. gen the graph, and gen the corpus on t ...
- [CVPR2017] Visual Translation Embedding Network for Visual Relation Detection 论文笔记
http://www.ee.columbia.edu/ln/dvmm/publications/17/zhang2017visual.pdf Visual Translation Embedding ...
随机推荐
- python面向对象(绑定方法与非绑定方法)
# 一.绑定方法:特殊之处在于将调用者本身当做第一个参数自动传入 # 1)绑定给对象的方法:调用者是对象,自动传入的是对象 # 2)绑定给类的方法:调用者是类,自动传入的是类 # 类方法的应用 # 需 ...
- 前端开源项目UIRecorder录制脚本遇到的一些问题
D:\nodejs\node_global>uirecorder init __ ______ ____ __ / / / / _/ / __ \___ _________ _________/ ...
- 记录--你不知道的Js高级方法
这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助 前言 在Js中有一些比较冷门但是非常好用的方法,我在这里称之为高级方法,这些方法没有被广泛使用或多或少是因为存在一些兼容性的问题,不是所有 ...
- 记录--六道题理解Vue2 和 Vue3 的响应式原理比对
这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助 前言 技术栈是 Vue 的同学,在面试中难免会被问到 Vue2 和 Vue3 的相关知识点的实现原理和比较,面试官是步步紧逼,一环扣一环. ...
- 神经网络——基于sklearn的参数介绍及应用
一.MLPClassifier&MLPRegressor参数和方法 参数说明(分类和回归参数一致): hidden_layer_sizes :例如hidden_layer_sizes=(50, ...
- 聊聊ShareGPT格式的微调数据集
转载请注明住处:https://www.cnblogs.com/zhiyong-ITNote 概述 ShareGPT格式的数据集中,一般是如下格式: [ { "conversations&q ...
- 解决maven编译错误:程序包com.sun.xml.internal.ws.spi不存在
转自https://blog.csdn.net/mn960mn/article/details/51253038 解决方法如下: 添加maven-compiler-plugin插件,并且配置compi ...
- PostgreSQL与Java JDBC数据类型对照 源码
文件:postgresql-42.2.12.jar 类名:org.postgresql.jdbc.TypeInfoCache // basic pg types info: // 0 - type n ...
- Java内存马1-传统web内存马
1.前置知识 (1)Tomcat Tomcat是一个开源的.轻量级的.用于Java Servlet和JavaServer Pages(JSP)的Web应用程序服务器.它是Apache软件基金会的一个项 ...
- KingbaseES Json 系列七:Json记录操作函数二
KingbaseES Json 系列七--Json记录操作函数二(JSONB_POPULATE_RECORD,JSONB_POPULATE_RECORDSET,JSON_POPULATE_RECORD ...