pytroch 权重初始化和加载词向量的方法

1.几种不同的初始化方法

import torch.nn as nn

embedding = torch.Tensor(3, 5)

#如下6种初始化方法

#正态分布

nn.init.normal_(embedding)

#均匀分布

nn.init.uniform_(embedding)

#凯明均匀分布,mode可为fan_in 或 fan_out, fan_in正向传播时，方差一致;fan_out反向传播时，方差一致;nonlinearity为对应的激活函数

nn.init.kaiming_uniform_(embedding, mode='fan_in', nonlinearity='leaky_relu')

#凯明正态分布,mode可为fan_in 或 fan_out, fan_in正向传播时，方差一致;fan_out反向传播时，方差一致;nonlinearity为对应的激活函数

nn.init.kaiming_normal_(embedding, mode='fan_in', nonlinearity='leaky_relu')

#xavier初始化方法中服从正态分布，mean=0,std = gain * sqrt(2/fan_in + fan_out)

nn.init.xavier_normal_(embedding)

#avier初始化方法中服从均匀分布U(−a,a) ，分布的参数a = gain * sqrt(6/fan_in+fan_out)

nn.init.xavier_uniform_(embedding)

embedding.requires_grad=True

2.加载预训练的词向量1

import torch

import torch.nn as nn

embedding = torch.Tensor(3, 5)

nn.init.xavier_normal_(embedding)

#embedding = Variable(tensor)

data=torch.Tensor([-0.5736, -3.6566,  3.0850,  3.4097,  2.6072])#已有的词向量，

embedding[1, :] = data#data必须是tensor

embedding = nn.Parameter(embedding)#默认是可训练的

print(embedding[1])

3.加载预训练得的词向量2

import torch

import torch.nn as nn

word_embeds = nn.Embedding(vocab_size, embedding_dim)

pretrained_weight = np.array(pretrained_weight)#预训练的词向量

embed.weight.data.copy_(torch.from_numpy(pretrained_weight))

pytroch 权重初始化和加载词向量的方法的更多相关文章

gensim加载词向量文件
# -*- coding: utf-8 -*- # author: huihui # date: 2020/1/31 7:58 下午 ''' 根据语料训练词向量,并保存向量文件 ''' import ...
NLP获取词向量的方法（Glove、n-gram、word2vec、fastText、ELMo 对比分析）
自然语言处理的第一步就是获取词向量,获取词向量的方法总体可以分为两种两种,一个是基于统计方法的,一种是基于语言模型的. 1 Glove - 基于统计方法 Glove是一个典型的基于统计的获取词向量的方 ...
paip.ikanalyzer 重加载词库的方法.
paip.ikanalyzer 重加载词库的方法. 作者Attilax 艾龙, EMAIL:1466519819@qq.com 来源:attilax的专栏地址:http://blog.csdn ...
PowerBuilder学习笔记之删除和加载PBL文件的方法
删除PBL目录的方法:直接点删除键删除加载PBL文件的方法:点Browse按钮选择PBL文件
如何让Android 支持HEIF 图片解码和加载（免费的方法）
字节跳动火山引擎ImageX提供了一种能力,可以支持客户端android 直接解码HEIF 和HEIC图片,经过测试发现,可以免费使用: 一.阅前准备 HEIF图片格式是什么? 高效率图像格式(Hig ...
Jstree在加载时和加载完成的回调方法-sunziren
1.有时候在使用jstree的时候我们想在它加载完成后立刻执行某个方法,于是我们可以用下面这个jstree自带的回调: .on('ready.jstree', function(event, obj) ...
基于word2vec训练词向量(二)
转自:http://www.tensorflownews.com/2018/04/19/word2vec2/ 一.基于Hierarchical Softmax的word2vec模型的缺点上篇说了Hi ...
PyTorch在NLP任务中使用预训练词向量
在使用pytorch或tensorflow等神经网络框架进行nlp任务的处理时,可以通过对应的Embedding层做词向量的处理,更多的时候,使用预训练好的词向量会带来更优的性能.下面分别介绍使用ge ...
Deep Learning In NLP 神经网络与词向量
0. 词向量是什么自然语言理解的问题要转化为机器学习的问题,第一步肯定是要找一种方法把这些符号数学化. NLP 中最直观,也是到目前为止最常用的词表示方法是 One-hot Representati ...

随机推荐

shiro授权、注解式开发
在ShiroUserMapper.xml中新增内容 <select id="getRolesByUserId" resultType="java.lang.Stri ...
prometheus监控tomcat
下载tomcat,wget **;解压tar zxvf **; 下载jmx_exporter, wget https://repo1.maven.org/maven2/io/prometheus/j ...
vscode笔记
一.修改操作栏字体 https://www.cnblogs.com/liuyangfirst/p/9759966.html 1.代码改写,进入默认安装的如下路径,搜索workbench 2.用Vs c ...
201871010113-刘兴瑞《面向对象程序设计（java）》第十五周学习总结
项目内容这个作业属于哪个课程 <任课教师博客主页链接>https://www.cnblogs.com/nwnu-daizh/ 这个作业的要求在哪里 <作业链接地址>http ...
UVA1401 Remember the word DP+Trie
问题描述洛谷(有翻译) 题解 DP,设\(opt_i\)代表前\(i\)个字符方案数. Trie优化,刷表法. \(\mathrm{Code}\) #include<bits/stdc++.h ...
Java四个关键字 this super final static
一.this 关键字主要有三个应用: this调用本类中的属性,也就是类中的成员变量: this调用本类中的其他方法: this调用本类中的其他构造方法初始化对象,调用时要放在构造方法的首行. 引 ...
<Graph> Topological + Undirected Graph 310 Union Find 261 + 323 + （hard）305
310. Minimum Height Trees queue: degree为1的顶点 degree[ i ] : 和 i 顶点关联的边数. 先添加整个图,然后BFS删除每一层degree为1的节 ...
shell 下
一句话来概括shell shell是一个基于Linux内核和应用程序之间的一个解释器 Shell解释器 /bin/sh /bin/bash 目前多用的是bash /sbin/ ...
Sharding-JDBC:垂直拆分怎么做？
经过读写分离的优化后,小王可算是轻松了一段时间,读写分离具体的方案请查看这篇文章: Sharding-JDBC:查询量大如何优化? 可是好景不长,业务发展是在太快了.数据库中的数据量猛增,由于所有表都 ...
Spring提供JdbcTemplate&NamedParameterJdbcTemplate
JdbcTemplate主要提供以下五类方法: execute方法:可以用于执行任何SQL语句,一般用于执行DDL语句: update方法及batchUpdate方法:update方法用于执行新增.修 ...

pytroch 权重初始化和加载词向量的方法

pytroch 权重初始化和加载词向量的方法的更多相关文章

随机推荐

热门专题