tensorflow 在加载大型的embedding模型参数时，会遇到cannot be larger than 2GB

这种问题是，对于每一个变量 variable 由于是基于protobuf存在这大小限制(2G),这个时候，我们需要将embedding拆开，拆分成N等分，来使得每一个

variable都在2G以下;

 # !/usr/bin/env/python

 # coding=utf-8

 import tensorflow as tf

 import numpy as np

 input_ids = tf.placeholder(dtype=tf.int32, shape=[None,None])

 num_shards = 3

 weights = []

 weights_shape = np.arange(27).reshape(9, 3)

 # assert weights_shape[0] % num_shards == 0

 num_shards_len = (weights_shape.shape[0]) / num_shards

 assert  (weights_shape.shape[0]) % num_shards ==0

 begin_ = 0

 ends_ = num_shards_len

 for i in range(0, num_shards):

     if (i + 1) * num_shards_len < weights_shape.shape[0]:

         begin_ = i * num_shards_len

         if i + 1 == num_shards:

             ends_ = weights_shape.shape[0]

         else:

             ends_ = (i + 1) * num_shards_len

     else:

         begin_ = i * num_shards_len

         ends_ = weights_shape.shape[0]

     weights_i = tf.get_variable("words-%02d" % i,

                                 initializer=tf.constant(weights_shape[begin_: ends_, ]))

     weights.append(weights_i)

 input_embedding = tf.nn.embedding_lookup(weights, input_ids,partition_strategy="div")

 sess = tf.InteractiveSession()

 sess.run(tf.global_variables_initializer())

 print(sess.run(weights))

 print(sess.run(input_embedding, feed_dict={input_ids: [[1, 2], [3, 0], [8, 2], [5, 1]]}))

结果为:

[array([[0, 1, 2],

       [3, 4, 5],

       [6, 7, 8]]), array([[ 9, 10, 11],

       [12, 13, 14],

       [15, 16, 17]]), array([[18, 19, 20],

       [21, 22, 23],

       [24, 25, 26]])]

[[[ 3  4  5]

  [ 6  7  8]]

 [[ 9 10 11]

  [ 0  1  2]]

 [[24 25 26]

  [ 6  7  8]]

 [[15 16 17]

  [ 3  4  5]]]

tensorflow 在加载大型的embedding模型参数时，会遇到cannot be larger than 2GB的更多相关文章

Tensorflow同时加载使用多个模型
在Tensorflow中,所有操作对象都包装到相应的Session中的,所以想要使用不同的模型就需要将这些模型加载到不同的Session中并在使用的时候申明是哪个Session,从而避免由于Sessi ...
MFC加载大型osg模型
MFC加载模型,发现打开 Navid 缓冲等选项后,加载大型模型的速度就快了很多. #include "stdafx.h" #include "OSGObject.h&q ...
[CG从零开始] 6. 加载一个柴犬模型学习UV贴图
在第 5 篇文章中,我们成功加载了 fbx 模型,并且做了 MVP 变换,将立方体按照透视投影渲染了出来.但是当时只是随机给顶点颜色,并且默认 fbx 文件里只有一个 mesh,这次我们来加载一个柴犬 ...
"C:\Program Files\Internet Explorer\iexplore.exe" -extoff 无加载项启动IE 浏览器打开时全屏模式
"C:\Program Files\Internet Explorer\iexplore.exe" -extoff 无加载项启动IE浏览器打开时全屏模式
tensorflow数据加载、模型训练及预测
数据集 DNN 依赖于大量的数据.可以收集或生成数据,也可以使用可用的标准数据集.TensorFlow 支持三种主要的读取数据的方法,可以在不同的数据集中使用:本教程中用来训练建立模型的一些数据集介绍 ...
tensorflow学习笔记2：c++程序静态链接tensorflow库加载模型文件
首先需要搞定tensorflow c++库,搜了一遍没有找到现成的包,于是下载tensorflow的源码开始编译: tensorflow的contrib中有一个makefile项目,极大的简化的接下来 ...
用TWaver加载大型游戏场景一例
游戏中经常会出现一些大型的户外场景,例如一个小镇.一座古城等.通常这种场景中包含了较多的建筑.道路.桥梁等等元素,其3D模型比较大且复杂.在使用TWaver加载时,可使用一些技巧,让加载速度更快.显示 ...
tensorflow数据集加载
本篇涉及的内容主要有小型常用的经典数据集的加载步骤,tensorflow提供了如下接口:keras.datasets.tf.data.Dataset.from_tensor_slices(shuffl ...
Windows下pycharm远程连接服务器调试-tensorflow无法加载问题
最近打算在win系统下使用pycharm开发程序,并远程连接服务器调试程序,其中在import tensorflow时报错如图所示(在远程服务器中执行程序正常): 直观错误为: ImportError ...

随机推荐

python 操作mongo
1. 导包: import pymongo 2. 建立连接 client = pymongo.MongoClient("127.0.0.1",27017) 3. 获取数据库 db ...
php mysql 编码问题
php mysql 编码问题问题: PHP从数据库中读取数据,并echo出来,数据中文显示正常:但是echo出新定义的中文字符串,新定义的字符串会乱码. 由此可能是数据库中提取出来的中文编码和php ...
[CC-SEAPERM2]Sereja and Permutations
[CC-SEAPERM2]Sereja and Permutations 题目大意: 有一个$n(n\le300)$排列$p$,将其中一个元素$p_i$拿掉,然后将原来大于$p_i$的 ...
工程管理之makefile与自动创建makefile文件过程
(风雪之隅 http://www.laruence.com/2009/11/18/1154.html) Linux Makefile自动编译和链接使用的环境想知道到Linux Makefile系统的 ...
[P3957][NOIP2017]跳房子 (DP+二分/队列？)
看到GREED_VI大佬在打这题我这个蒟蒻偷偷看一眼洛谷上目前普及难度里最难的一题题目还是能看懂的,不想道路游戏那题,我完全不知道题目是什么意思…… GREED_VI大佬第一次用的是二分的思想,于 ...
通过xml处理sql语句时对小于号与大于号的处理转换
以上方法,很容易使用,直接ss < #{ss} 法二 <![CDATA[>=]]>表示大于等于变量<![CDATA[ < ]]>#{变量}表示 ...
array中key所对应的value
获取数组中的键对应的值 class Test{ public function index(){ $info = array( 'name' => 'daicr', 'age' => 24 ...
学习Struts--Chap05:值栈和OGNL
1.值栈的介绍 1.1 值栈的介绍: 值栈是对应每一个请求对象的数据存储中心,struts2会给每一个请求对象创建一个值栈,我们大多数情况下不需要考虑值栈在哪里,里面有什么,只需要去获取自己需要的数据 ...
quick Cocos 2dx 学习网站
http://quick.cocoachina.com/wiki/doku.php?id=zh_cn http://www.cocoachina.com/ http://www.cocoachina. ...
Linux 压缩解压缩
先直接给出各种解压缩命令 .tar 压缩:tar cvf FileName.tar FileName 解压:tar xvf FileName.tar ------------------------- ...

tensorflow 在加载大型的embedding模型参数时，会遇到cannot be larger than 2GB

tensorflow 在加载大型的embedding模型参数时，会遇到cannot be larger than 2GB的更多相关文章

随机推荐

热门专题