（原）tensorflow中函数执行完毕，显存不自动释放

转载请注明出处：

http://www.cnblogs.com/darkknightzh/p/7608916.html

参考网址：

https://stackoverflow.com/questions/39758094/clearing-tensorflow-gpu-memory-after-model-execution

https://github.com/tensorflow/tensorflow/issues/1727#issuecomment-285815312s

tensorflow中，在一个函数内配置完GPU，tf分配了显存，等函数执行完，显存不会释放（貌似torch7中也一样。。。）。第二个参考网址指出：

As for the original problem, currently the Allocator in the GPUDevice belongs to the ProcessState, which is essentially a global singleton. The first session using GPU initializes it, and frees itself when the process shuts down. Even if a second session chooses a different GPUOptions, it would not take effect.

第一个session对GPU初始化后，即便释放了显存，第二个sess使用不同的GPU选项来初始化GPU，也不会起效。

第一个网址Oli Blum指出，use processes and shut them down after the computation才能释放显存。具体代码如下（可以参考第一个网址）：

 import tensorflow as tf

 import multiprocessing

 import numpy as np

 def run_tensorflow():

     n_input = 10000

     n_classes = 1000

     # Create model

     def multilayer_perceptron(x, weight):

         # Hidden layer with RELU activation

         layer_1 = tf.matmul(x, weight)

         return layer_1

     # Store layers weight & bias

     weights = tf.Variable(tf.random_normal([n_input, n_classes]))

     x = tf.placeholder("float", [None, n_input])

     y = tf.placeholder("float", [None, n_classes])

     pred = multilayer_perceptron(x, weights)

     cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(logits=pred, labels=y))

     optimizer = tf.train.AdamOptimizer(learning_rate=0.001).minimize(cost)

     init = tf.global_variables_initializer()

     with tf.Session() as sess:

         sess.run(init)

         for i in range(100):

             batch_x = np.random.rand(10, 10000)

             batch_y = np.random.rand(10, 1000)

             sess.run([optimizer, cost], feed_dict={x: batch_x, y: batch_y})

     print "finished doing stuff with tensorflow!"

 if __name__ == "__main__":

     # option 1: execute code with extra process

     p = multiprocessing.Process(target=run_tensorflow)

     p.start()

     p.join()

     # wait until user presses enter key

     raw_input()

     # option 2: just execute the function

     run_tensorflow()

     # wait until user presses enter key

     raw_input()

使用multiprocessing.Process运行run_tensorflow后，显存会自动释放，但是如果直接执行run_tensorflow，显存不会自动释放。当然，该函数计算量较小，如果显卡太好，可能看不到运行multiprocessing.Process后，显存分配、计算并释放的过程，感觉就像没有运行一样。。。

（原）tensorflow中函数执行完毕，显存不自动释放的更多相关文章

Tensorflow与Keras自适应使用显存
Tensorflow支持基于cuda内核与cudnn的GPU加速,Keras出现较晚,为Tensorflow的高层框架,由于Keras使用的方便性与很好的延展性,之后更是作为Tensorflow的官方 ...
TensorFlow，Keras限制GPU显存
运行TensorFlow程序会占用过多的显卡比例,多人共同使用GPU的时候,会造成后面的人无法运行程序. 一.TensorFlow 1.预加载比例限制 tf_config = tensorflow.C ...
JS中函数执行顺序的问题？
作者:知乎用户链接:https://www.zhihu.com/question/23564807/answer/82996422来源:知乎著作权归作者所有.商业转载请联系作者获得授权,非商业转载请注 ...
mvc项目中Controller执行完毕重定向到html的一个页面中
String ip = request.getLocalAddr(); //取得服务器IP int port = request.getLocalPort(); //取得服务器端口 String ur ...
深度学习中GPU和显存分析
刚入门深度学习时,没有显存的概念,后来在实验中才渐渐建立了这个意识. 下面这篇文章很好的对GPU和显存总结了一番,于是我转载了过来. 作者:陈云链接:https://zhuanlan.zhihu. ...
[Pytorch]深度模型的显存计算以及优化
原文链接:https://oldpan.me/archives/how-to-calculate-gpu-memory 前言亲,显存炸了,你的显卡快冒烟了! torch.FatalError: cu ...
解决GPU显存未释放问题
前言今早我想用多块GPU测试模型,于是就用了PyTorch里的torch.nn.parallel.DistributedDataParallel来支持用多块GPU的同时使用(下面简称其为Dist). ...
如何理解javaSript中函数的参数是按值传递
本文是我基于红宝书<Javascript高级程序设计>中的第四章,4.1.3传递参数小节P70,进一步理解javaSript中函数的参数,当传递的参数是对象时的传递方式. (结合资料的个人 ...
main函数执行前、后再执行的代码
一.main结束不代表整个进程结束 (1)全局对象的构造函数会在main 函数之前执行, 全局对象的析构函数会在main函数之后执行: 用atexit注册的函数 ...

随机推荐

c#以POST方式模拟提交表单
这是我一年前写的一个用C#模拟以POST方式提交表单的代码,现在记录在下面,以免忘记咯.那时候刚学C#~忽忽..很生疏..代码看上去也很幼稚臃肿不堪 #region 内容添加函数(Contentin ...
JSTL fn:contains()函数
fn:contains() 函数判断一个输入字符串是否包含一个指定的子串. 语法使用 fn:contains() 函数具有以下语法: boolean contains(java.lang.Strin ...
Android推送分析
cpu多核利用能够实现Android推送的吞吐量. 讲明白这点,我们需要了解Android推送的基本原理了.如果实现C(客户端)与server(客户端)实时通讯了.这里有两种思路了: 1.一种是定时 ...
Python机器学习实践与Kaggle实战（转）
https://mlnote.wordpress.com/2015/12/16/python%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E5%AE%9E%E8%B7%B5 ...
java 流媒体服务器Red5 FQA
原文链接:http://www.cnblogs.com/zhuzhao/archive/2008/08/12/1265661.html red5 FQA red5 FQA 引自:http://hi ...
[Docker] Converting from Docker Compose to Kubernetes
kompose is a tool to help users who are familiar with docker-compose move to Kubernetes. kompose tak ...
js文件流下载通用方法
通常我们会用到文件流下载文件,下面给大家一个通用的文件流下载的js /* *下载文件 * options:{ * url:'', //下载地址 * isNewWinOpen:false,是否新窗口打开 ...
C语言编程流程
大家都知道,写程序大体步骤为:1.用编辑器编写源代码,如.c文件.2.用编译器编译代码生成目标文件,如.o.3.用链接器连接目标代码生成可执行文件,如.exe.但如果源文件太多,一个一个编译时就会特 ...
PHP的异常以及异常存在的意义
php的try catch与其它语言的try catch相比有许多不同,而且用起来相对比较不爽. php中,如果你制作的站点相对较大,同时模块化,并且在错误处理机制上有一套自己的处理机制,可以尝试使用 ...
ZH奶酪：PHP (爬虫)下载图片
原文地址:http://www.phpfensi.com/php/20140107/1128.html 通过图片地地址把图片保存到本址,这里我们直接通过readfile读取然后通过fopen保存即可, ...

（原）tensorflow中函数执行完毕，显存不自动释放

（原）tensorflow中函数执行完毕，显存不自动释放的更多相关文章

随机推荐

热门专题