6、TensorFlow基础（四）队列和线程

队列和线程

　　和 TensorFlow 中的其他组件一样，队列（queue）本身也是图中的一个节点，是一种有状态的节点，其他节点，如入队节点（enqueue）和出队节点（dequeue），可以修改它的内容。例如，入队节点可以把新元素插到队列末尾，出队节点可以把队列前面的元素删除。本节主要介绍队列、队列管理器、线程和协调器的有关知识。

1、队列：

　　TensorFlow 中主要有两种队列，即 FIFOQueue 和 RandomShuffleQueue，它们的源代码实现在 tensorflow-1.1.0/tensorflow/python/ops/data_flow_ops.py 中。

　　（1）、FIFOQueue

　　　FIFOQueue创建一个先入先出队列。列如，我们在训练一些语音、文字样本时，使用循环神经网络的网络结构，希望读入的训练样本是有序的，就要用FIFOQUEUE。

　　我们行创建一个含有队列的图：

 # -*- coding: UTF-8 -*-

 # date:2018/6/22

 # User:WangHong

 import tensorflow as tf

 #创建一个先入先出的队列，初始化队列插入0.1,0.2,0.3三个数字

 q = tf.FIFOQueue(3,'float')

 init = q.enqueue_many(([0.1,0.2,0.3],))

 #定义出队、+1、入队操作

 x =q.dequeue()

 y = x+1

 q_inc = q.enqueue([y])

 #然后开启一个会话，执行2次q_inc操作，随后查看队列内容。

 with tf.Session() as sess:

     sess.run(init)

     quelen = sess.run(q.size())

     for i in range(2):

         sess.run(q_inc)#执行2次操作，队列中的值变为0.3,1.1,1.2

     quelen = sess.run(q.size())

     for i in range(quelen):

         print(sess.run(q.dequeue()))#输出队列的值

结果：

　　（2）、RandomShuffleQueue

　　　　RandomShuffleQueue创建一个随机队列，在出队列时，是以随机的顺序产生元素的，例如，我们在训练一些图像样本是，使用CNN的网络结构，希望。可以无序的读入训练样本，就要用RandomShuffleQueue，每次随机产生一个训练样本。

　　　　RandomShuffleQueue在在TensorFlow使用异步计算时很重要。因为TensorFlow的会话是支持多线程的，我们可以在主线程里执行训练操作，使用RandomShuffleQueue作为训练输入，开多线程来准备训练样本，将样本压入队列后，主线性会从线程中每次取出mini-batch的样本进行训练。

例子;

 # -*- coding: UTF-8 -*-

 # date:2018/6/22

 # User:WangHong

 import tensorflow as tf

 q = tf.RandomShuffleQueue(capacity=10,min_after_dequeue=2,dtypes = 'float')

 #然后开启一个会话

 sess = tf.Session()

 for i in range(0,10):#10次入队

     sess.run(q.enqueue(i))

 for i in range(0,8):#8次出队

     print(sess.run(q.dequeue()))

结果：发现结果是乱序

我们尝试修改入队次数为 12 次，再运行，发现程序阻断不动，或者我们尝试修改出队此
时为 10 次，即不保留队列最小长度，发现队列输出 8 次结果后，在终端仍然阻断了。

阻断一般发生在：
● 队列长度等于最小值，执行出队操作；
● 队列长度等于最大值，执行入队操作。

　　上面的例子都是在会话的主线程中进行入队操作。当数据量很大时，入队操作从硬盘中读
取数据，放入内存中，主线程需要等待入队操作完成，才能进行训练操作。会话中可以运行多
个线程，我们使用线程管理器 QueueRunner 创建一系列的新线程进行入队操作，让主线程继续
使用数据，即训练网络和读取数据是异步的，主线程在训练网络，另一个线程在将数据从硬盘
读入内存。

2、队列管理器

　　创建一个含有队列的图:

 # -*- coding: UTF-8 -*-

 # date:2018/6/22

 # User:WangHong

 import tensorflow as tf

 q = tf.FIFOQueue(1000,'float')

 counter = tf.Variable(0.0)#计数器

 increment_op = tf.assign_add(counter,tf.constant(1.0))#操作给计数器加一

 enqueue_op = q.enqueue(counter)#操作;计数器值加入队列

 #创建UI个队列计数器QueueRunner，用这两个操作向队列q添加元素。目前使用一个线程

 qr = tf.train.QueueRunner(q,enqueue_ops=[increment_op,enqueue_op]*1)

 #启动一个会话，从队列管理器qr中创建线程：

 #主线程

 with tf.Session() as sess:

     sess.run(tf.global_variables_initializer())

     enqueue_threads = qr.create_threads(sess,start=True)#启动入队线程

     for i in range(10):

         print(sess.run(q.dequeue()))

结果：

　　不是我们期待的自然数列，并且线程被阻断。这是因为加 1 操作和入队操作不同步，可能
加 1 操作执行了很多次之后，才会进行一次入队操作。另外，因为主线程的训练（出队操作）
和读取数据的线程的训练（入队操作）是异步的，主线程会一直等待数据送入。

　　QueueRunner 有一个问题就是：入队线程自顾自地执行，在需要的出队操作完成之后，程
序没法结束。这样就要使用 tf.train.Coordinator 来实现线程间的同步，终止其他线程。

3、线程协调器

 # -*- coding: UTF-8 -*-

 # date:2018/6/22

 # User:WangHong

 import tensorflow as tf

 q = tf.FIFOQueue(1000,'float')

 counter = tf.Variable(0.0)#计数器

 increment_op = tf.assign_add(counter,tf.constant(1.0))#操作给计数器加一

 enqueue_op = q.enqueue(counter)#操作;计数器值加入队列

 #创建UI个队列计数器QueueRunner，用这两个操作向队列q添加元素。目前使用一个线程

 qr = tf.train.QueueRunner(q,enqueue_ops=[increment_op,enqueue_op]*1)

 #启动一个会话，从队列管理器qr中创建线程：

 #主线程

 with tf.Session() as sess:

     sess.run(tf.global_variables_initializer())

     coord = tf.train.Coordinator()

     enqueue_threads = qr.create_threads(sess,start=True)#启动入队线程

     coord.request_stop()  # 通知其他线程关闭

     for i in range(10):

         try:

             print(sess.run(q.dequeue()))

         except tf.errors.OutOfRangeError:

             break

     coord.join(enqueue_threads)#join操作等待其他线程结束，其他所有线程关闭之后，这一函数才能返回

所有队列管理器被默认加在图的 tf.GraphKeys.QUEUE_RUNNERS 集合中。

6、TensorFlow基础（四）队列和线程的更多相关文章

python队列、线程、进程、协程
目录: 一.queue 二.线程基本使用线程锁自定义线程池生产者消费者模型(队列) 三.进程基本使用进程锁进程数据共享默认数据不共享 queues array Manager.dict ...
python队列、线程、进程、协程(转)
原文地址: http://www.cnblogs.com/wangqiaomei/p/5682669.html 一.queue 二.线程 #基本使用 #线程锁 #自定义线程池 #生产者消费者模型(队列 ...
四种Java线程池用法解析
本文为大家分析四种Java线程池用法,供大家参考,具体内容如下 http://www.jb51.net/article/81843.htm 1.new Thread的弊端执行一个异步任务你还只是如下 ...
MIT 2012分布式课程基础源码解析-线程池实现
主要内容 ScopedLock 队列实现线程池实现在正式讲解线程池实现之前,先讲解两个有用的工具类: ScopedLock fifo队列 ScopedLock: ScopedLock是局域锁的实现 ...
Android系统--输入系统（十四）Dispatcher线程情景分析_dispatch前处理
Android系统--输入系统(十四)Dispatcher线程情景分析_dispatch前处理 1. 回顾我们知道Android输入系统是Reader线程通过驱动程序得到上报的输入事件,还要经过处理 ...
（四）juc线程高级特性——线程池 / 线程调度 / ForkJoinPool
13. 线程池第四种获取线程的方法:线程池,一个 ExecutorService,它使用可能的几个池线程之一执行每个提交的任务,通常使用 Executors 工厂方法配置. 线程池可以解决两个不同问 ...
“全栈2019”Java多线程第十四章：线程与堆栈详解
难度初级学习时间 10分钟适合人群零基础开发语言 Java 开发环境 JDK v11 IntelliJ IDEA v2018.3 文章原文链接 "全栈2019"Java多 ...
【Java并发】并发队列与线程池
并发队列阻塞队列与非阻塞队 ConcurrentLinkedQueue BlockingQueue ArrayBlockingQueue LinkedBlockingQueue PriorityBl ...
【CUDA 基础】5.6 线程束洗牌指令
title: [CUDA 基础]5.6 线程束洗牌指令 categories: - CUDA - Freshman tags: - 线程束洗牌指令 toc: true date: 2018-06-06 ...

随机推荐

java消息中间件的使用与简介
一.为什么要使用消息中间件消息中间件就是可以省去繁琐的步骤,直达目的,怎么讲呢,就是比如你想很多人,知道你的动态,而知道的人可能手机没电,可能手机信号不好,可能手机不在服务区,或者看的人比较忙,看的 ...
The left-hand side of an assignment must be a variable,代码中使用了中文的字符
进行ajax测试,报这个错误,代码检测无误,然后就是查了相关文档发现是符号错误,eclipse识别中文符号,就会报这个错误,而且eclipse的js里需要写冒号结尾,附个代码. <body&g ...
jsp中路径的写法
在JavaWeb开发中,常使用绝对路径的方式来引入JavaScript和CSS文件,这样可以避免因为目录变动导致引入文件找不到的情况代码” ${pageContext.request.context ...
不写代码也能爬虫Web Scraper
https://www.jianshu.com/p/d0a730464e0c web scraper中文网 http://www.iwebscraper.com/category/%E6%95%99% ...
centos升级gcc
https://blog.csdn.net/lanwilliam/article/details/77893033 [root@DS-VM-Node239 ~]# yum install centos ...
ASP.NET MVC5实现伪静态
目录 1.什么是伪静态?为什么要实现伪静态? 2.实现APS.NET MVC伪静态的方式有哪些? 3.那么如何实现使用ASP.NET MVC5的伪静态呢? (1)在路由注册中启用特性路由 (2)为需要 ...
关于EF的一点小记录
今日新闻:朝鲜要改革开放了!!!比你牛逼的人都在努力,你还有理由懒惰吗? 宇宙强大IDE配套的EF问题记录今天做数据添加时,Id我设置为int类型了,结果在做Add操作时报的错让我摸不着头脑,后来问 ...
ASP.NET MVC学习目录
一.ASP.NET MVC原理详解 1.了解MVC架构模式 3.学习ASP.NET MVC的必备语言知识 4.MVC中的razor语法详解 5.ASP.NET MVC路由系统机制详细讲解 6.ASP. ...
C#基础笔记(第二十二天)
1.单例模式1)将构造函数私有化2)提供一个静态方法,返回一个对象3)创建一个单例 2.XML可扩展的标记语言 HTMLXML:存储数据不是单独.net的东西,是一个单独的,JAVA什么的都也用不需 ...
CSS文字大小单位PX、EM的区别
◆px像素(Pixel)是相对长度单位,像素px是相对于显示器屏幕分辨率而言的.(引自CSS2.0手册)◆em是相对长度单位,相对于当前对象内文本的字体尺寸.如当前对行内文本的字体尺寸未被人为设置,则 ...

6、TensorFlow基础（四）队列和线程

6、TensorFlow基础（四）队列和线程的更多相关文章

随机推荐

热门专题