tf.metrics 使用过程中发现的一些问题
起因是看到了这么一个帖子:
http://www.cocoachina.com/cms/wap.php?action=article&id=86347
简短来说就是下面的代码 运行起来结果十分的怪异!!!
import tensorflow as tf a = tf.constant(1.)
mean_a, mean_a_uop = tf.metrics.mean(a)
with tf.control_dependencies([mean_a_uop]):
mean_a = tf.identity(mean_a) sess = tf.InteractiveSession()
tf.global_variables_initializer().run()
tf.local_variables_initializer().run() for _ in range(10):
print(sess.run(mean_a))
在CPU上运行:
第一次运行结果:
第二次运行结果:
第三次运行结果:
第四次运行结果:
第五次运行结果:
可以发现上述代码在CPU环境下运行每次结果均不太相同,而且离希望得到结果都不一样。
希望的结果为 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0
在GPU上运行:
第一次结果:
第二次结果:
第三次结果:
第四次结果:
第五次结果:
可以发现上述代码在GPU环境下运行每次结果均相同,但都不是希望的结果。
希望的结果为 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0
以上则为所引帖子中所提问题。
==================================================================
由上面的问题做了写尝试:(以下测试均在GPU上执行)
1.
import tensorflow as tf a = tf.constant([1.0,])
mean_a, mean_a_uop = tf.metrics.mean(a) sess = tf.InteractiveSession()
tf.global_variables_initializer().run()
tf.local_variables_initializer().run() for _ in range(10):
print(sess.run([mean_a_uop, mean_a]))
print('result:--------------------')
print(sess.run(mean_a))
最终的均值 mean_a 为1.0, 结果正确。
过程中 mean_a_uop 为全局更新操作,结果一直为1.0,结果正确。
过程中 均值 mean_a 在浮动,不一直为1.0, 结果不正确。
2.
import tensorflow as tf
import numpy as np a = tf.constant([1.])
mean_a, mean_a_uop = tf.metrics.mean(a) with tf.control_dependencies([mean_a_uop]):
op=tf.no_op() sess = tf.InteractiveSession()
tf.global_variables_initializer().run()
tf.local_variables_initializer().run() for _ in range(10):
print(sess.run([mean_a, op,mean_a_uop]))
print('result: --------------------')
print(sess.run(mean_a))
最终的均值 mean_a 为1.0, 结果正确。
过程中 mean_a_uop 为全局更新操作,结果一直为1.0,结果正确。
过程中 均值 mean_a 在浮动,不一直为1.0, 结果不正确。
3.
import tensorflow as tf a = tf.constant([1.,])
mean_a, mean_a_uop = tf.metrics.mean(a) with tf.control_dependencies([mean_a_uop]):
mean_a2 = tf.identity(mean_a) sess = tf.InteractiveSession()
tf.global_variables_initializer().run()
tf.local_variables_initializer().run() for _ in range(10):
print(sess.run([mean_a2, mean_a, mean_a_uop]))
print('result: ---------------')
print(sess.run(mean_a))
最终的均值 mean_a 为1.0, 结果正确。
过程中 mean_a_uop 为全局更新操作,结果一直为1.0,结果正确。
过程中 均值 mean_a, mean_a2相等 且在浮动,不一直为1.0, 结果不正确。
===============================================================
根据原帖子将原始代码中的tf.constant 换成 tf.Variable,效果如何呢?
import tensorflow as tf a = tf.Variable(tf.constant(1.))
mean_a, mean_a_uop = tf.metrics.mean(a)
with tf.control_dependencies([mean_a_uop]):
mean_a = tf.identity(mean_a) sess = tf.InteractiveSession()
tf.global_variables_initializer().run()
tf.local_variables_initializer().run() for _ in range(10):
print(sess.run(mean_a))
CPU上运行:
第一次运行结果:
第二次运行结果:
第三次运行结果:
在GPU上运行呢???
第一次运行:
第二次运行:
第三次运行:
===========================================================================
综上发现如果不规范的使用 tf.metrics 会引发不可预知的后果,主要使用不当如下:(虽然如下的做法也没理由出错,但是事实却是常出错,有问题)
mean_a, mean_a_uop = tf.metrics.mean(a)
with tf.control_dependencies([mean_a_uop]):
mean_a = tf.identity(mean_a)
for _ in range(10):
print(sess.run(mean_a))
正确使用如下:
import tensorflow as tf a = tf.Variable(tf.constant(1.))
mean_a, mean_a_uop = tf.metrics.mean(a)
#with tf.control_dependencies([mean_a_uop]):
# mean_a = tf.identity(mean_a) sess = tf.InteractiveSession()
tf.global_variables_initializer().run()
tf.local_variables_initializer().run() for _ in range(10):
print(sess.run(mean_a_uop)) print('result:-------------')
print(sess.run(mean_a))
CPU上运行:
GPU上运行:
解决 tf.metrics 出错问题 的关键就是 不使用 依赖控制 tf.control_dependencies 。
mean_a, mean_a_uop = tf.metrics.mean 中的 均值mean_a 和 更新mean_a_uop 不在一个session执行中获得, 即
如下操作:
for _ in range(10):
print(sess.run(mean_a_uop)) print('result:-------------')
print(sess.run(mean_a))
而且在更新过程中, mean_a_uop 的结果会一直保证正确, mean_a只有在新的session执行中才保证正确。
至于为什么会有这么个结果也是无法解释的,不过这应该是既成事实,使用过程中注意就好,还有就是 依赖控制 慎用 tf.control_dependencies , 不是必须使用的时候就不用。
tf.metrics 使用过程中发现的一些问题的更多相关文章
- 为Secure Store Service生成新密钥,解决“生成密钥过程中发现错误”的问题
我们集成TFS和SharePoint Server以后,一个最常见的需求是通过SharePoint Server的Excel Service读取TFS报表中的信息,利用Excel Service的强大 ...
- 常见Code Review过程中发现的问题-续
上一篇列举了一些比较常见的Code Review问题列表,文末有链接,可追溯查看.本篇为上篇的姊妹篇,继续列举一些上篇遗漏的或不易发现的问题清单,希望能整体性把一些常见的问题表述出来. 测试数据不具有 ...
- 调试过程中发现按f5无法走进jdk源码
debug 模式 ,在fis=new FileInputStream(file); 行打断点 调试过程中发现按f5无法走进jdk源码 package com.lzl.spring.test; impo ...
- Hive通过查询语句向表中插入数据过程中发现的坑
前言 近期在学习使用Hive(版本号0.13.1)的过程中,发现了一些坑,它们也许是Hive提倡的比关系数据库更加自由的体现(同一时候引来一些问题).也许是一些bug.总而言之,这些都须要使用Hive ...
- 常见Code Review过程中发现的问题
软件环境:Spring MVC + MyBatis 主要体现在两个方面,一个是编码习惯问题,另一个是编码质量的问题.编码习惯主要有日志编写.代码注释以及编码风格的问题,而编码质量则与很多方面相关,比如 ...
- 在网站制作过程中发现的block和inline-block不同。
inline-block,简单来说就是在CSS中通过display:inline-block对一个对象指定inline-block属性,可以将对象呈递为内联对象,但是对象的内容作为块对象呈递.有时既希 ...
- VS 2017开发ASP.NET Core Web应用过程中发现的一个重大Bug
今天试着用VS 2017去开发一个.net core项目,想着看看.net core的开发和MVC5开发有什么区别,然后从中发现了一个VS2017的Bug. 首先,我们新建项目,ASP.NET Cor ...
- sqlserver2017安装及连接过程中发现的问题
1.SSMS安装报错,如下图 根据搜索资料发现是防火墙的问题,关闭防火墙就行了. 2.连接用户时报错 这个是因为远程连接相关问题. 首先打开服务器远程连接: 其次点击: SqlServer配置管理器- ...
- vue生命周期updated的触发时机之debug过程中发现的firefox问题
现象描述: 断点位置1 谷歌debug的过程: 火狐debug的过程: 只要在改变数据之后有断点停顿,就会先去执行updated函数 断点位置2 此时火狐和谷歌是一样的效果,但是执行顺序是不一致的 谷 ...
- Mysql: Connect/C++ 使用过程中发现返回 std::string 造成的内存泄露
在使用 Connect/C++ ,测试时发现在调用 getString 出现了内存增长的情况. ConstructOutput(); //打印出当前内存 ;i<;++i) { prepareSt ...
随机推荐
- FFmpeg开发笔记(二十八)Linux环境给FFmpeg集成libxvid
XviD是个开源的视频编解码器,它与DivX一同被纳入MPEG-4规范第二部分的视频标准,但DivX并未开源.早期的MP4视频大多采用XviD或者DivX编码,当时的视频格式被称作MPEG-4.现在 ...
- Unity3D 内存管理非代码技巧
在场景管理器新建 gameobjct 使用代码在类初始化时 NEW 普肉fai包(包)然后将相同的类NEW够挂载到 gameobjct子节点上 在操控列表中类的时候用for循环遍历操作移动还是怎么样( ...
- es6.6.1 java客户端 client基础操作
1.引入jar包 <dependency> <groupId>org.elasticsearch.client</groupId> <artifactId&g ...
- ZynqMP PL固件通过U-BOOT从指定位置加载FPGA BIT
原因 PL固件可能经常修改,而BOOT.BIN和文件系统.内核实际上基本不会变,在一个平台上可以用同一份.如果每次修改都要重新打包PL 固件到BOOT.BIN,操作起来非常麻烦.所以希望PL 的固件可 ...
- Docker安装InfluxDB1.x和InfluxDB2.x以及与SpringBoot整合
两者区别: 1.x 版本使用 influxQL 查询语言,2.x 和 1.8+(beta) 使用 flux 查询语法:相比V1 移除了database 和 RP,增加了bucket. V2具有以下几个 ...
- 升级到 MySQL 8.4,MySQL 启动报错:io_setup() failed with EAGAIN
问题 最近碰到一个 case,一台主机上,部署了多个实例.之前使用的是 MySQL 8.0,启动时没有任何问题.但升级到 MySQL 8.4 后,部分实例在启动时出现了以下错误. [Warning] ...
- 谈谈你对 keep-alive 的了解?
在做电商有关的项目中,当我们第一次进入列表页需要请求一下数据,当我从列表页进入详情页,详情页不缓存也需要请求下数据,然后返回列表页,这时候我们使用keep-alive来缓存组件,防止二次渲染,这样会大 ...
- Vue3 如何接入 i18n 实现国际化多语言
1. 基本方法 在 Vue.js 3 中实现网页的国际化多语言,最常用的包是 vue-i18n,通常我们会与 vue-i18n-routing 一起使用. vue-i18n 负责根据当前页面的语言渲染 ...
- c 语言学习第二天
常量 字符串常量 字符 例如:'f','i','z','a'编译器为每个字符分配空间. 'f' 'i' 'z' 'a' 字符串 例如:"hello"编译器为字符串里的每个字符分配空 ...
- Linux 中 WIFI 和热点的使用
之前一直在 ubuntu 的图形界面中使用,突然需要在 ARM 板上打开热点,一时给弄蒙了,在此记录一下 一.网卡命令 显示所有网络信息 sudo ip link show 关闭或打开网络 sudo ...