tensorflow: a Implementation of rotation ops (旋转的函数实现方法)
tensorflow 旋转矩阵的函数实现方法
关键字: rot90, tensorflow
1. 背景
在做数据增强的操作过程中, 很多情况需要对图像旋转和平移等操作, 针对一些特殊的卷积(garbo conv)操作,还需要对卷积核进行旋转操作.
在tensorflow中似乎没有实现对4D tensor的旋转操作.
严格的说: tensorflow对tensor的翻转操作并未实现, 仅有针对3D tensor的tf.image.rot()
而在大多数的情况下使用的是4D形式的tensor, [B,W,H,C] 或者是3D的图像组成的batchs.
通过查看这篇文章的代码可以知道[1] 可以使用numpy的rot90()函数旋转, 但是rot90对象是ndarray, 针对tensorflow.tensor对象而言显然是无法使用的, 会抛出类似: 无法找到m.dim属性的异常.
也就是说无法使用numpy.rot90() 函数.
又知, tensorflow中提供有对矩阵的翻转, 转置,切片操作的函数,但是没有提供旋转90°, 180°,270°的操作.
因此可以参照numpy.rot90(m, k=1, axes=(0,1)) 的程序片段去自己动手实现.
rot90中的第一个参数m是操作对象, k是旋转的次数,k=1 代表逆时针旋转90度, k=2 代表逆时针旋转180度,以此类推
axes是代表旋转的操作在哪两个维度构成的平面上.
rot90的源代码如下:
def rot90(m, k=1, axes=(0,1)):
'''
......
'''
# 省略检测参数的操作
k %= 4
if k == 0:
return m[:]
if k == 2:
return flip(flip(m, axes[0]), axes[1])
axes_list = arange(0, m.ndim)
(axes_list[axes[0]], axes_list[axes[1]]) = (axes_list[axes[1]],
axes_list[axes[0]])
if k == 1:
return transpose(flip(m,axes[1]), axes_list)
else:
# k == 3
return flip(transpose(m, axes_list), axes[1])
PS: 通过阅读上述的代码,也可以发现在tensorflow中直接使用rot90所抛出的异常是在这里出现的
if axes[0] == axes[1] or absolute(axes[0] - axes[1]) == m.ndim
原因是: 程序把tensor对象当成np.ndarray操作了, 而tensor对象没有m.dim属性
2. 实现rot90操作
2.1 梳理程序流程
通过查看源代码可以梳理出程序流程图:

2.2 tensorflow 实现旋转操作
根据上述的流程图, 可以实现对tensorflow的rot90操作;
def rot90(tensor,k=1,axes=[1,2],name=None):
'''
autor:lizh
tensor: a tensor 4 or more dimensions
k: integer, Number of times the array is rotated by 90 degrees.
axes: (2,) array_like
The array is rotated in the plane defined by the axes.
Axes must be different.
-----
Returns
-------
tensor : tf.tensor
A rotated view of `tensor`.
See Also: https://www.tensorflow.org/api_docs/python/tf/image/rot90
'''
axes = tuple(axes)
if len(axes) != 2:
raise ValueError("len(axes) must be 2.")
tenor_shape = (tensor.get_shape().as_list())
dim = len(tenor_shape)
if axes[0] == axes[1] or np.absolute(axes[0] - axes[1]) == dim:
raise ValueError("Axes must be different.")
if (axes[0] >= dim or axes[0] < -dim
or axes[1] >= dim or axes[1] < -dim):
raise ValueError("Axes={} out of range for tensor of ndim={}."
.format(axes, dim))
k%=4
if k==0:
return tensor
if k==2:
img180 = tf.reverse(tf.reverse(tensor, axis=[axes[0]]),axis=[axes[1]],name=name)
return img180
axes_list = np.arange(0, dim)
(axes_list[axes[0]], axes_list[axes[1]]) = (axes_list[axes[1]],axes_list[axes[0]]) # 替换
print(axes_list)
if k==1:
img90=tf.transpose(tf.reverse(tensor,axis=[axes[1]]), perm=axes_list, name=name)
return img90
if k==3:
img270=tf.reverse( tf.transpose(tensor, perm=axes_list),axis=[axes[1]],name=name)
return img270
2.3 代码测试
# 加载库
import numpy as np
import matplotlib.pyplot as plt
import tensorflow as tf
# 手写体数据集 加载
from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("/home/lizhen/data/MNIST/", one_hot=True)
sess=tf.Session()
#选取数据 4D
images = mnist.train.images
img_raw = images[0,:] # [0,784]
img=tf.reshape(img_raw,[-1,28,28,1]) # img 现在是tensor
# 绘图
def fig_2D_tensor(tensor):# 绘图
#plt.matshow(tensor, cmap=plt.get_cmap('gray'))
plt.matshow(tensor) # 彩色图像
# plt.colorbar() # 颜色条
plt.show()
# 显 显示 待旋转的图片
fig_2D_tensor(sess.run(img)[0,:,:,0]) # 提取ndarray

简单的测试一下代码:
img11_rot=rot90(img,2) # 旋转两次90
fig_2D_tensor(sess.run(img11_rot)[0,:,:,0]) # 打印图像
img12_rot=rot90(img,1,[1,1]) # 抛出异常, 测试 Axes must be different.
img13_rot=rot90(img,1,[0,6]) # 抛出异常, 测试 Axes must be different.
img14_rot=rot90(img,axes=[1,5])# 抛出异常,测试out of range.
img14_rot=rot90(img,axes=[-1,2]) # -1的下标是倒数第二个,测试out of range.
测试结果:



3总结
okey了,现在可以用了.
.....
额,,,,,最近才发现tensorflow的最新版本,大约就在前几天发布的新版本(14天前, 1.10.1 )上已经添加了对2D,3D图像的操作,支持[B,W,H,C]格式的tensor做出旋转[2]
星期五, 07. 九月 2018 02:49下午
参考文献
tensorflow: a Implementation of rotation ops (旋转的函数实现方法)的更多相关文章
- 【转】Unity3D Transform中有关旋转的属性和方法测试
Transform有关旋转个属性和方法测试 一,属性 1,var eulerAngles : Vector3 public float yRotation = 5.0F; void Update() ...
- 【微软100题】定义字符串的左旋转操作:把字符串前面的若干个字符移动到字符串的尾部。 如把字符串abcdef左旋转2位得到字符串cdefab。请实现字符串左旋转的函数。
package test; /** * 定义字符串的左旋转操作:把字符串前面的若干个字符移动到字符串的尾部. 如把字符串abcdef左旋转2位得到字符串cdefab. 请实现字符串左旋转的函数. * ...
- TensorFlow之DNN(三):神经网络的正则化方法(Dropout、L2正则化、早停和数据增强)
这一篇博客整理用TensorFlow实现神经网络正则化的内容. 深层神经网络往往具有数十万乃至数百万的参数,可以进行非常复杂的特征变换,具有强大的学习能力,因此容易在训练集上过拟合.缓解神经网络的过拟 ...
- Android 解决setRequestedOrientation之后手机屏幕的旋转不触发onConfigurationChanged方法
最近在做播放器的时候遇到一个问题,在屏幕方向改变之后需要切换播放器全屏/非全屏的时候,在重写了onConfigurationChanged方法并在manifest.xml配置文件中添加 android ...
- tensorflow构建CNN模型时的常用接口函数
(1)tf.nn.max_pool()函数 解释: tf.nn.max_pool(value, ksize, strides, padding, data_format='NHWC', name=No ...
- Matrix控制平移、旋转和缩放的方法
1.setTranslate(float ds,float dy):控制Matrix进行平移.2.setSkew(float kx,float ky,float px,float py):控制Matr ...
- JMeter接口HTTP请求implementation不选java会报错解决方法
1.若不对c参数和d参数进行URL编码则需要选择implementation为java: 2.若想不设implementation值,则需进行c参数d参数URLEncoding import java ...
- TensorFlow 常用函数与方法
摘要:本文主要对tf的一些常用概念与方法进行描述. tf函数 TensorFlow 将图形定义转换成分布式执行的操作, 以充分利用可用的计算资源(如 CPU 或 GPU.一般你不需要显式指定使用 CP ...
- QT 实现图片旋转的两种方法
第一种方案 使用 QPixmap 的 transformed 函数来实现旋转,这个函数默认是以图片中心为旋转点,不能设置旋转的中心点,使用如下: QMatrix matrix; matrix.rota ...
随机推荐
- <div>标签输入文字
@*输入框,contenteditable="true"使能div可以输入文字*@ <div contenteditable="true" class=& ...
- SpringCloud---分布式配置中心---Spring Cloud Config
1.概述 1.1 Spring Cloud Config是Spring Cloud的一个全新项目: 作用:为分布式系统中的基础设施.微服务应用提供集中化的外部配置支持: 分为服务端.客户端2个 ...
- link 标签中“rel=stylesheet”的作用
最近在复习我的培训项目学子商城项目的时候在引入外部css的时候忘记加上了rel=stylesheet(因为以前看别人给的模板有所以就加了上去,所以并没有太大印象) 那rel=stylesheet到底起 ...
- Oracle PL/SQL编程之包(packages)
1.简介 包用于在逻辑上组合过程和函数,它由包规范和包体组成. 我们可以使用create package来创建包,代码如下: ok,包创建完成,通过包的代码发现包的功能就是申明包中包含的过程和方法,红 ...
- Python爬虫抓取某音乐网站MP3(下载歌曲、存入Sqlite)
最近右胳膊受伤,打了石膏在家休息.为了实现之前的想法,就用左手打字.写代码,查资料完成了这个资源小爬虫.网页爬虫, 最主要的是协议分析(必须要弄清楚自己的目的),另外就是要考虑对爬取的数据归类,存储. ...
- 算法学习笔记之——priority queue、heapsort、symbol table、binary search trees
Priority Queue 类似一个Queue,但是按照priority的大小顺序来出队 一般存在两种方式来实施 排序法(ordered),在元素入队时即进行排序,这样插入操作为O(N),但出队为O ...
- eclipspe导入hibernate的源代码
看图:
- FocusBI: SSIS体系结构(原创)
关注微信公众号:FocusBI 查看更多文章:加QQ群:808774277 获取学习资料和一起探讨问题. <商业智能教程>pdf下载地址 链接:https://pan.baidu.com/ ...
- 登录mysql 报 Access denied for user 'root'@'localhost' 错误
安装mysql后登录提示:ERROR 1045 (28000): Access denied for user 'root'@'localhost' (using password:yes) 解决如下 ...
- 使用 Qt 获取 UDP 数据并显示成图片
一个项目,要接收 UDP 数据包,解析并获取其中的数据,主要根据解析出来的行号和序号将数据拼接起来,然后将拼接起来的数据(最重要的数据是 R.G.B 三个通道的像素值)显示在窗口中.考虑到每秒钟要接收 ...