学习笔记TF023:下载、缓存、属性字典、惰性属性、覆盖数据流图、资源

确保目录结构存在。每次创建文件，确保父目录已经存在。确保指定路径全部或部分目录已经存在。创建沿指定路径上不存在目录。

下载函数，如果文件名未指定，从URL解析。下载文件，返回本地文件系统文件名。如果文件存在，不下载。如果文件未指定，从URL解析，返回filepath 。实际下载前，检查下载位置是否有目标名称文件。是，跳过下载。下载文件，返回路径。重复下载，把文件从文件系统删除。

import os
import shutil
import errno
from lxml import etree
from urllib.request import urlopen

def ensure_directory(directory):
directory = os.path.expanduser(directory)
try:
os.makedirs(directory)
except OSError as e:
if e.errno != errno.EEXIST:
raise e

def download(url, directory, filename=None):
if not filename:
_, filename = os.path.split(url)
directory = os.path.expanduser(directory)
ensure_directory(directory)
filepath = os.path.join(directory, filename)
if os.path.isfile(filepath):
return filepath
print('Download', filepath)
with urlopen(url) as response, open(filepath, 'wb') as file_:
shutil.copyfileobj(response, file_)
return filepath

磁盘缓存修饰器，较大规模数据集处理中间结果保存磁盘公共位置，缓存加载函数修饰器。Python pickle功能实现函数返回值序列化、反序列化。只适合能纳入主存数据集。@disk_cache修饰器，函数实参传给被修饰函数。函数参数确定参数组合是否有缓存。散列映射为文件名数字。如果是'method'，跳过第一参数，缓存filepath，'directory/basename-hash.pickle'。方法method=False参数通知修饰器是否忽略第一个参数。

import functools
import os
import pickle

def disk_cache(basename, directory, method=False):
directory = os.path.expanduser(directory)
ensure_directory(directory)

def wrapper(func):
@functools.wraps(func)
def wrapped(*args, **kwargs):
key = (tuple(args), tuple(kwargs.items()))
if method and key:
key = key[1:]
filename = '{}-{}.pickle'.format(basename, hash(key))
filepath = os.path.join(directory, filename)
if os.path.isfile(filepath):
with open(filepath, 'rb') as handle:
return pickle.load(handle)
result = func(*args, **kwargs)
with open(filepath, 'wb') as handle:
pickle.dump(result, handle)
return result
return wrapped

return wrapper
@disk_cache('dataset', '/home/user/dataset/')
def get_dataset(one_hot=True):
dataset = Dataset('http://example.com/dataset.bz2')
dataset = Tokenize(dataset)
if one_hot:
dataset = OneHotEncoding(dataset)
return dataset

属性字典。继承自内置dict类，可用属性语法访问悠已有元素。传入标准字典(键值对)。内置函数locals，返回作用域所有局部变量名值映射。

class AttrDict(dict):

def __getattr__(self, key):
if key not in self:
raise AttributeError
return self[key]

def __setattr__(self, key, value):
if key not in self:
raise AttributeError
self[key] = value

惰性属性修饰器。外部使用。访问model.optimze，数据流图创建新计算路径。调用model.prediction，创建新权值和偏置。定义只计算一次属性。结果保存到带有某些前缀的函数调用。惰性属性，TensorFlow模型结构化、分类。

import functools

def lazy_property(function):
attribute = '_lazy_' + function.__name__

@property
@functools.wraps(function)
def wrapper(self):
if not hasattr(self, attribute):
setattr(self, attribute, function(self))
return getattr(self, attribute)
return wrapper

class Model:

def __init__(self, data, target):
self.data = data
self.target = target
self.prediction
self.optimize
self.error

@lazy_property
def prediction(self):
data_size = int(self.data.get_shape()[1])
target_size = int(self.target.get_shape()[1])
weight = tf.Variable(tf.truncated_normal([data_size, target_size]))
bias = tf.Variable(tf.constant(0.1, shape=[target_size]))
incoming = tf.matmul(self.data, weight) + bias
return tf.nn.softmax(incoming)

@lazy_property
def optimize(self):
cross_entropy = -tf.reduce_sum(self.target, tf.log(self.prediction))
optimizer = tf.train.RMSPropOptimizer(0.03)
return optimizer.minimize(cross_entropy)

@lazy_property
def error(self):
mistakes = tf.not_equal(
tf.argmax(self.target, 1), tf.argmax(self.prediction, 1))
return tf.reduce_mean(tf.cast(mistakes, tf.float32))

覆盖数据流图修饰器。未明确指定使用期他数据流图，TensorFlow使用默认。Jupyter Notebook，解释器状态在不同一单元执行期间保持。初始默认数据流图始终存在。执行再次定义数据流图运算单元，添加到已存在数据流图。根据菜单选项重新启动kernel，再次运行所有单元。
创建定制数据流图，设置默认。所有运算添加到该数据流图，再次运行单元，创建新数据流图。旧数据流图自动清理。
修饰器中创建数据流图，修饰主函数。主函数定义完整数据流图，定义占位符，调用函数创建模型。

import functools
import tensorflow as tf

def overwrite_graph(function):
@functools.wraps(function)
def wrapper(*args, **kwargs):
with tf.Graph().as_default():
return function(*args, **kwargs)
return wrapper
@overwrite_graph
def main():
data = tf.placeholder(...)
target = tf.placeholder(...)
model = Model()

main()

API文档，编写代码时参考：
https://www.tensorflow.org/versions/master/api_docs/index.html
Github库，跟踪TensorFlow最新功能特性，阅读拉拽请求(pull request)、问题(issues)、发行记录(release note)：
https://github.com/tensorflow/tensorflow
分布式 TensorFlow：
https://www.tensorflow.org/versions/master/how_tos/distributed/index.html
构建新TensorFlow功能：
https://www.tensorflow.org/master/how_tos/adding_an_op/index.html
邮件列表：
https://groups.google.com/a/tensorflow.org/d/forum/discuss
StackOverflow：
http://stackoverflow.com/questions/tagged/tensorflow
代码：
https://github.com/backstopmedia/tensorflowbook

参考资料：
《面向机器智能的TensorFlow实践》

欢迎付费咨询(150元每小时)，我的微信：qingxingfengzi

学习笔记TF023:下载、缓存、属性字典、惰性属性、覆盖数据流图、资源的更多相关文章

mybatis学习笔记(14)-查询缓存之中的一个级缓存
mybatis学习笔记(14)-查询缓存之中的一个级缓存标签: mybatis mybatis学习笔记14-查询缓存之中的一个级缓存查询缓存一级缓存一级缓存工作原理一级缓存測试一级缓存应用 ...
SpringBoot学习笔记：Redis缓存
SpringBoot学习笔记:Redis缓存关于Redis Redis是一个使用ANSI C语言编写的免费开源.支持网络.可基于内存亦可以持久化的日志型.键值数据库.其支持多种存储类型,包括Stri ...
Dubbo -- 系统学习笔记 -- 示例 -- 结果缓存
Dubbo -- 系统学习笔记 -- 目录示例想完整的运行起来,请参见:快速启动,这里只列出各种场景的配置方式结果缓存结果缓存,用于加速热门数据的访问速度,Dubbo提供声明式缓存,以减少用 ...
[原创]java WEB学习笔记41：简单标签之带属性的自定义标签(输出指定文件，计算并输出两个数的最大值 demo)
本博客为原创:综合尚硅谷(http://www.atguigu.com)的系统教程(深表感谢)和网络上的现有资源(博客,文档,图书等),资源的出处我会标明本博客的目的:①总结自己的学习过程,相当 ...
matlab学习笔记12_3串联结构体，按属性创建含有元胞数组的结构体,filenames,isfield,isstruct,orderfields
一起来学matlab-matlab学习笔记12 12_3 结构体串联结构体,按属性创建含有元胞数组的结构体,filenames,isfield,isstruct,orderfields 觉得有用的话 ...
[html5] 学习笔记-表单新增的元素与属性（续）
本节主要讲解表单新增元素的controls属性.placeholder属性.List属性.Autocomplete属性.Pattern属性.SelectionDirection属性.Indetermi ...
【WPF学习笔记】之WPF基础:依赖关系属性和通知
这些天来,对象似乎已经忙得晕头转向了.每个人都希望它们做这做那.Windows® Presentation Foundation (WPF) 应用程序中的典型对象会接到各种各样不同的请求:有要求绑定到 ...
Vue学习笔记（二）动态绑定、计算属性和事件监听
目录一.为属性绑定变量 1. v-bind的基本使用 2. v-bind动态绑定class(对象语法) 3. v-bind动态绑定class(数组语法) 4. v-bind动态绑定style(对象语 ...
Java学习笔记之——this关键字、非静态成员属性和静态成员属性的区别、类的加载顺序
一.this关键字 1.代表当前类的对象 2.通过” . ”调用成员属性和成员方法 3.通过this可以区分成员属性和参数参数名和属性名相同的情况,默认是参数名二.非静态成员属性和静态成员属性的区 ...

随机推荐

LINQ之路11：LINQ Operators之过滤(Filtering)
在本系列博客前面的篇章中,已经对LINQ的作用.C# 3.0为LINQ提供的新特性,还有几种典型的LINQ技术:LINQ to Objects.LINQ to SQL.Entity Framework ...
VS工作目录，输出目录
C++项目,解决方案总文件夹下就只包含解决方案配置文件sln和一个项目总文件夹和一个Debug文件夹以及一个Release文件夹(共四个东东,其中Debug和Release文件夹中存放最终生成的结果e ...
廖雪峰JavaScript学习笔记（基础及数据类型、变量）
先睹为快 alert('我要学JavaScript!'); Run: 基本语法: 1.每个语句以;结束,不强制 2.语句块用{...} 3.//单行注释,/*...*/ 多行注释数据类型: 1.不区 ...
R apply函数三维 array
参考自:https://www.cnblogs.com/nanhao/p/6674063.html 首先,生成三维数组,注意该三维矩阵为 2*3*4的维度: x=array(1:24,c(2,3,4) ...
echarts tooltip巧用
tooltip : { trigger: 'item', triggerOn: 'click', formatter:function(params,ticket,callback){ var res ...
(19)ThreadPoolExecutor线程池
# 线程池 # 实例化线程池 ThreadPoolExcutor (推荐cpu_count*(n+1)) # 异步提交任务 submit / map # 阻塞直到任务完成 shutdown # 获取子 ...
[数据结构]P1.2 队列
* 注: 本文/本系列谢绝转载,如有转载,本人有权利追究相应责任. 2019年4月8日 Stan Zhang 2019年4月8日格物致知,经世致用. 队列是一种先进先出FIFO的模型,常见操作有: ...
摘录和再编：彻底弄懂JS执行机制
网文: https://juejin.im/post/59e85eebf265da430d571f89 并发模型和事件循环:https://developer.mozilla.org/zh-CN/do ...
three.js 第二篇:场景相机渲染器物体之间的关系
w我用画画来形容他们之间的关系场景就是纸张相机就是我们的眼睛物体就是在我们脑海中构思的那个画面渲染器就是绘画这个动作场景(Scene): 初始化:var scene = new THREE. ...
在Eclipse下搭建Hibernate框架（加载hibernate工具插件，离线）
下载hibernate工具包完成之后,对其进行解压可以得到众多文件夹,其中就有一个jbosstools-hibernate开头的文件夹,进入其中可以得到features和plugins两个文件夹,在E ...

学习笔记TF023:下载、缓存、属性字典、惰性属性、覆盖数据流图、资源

学习笔记TF023:下载、缓存、属性字典、惰性属性、覆盖数据流图、资源的更多相关文章

随机推荐

热门专题