Caffe2的相关概念

接下来你可以学到更多Caffe2中主要的概念，这些概念对理解和开发Caffe2相当重要。

Blobs and Workspace，Tensors

Caffe2中，数据是用blobs储存的。Blob只是内存中的一个数据块。大多数Blobs包含一个张量（tensor），可以理解为多维矩阵，在Python中，他们被转换为numpy 矩阵。

Workspace 保存着所有的Blobs。下面的例子展示了如何向Workspace中传递Blobs和取出他们。Workspace在你开始使用他们时，才进行初始化。

# Create random tensor of three dimensions

x = np.random.rand(4, 3, 2)

print(x)

print(x.shape)

workspace.FeedBlob("my_x", x)

x2 = workspace.FetchBlob("my_x")

print(x2)

Nets and Operators

Caffe2中最基本的对象是net，net可以说是一系列Operators的集合，每个Operator根据输入的blob输出一个或者多个blob。

下面我们将会创建一个超级简单的模型。他拥有如下部件：

一个全连接层
一个Sigmoid激活函数和一个Softmax函数
一个交叉损失

直接构建网络是很厌烦的，所以最好使用Python接口的模型助手来构建网络。我们只需简单的调用CNNModelHelper，他就会帮我们创建两个想联系的网络。
一个用于初始化参数（ref.init_net）
一个用于实际训练（ref.init_net）

# Create the input data

data = np.random.rand(16, 100).astype(np.float32)

# Create labels for the data as integers [0, 9].

label = (np.random.rand(16) * 10).astype(np.int32)

workspace.FeedBlob("data", data)

workspace.FeedBlob("label", label)

# Create model using a model helper

m = cnn.CNNModelHelper(name="my first net")

fc_1 = m.FC("data", "fc1", dim_in=100, dim_out=10)

pred = m.Sigmoid(fc_1, "pred")

[softmax, loss] = m.SoftmaxWithLoss([pred, "label"], ["softmax", "loss"])

上面的代码中，我们首先在内存中创建了输入数据和标签，实际使用中，往往从database等载体中读入数据。可以看到输入数据和标签的第一维度是16，这是因为输入的最小batch最小是16。Caffe2中很多Operator都能直接通过CNNModelHelper来进行，并且能够一次处理一个batch。CNNModelHelper’s Operator List中有更详细的解析。

第二，我们通过一些操作创建了一个模型。比如FC，Sigmoid，SoftmaxWithLoss 。注意：这个时候，这些操作并没有真正执行，他们仅仅是对模型进行了定义。

模型助手创建了两个网络：m.param_init_net，这个网络将仅仅被执行一次。他将会初始化参数blob,例如全连接层的权重。真正的训练是通过执行m.net来是现实的。这是自动发生的。

网络的定义保存在一个protobuf结构体中。你可以很容易的通过调用net.proto来查看它。

print(str(m.net.Proto()))

输出如下：

name: "my first net"

op {

  input: "data"

  input: "fc1_w"

  input: "fc1_b"

  output: "fc1"

  name: ""

  type: "FC"

}

op {

  input: "fc1"

  output: "pred"

  name: ""

  type: "Sigmoid"

}

op {

  input: "pred"

  input: "label"

  output: "softmax"

  output: "loss"

  name: ""

  type: "SoftmaxWithLoss"

}

external_input: "data"

external_input: "fc1_w"

external_input: "fc1_b"

external_input: "label"

同时，你也可以查看参数初始化网络：

print(str(m.param_init_net.Proto()))

这就是Caffe2的API：使用Python接口方便快速的构建网络并训练你的模型，Python接口将这些网络通过序列化的protobuf传递给C++接口，然后C++接口全力的执行。

Executing

现在我们可以开始训练我们的模型。

首先，我们先跑一次参数初始化网络。

workspace.RunNetOnce(m.param_init_net)

这个操作将会把param_init_net的protobuf传递给C++代码进行执行。

然后我们真正的创建网络：

workspace.CreateNet(m.net)

一旦创建好网络，我们就可以高效的跑起来：

# Run 100 x 10 iterations 跑100*10次迭代

for j in range(0, 100):

    data = np.random.rand(16, 100).astype(np.float32)

    label = (np.random.rand(16) * 10).astype(np.int32)

    workspace.FeedBlob("data", data)

    workspace.FeedBlob("label", label)

    workspace.RunNet(m.name, 10)   # run for 10 times 跑十次

这里要注意的是我们怎样在RunNet()函数中使用网络的名字。并且在这里，由于网络已经在workspace中创建，所以我们不需要再传递网络的定义。执行完后，你可以查看存在输出blob中的结果。

print(workspace.FetchBlob("softmax"))

print(workspace.FetchBlob("loss"))

Backward pass

上面的网络中，仅仅包含了网络的前向传播，因此它是学习不到任何东西的。后向传播对每一个前向传播进行gradient operator。如果你想自己尝试这样的操作，那么你可以进行以下操作并检查结果。

在RunNetOnce()前，插入下面操作：

m.AddGradientOperators([loss])

然后测试protobuf的输出：

print(str(m.net.Proto()))

以上就是大体的使用教程

译者注：

训练过程可以总结为以下步骤：

# Create model using a model helper

m = cnn.CNNModelHelper(name="my first net")

fc_1 = m.FC("data", "fc1", dim_in=100, dim_out=10)

pred = m.Sigmoid(fc_1, "pred")

[softmax, loss] = m.SoftmaxWithLoss([pred, "label"], ["softmax", "loss"])

m.AddGradientOperators([loss]) #注意这一行代码

workspace.RunNetOnce(m.param_init_net)

workspace.CreateNet(m.net)

# Run 100 x 10 iterations

for j in range(0, 100):

    data = np.random.rand(16, 100).astype(np.float32)

    label = (np.random.rand(16) * 10).astype(np.int32)

    workspace.FeedBlob("data", data)

    workspace.FeedBlob("label", label)

    workspace.RunNet(m.name, 10)   # run for 10 times

结语：

转载请注明出处：http://www.jianshu.com/c/cf07b31bb5f2

Caffe2 手册（Intro Tutorial）[2]的更多相关文章

Caffe2 Tutorials[0]
本系列教程包括9个小节,对应Caffe2官网的前9个教程,第10个教程讲的是在安卓下用SqueezeNet进行物体检测,此处不再翻译.另外由于栏主不关注RNN和LSTM,所以栏主不对剩下两个教程翻译. ...
linux下scrapy环境搭建
最近使用scrapy做数据挖掘,使用scrapy定时抓取数据并存入MongoDB,本文记录环境搭建过程以作备忘 OS:ubuntu 14.04 python:2.7.6 scrapy:1.0.5 D ...
Scrapy使用详细记录
这几天,又用到了scrapy框架写爬虫,感觉忘得差不多了,虽然保存了书签,但有些东西,还是多写写才好啊首先,官方而经典的的开发手册那是需要的: https://doc.scrapy.org/en/l ...
学python，怎么能不学习scrapy呢！
摘要:本文讲述如何编写scrapy爬虫. 本文分享自华为云社区<学python,怎么能不学习scrapy呢,这篇博客带你学会它>,作者: 梦想橡皮擦 . 在正式编写爬虫案例前,先对 scr ...
Scrapy开发指南
一.Scrapy简介 Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架. 可以应用在包括数据挖掘,信息处理或存储历史数据等一系列的程序中. Scrapy基于事件驱动网络框架 Twis ...
[转]python 常用类库！
Python学习 On this page... (hide) 1. 基本安装 2. Python文档 2.1 推荐资源站点 2.2 其他参考资料 2.3 代码示例 3. 常用工具 3.1 Pytho ...
Scrapy003-项目流程
Scrapy003-项目流程 @(Spider)[POSTS] 前两篇文章我们了解到Scrapy的原理和安装的相关知识,这节就需要知道创建项目流程的小知识. 根据官方文档:http://scrapy- ...
Python爬虫Scrapy框架入门（0）
想学习爬虫,又想了解python语言,有个python高手推荐我看看scrapy. scrapy是一个python爬虫框架,据说很灵活,网上介绍该框架的信息很多,此处不再赘述.专心记录我自己遇到的问题 ...
(转) Deep Learning Research Review Week 2: Reinforcement Learning
Deep Learning Research Review Week 2: Reinforcement Learning 转载自: https://adeshpande3.github.io/ad ...

随机推荐

Git - 05. git log & git show
1. 概述有了提交, 就必须有日志日志用处很多, 这里我就不多说了 2. 项目日志概述查看当前分支的提交记录命令普通查看命令 > git log 显示 commit id 包括 ...
linux shell ansible 命令详解
也可以参考ansible 模块介绍的其他文章:https://www.cnblogs.com/guxiaobei/p/8316903.html 安装ansible yum install epel-r ...
iframe重新加载
方法1: document.getElementById('iframeId').contentWindow.location.reload(true); 方法2: document.getEleme ...
基于bs4库的HTML内容查找方法
一.信息提取实例提取HTML中所有的URL链接思路:1)搜索到所有的<a>标签 2)解析<a>标签格式,提取href后的链接内容 >>> import r ...
谁说程序员没有时间关心女朋友的，Python 教你如何掌握女神情绪变化
很多人都是在朋友圈装死,微博上蹦迪.微信朋友圈已经不是一个可以随意发表心情的地方了,微博才是! 所以你不要傻傻盯着女神的朋友圈发呆啦!本文教你如何用 Python 自动通知女神微博情绪变化,从今天开始 ...
javaweb项目运转流程
做web项目,不仅要会做,还需要了解其工作流程,为什么这么做!这些知道了.其他的都是渣渣.上图!对于web 项目了解他的运行流程之后,基本其他的都不是问题.web项目还是很简单的这是简化的开发时常用 ...
IIS-URL重写模块配置参考
本文提供了URL重写模块的概述,并解释了该模块使用的配置概念. 功能概述URL重写模块将请求URL重写为显示给用户或Web应用程序的简单,用户友好和搜索引擎友好的地址.URL重写使用定义的规则进行评估 ...
Laravel Vuejs 实战：开发知乎（2）用户注册
1.本节需要发送验证邮件 2.教程使用SendCloud发送邮件 [我使用的是mailtrap] 3. composer require laravel/ui 安装完成后 php artisan ui ...
markdown区块
Markdown 区块 Markdown 区块引用是在段落开头使用 > 符号 ,然后后面紧跟一个空格符号: > 区块引用 > 菜鸟教程 > 学的不仅是技术更是梦想显示结果如下 ...
【PAT甲级】1083 List Grades (25 分)
题意: 输入一个正整数N(<=101),接着输入N个学生的姓名,id和成绩.接着输入两个正整数X,Y(0<=X,Y<=100),逆序输出成绩在x,y之间的学生的姓名和id. tric ...

Caffe2 手册（Intro Tutorial）[2]