下面是基于我自己的接口,我是用来分类一维数据的,可能不具通用性:

(前提,你已经编译了caffe的python的接口)

添加 caffe塻块的搜索路径,当我们import caffe时,可以找到。

对于这一步,一般我们都会把 cafffe 模块的搜索路经永久地加到先加$PYTHONPATH中去,如可以把 export PYTHONPATH=/path/to/caffe/python:$PYTHONPATH 写到 .bashrc中。而下面的做法,只是临时的做法哦;

  1. improt sys
  2. #sys.path为一个列表,用什么方法加入都好啊,我用insert直接插到首位
  3. sys.path.insert(0, caffe_python的路径,我的为~/down/caffe/python/')

设置使用的设备:

在用显卡并行运算算的时候,如果多显卡的时候,输入它们的序号表示使用哪一块卡,如果单显卡的话(比如我的笔记本电脑,应该都为0,表示第一块)。

  1. caffe.set_device(0
  2. caffe.set_mode_gpu()
  1.  
  1. caffe.set_mode_cpu() #使用caffe的GPU模式

设定网络的solver:

选中我们的solver_prototxt文件,里面就是设定了网络的训练次数啦,各参数的值啦等啦。

  1. solver = None
  2. #选用SGD算法来进行运算;
  3. solver = caffe.SGDSolver('你的网络的lenet_solver.prototxt 文件‘)
  1. # 执行完上面的语句以后,网络的相应的权值与偏置会根据我们的定义进行赋值的;

caffe中的数据保存及调用:

在caffe中,我们的网络可以分为训练网络与测试网络哦,训练网络用solver.net.blobs、solver.net.params;对面测试网络,用solver.test_nets[i].blobs、solver.test_nets[i].params(其中 i 表示 第几个测试网络,从0开始。例如,我们就一个测试网络的话,我们就写为:solver.test_nets[0].blobs。)

下面,我们以训练网络为例子,看看caffe中的数据的存储与调用方法。 caffe的 数据都是放在 blobs块中的,我觉得这个好牛逼啊,太统一了。

solver.net.blobs 里面放的为每一层layer输出的data、对输出结点求的导数 diff,另外还有几个如count等参数,不过我们基本用不到的,不要关注一下data数据就可以了。

  1. #solver.net.blobs为一个字典的数据类型,里面的key值为各个layer 的名字,value为caffe的blob块;
  1.  
  1. solver.net.blobs
  2. #输出:
  1. rderedDict([('data', <caffe._caffe.Blob at 0x7f7bde968398>),
  2. ('label', <caffe._caffe.Blob at 0x7f7bde968488>),
  3. ('conv1', <caffe._caffe.Blob at 0x7f7bde968578>),
  4. ('pool1', <caffe._caffe.Blob at 0x7f7bde968e60>),
  5. ('conv2', <caffe._caffe.Blob at 0x7f7bde9686e0>),
  6. ('pool2', <caffe._caffe.Blob at 0x7f7bde968cf8>),
  7. ('ip1', <caffe._caffe.Blob at 0x7f7bde968c80>),
  8. ('ip2', <caffe._caffe.Blob at 0x7f7bde968c08>),
  9. ('loss', <caffe._caffe.Blob at 0x7f7bde968b90>)])
  10.  
  11. #我们可以访问Blob块里的内容了,通过看Blob块的源码你会发现里面有data, diff,count等内容的。
  1. #我们以conv1层为例子,我们访问 conv1的输出的数据,可以通过下面的语句:
  1. solver.net.blobs['data'].data
  1. solver.net.blobs['data'].diff
  1. #如果想看它们的数据结构,可以通过下面的语句得到:
  1. solver.net.blobs['data'].data.shape
  1. solver.net.blobs['data'].diff.shape
  1. #另外,还可以通过reshape()transpose()等操作对它们变形,应该是对数组的操作之类的吧。
  1.  

solver.net.params为一个字典的数据类型,里面放的是与连接的权值及偏置相关的数据,如:data(表示权值的大小),diff(对于权值的导数),还有 count 之类的,我们只关注一个 data 就可以了吧。

solver.net.params[网络的名字][0]

  1. #solver.net.params为一个字典的数据类型,key值为layer 的名字,value为caffe的blob块的容器哦;
  2. solver.net.forward()
  3. #输出为:
  4. solver.net.params
  5. orderedDict([ ('conv1', <caffe._caffe.BlobVec at 0x7f7bffd68578>),
  6. ('conv2', <caffe._caffe.BlobVec at 0x7f7bde9ff6e0>),
  7. ('ip1', <caffe._caffe.BlobVec at 0x7f7bde968f80>),
  8. ('ip2', <caffe._caffe.BlobVec at 0x7f7bde968408>)])
  1. #下面,我们可以访问Blob块里的内容了。#们以conv1层为例子,具体如下:
  1.  
  1. #sover.net.params['conv1'][0]里面放是与连接权值相关的数据;可以通过下面方式访问:
  1. solver.net.params['conv1'][0].data
  1. solver.net.params['conv1'][0].diff
  1. #solver.net.params['conv1'][1]里面放的是与偏置相关的的值、导数等;可以通过下面方式访问:
  1. solver.net.params['conv1'][1].data
  1. solver.net.params['conv1'][1].diff
  1.  
  1. #同样,我们可以还可以通过它们进行 shape()、reshape()、transpose()等操作

前向传播与反向传播

进行一次前向传播:使用 solver.net.forward或 solver.test_nets[i].forward 语句: 它干了点什么呢?它把数据从输入层到最后的输出层传播了一个遍,把相应的每一层网络的输出值赋于blobs,网络输入的的数据个数为你的net的定义文件里的patch_size的大小。

  1. #训练数据作为输入,进行一次前向传播:
  2. solver.net.forward()
  1.  
  1. #假如有300个数据,我们的patch_size的大小为100,那么:
  1. solver.net.forward() #数据为1-100;
  1. solver.net.forward() #数据为101-200
  1. solver.net.forward() #数据为201-300
  1. solver.net.forward() #数据为1-100
  1. #另外,我们可以设置forward开始的地方,如下面所示:
  1. solver.net.forward(start ='conv1') #表示从conv1开始,这样的话,data层这不用传用新的数据了。

进行反向传播:使用:solver.net.forward,基本是都是我们的训练网络会进行反向传播的。反向传播做了点什么事呢?把会求出相应的导数啦,即blobs块里面的diff变量。

记住:它不会去更新权值与偏置的;

  1. # 进行一次反向传播
  2. solver.net.forward()

进行完整的一次计算(minibatch):solver.step(1):(包括数据的前向传播,误差反向传播,以及网络权值的update)

  1. #当我们完整地进行一次权值更新地时候,我们可以调用下面的语句
  2. #把意思就是:训练网络进行一次正向与反向传播,并进行更新权值与偏置;
  3. sover.step(n)表示进行n次训练。
  4.  
  5. # 表示进行n次训练。
  6. sover.step(n

注意:当我们用python接口运行caffe时,我们就可以控制它的Loop过程了,然后跟踪很多变量,干点自己想干的事啦等。 除此之外,与直接用caffe的C++代码且没有什么差别,并且在sover prototxt定义的相关操作都会进行的,如logging, snapshot, test等。

2017年3月10日添加,有点乱,没有整理:

  1.  
  1.  

solver.solve(), 会进行完整的梯度训练,直至在solver中规定的max_iter.

用 caffe_root/python/draw_net.py 画出 网络的结构图:

第一点:需要安装:graphviz, 可以直接通过 sudo apt-get install graphviz,安装就可以了。

第二点:安装pydot 模块,可以通过 pip pydot安装,注意:pydot 不支持python3, 所以,我们也可以安装 pydotplus来代替, pip install pydotplus;

现在,就可以运行 draw_net.py 画图了,例子如下:

./draw_net.py my_net.prototxt my_picture.png

caffe中,在训练过程中,关于进行snapshot的相关问题:

除了我们可以在solver.prototxt 文件里定义相关的snapshot外,我们呢,也可以在训练过程中,进行手动 保存;在进行snapshot时,会保存下面两个文件:

.caffemodel :

The caffemodel, which is output at a specified interval while training, is a binary contains the current state of the weights for each layer of the network.

.solverstate:

The solverstate, which is generated alongside, is a binary contains the information required to continue training the model from where it last stopped.

方法一: solver.snapshot(), 可以在训练过程中,手动进行snapshot.,它会保存 .caffenodel与 .solverstate两个文件;常用于进行恢复训练过程;(保存的路径为solver.prototxt 文件里面定义的路径)

方法二:net.save(), 它只会保存一下 .caffemodel文件,常用于进行测试时。 使用方法:如, net. save(‘my_path/my_weights.caffemodel’);

关于在pycaffe中载入solver.ptototxt 文件的问题:

两个方法:

第一,当使用 caffe.SGDSolver(‘solver文件’)时,无论你的solver文件中定义的solver_type是什么,都会用SGD方法;

第二,solver = caffe.get_solver(‘里面是solver.prototxt文件’);

怎么导入网络以及它的相关权值进行测试呢,可以这么做:

  1. 第一,直接进行导入权值进行测试时,我们可能用到:
  1. net = caffe.Net(网络的定义文件, caffemodel的权值保存文件,选择:caffe.TEST ,因为一个.prototxt文件中可以即定义train,也定义test,对应的caffe.TRAINcaffe.TEST.
  1. 如一个例子:
  1. net = caffe.Net('models/bvlc_reference_caffenet/deploy.prototxt',
  2. 'models/bvlc_reference_caffenet/bvlc_reference_caffenet.caffemodel',
  3. caffe.TEST)

第二,在预训练的基础上再训练网络时,我们不仅仅导入了预训练的权值,还导入 solver.prototxt

如果我们要在预训练的基础上再用新定义的solver.prototxt文件训练我们的网络,我们可以这么做:(区别就是我们不会随机初始化权值,而是直接导入pretrained的权值)

my_solver = caffe.get_solver(net_solver.prototxt)

my_solver.net.copy_from(pretraind.caffemodel)

2017年8月14日补:

solver.iter : 这是一个变量,它会标识了迭代次数;

caffe中python接口的使用的更多相关文章

  1. 机器学习caffe环境搭建——redhat7.1和caffe的python接口编译

    相信看这篇文章的都知道caffe是干嘛的了,无非就是深度学习.神经网络.计算机视觉.人工智能这些,这个我就不多介绍了,下面说说我的安装过程即遇到的问题,当然还有解决方法. 说下我的环境:1>虚拟 ...

  2. caffe的python接口学习(1):生成配置文件

    caffe是C++语言写的,可能很多人不太熟悉,因此想用更简单的脚本语言来实现.caffe提供matlab接口和python接口,这两种语言就非常简单,而且非常容易进行可视化,使得学习更加快速,理解更 ...

  3. caffe的python接口学习(7):绘制loss和accuracy曲线

    使用python接口来运行caffe程序,主要的原因是python非常容易可视化.所以不推荐大家在命令行下面运行python程序.如果非要在命令行下面运行,还不如直接用 c++算了. 推荐使用jupy ...

  4. Windows+Caffe+VS2013+python接口配置过程

    前段时间在笔记本上配置了Caffe框架,中间过程曲曲折折,但由于懒没有将详细过程总结下来,这两天又在一台配置较高的台式机上配置了Caffe,配置时便非常后悔当初没有写到博客中去,现已配置好Caffe, ...

  5. ubuntu16.04 安装caffe以及python接口

    http://blog.csdn.net/qq_25073253/article/details/72571714http://blog.csdn.net/greed7480/article/deta ...

  6. 【caffe】Caffe的Python接口-官方教程-00-classification-详细说明(含代码)

    00-classification 主要讲的是如何利用caffenet(与Alex-net稍稍不同的模型)对一张图片进行分类(基于imagenet的1000个类别) 先说说教程到底在哪(反正我是找了半 ...

  7. caffe 中 python 数据层

    caffe中大多数层用C++写成. 但是对于自己数据的输入要写对应的输入层,比如你要去图像中的一部分,不能用LMDB,或者你的label 需要特殊的标记. 这时候就需要用python 写一个输入层. ...

  8. Caffe: Caffe的Python接口

    官方参考:http://caffe.berkeleyvision.org/installation.html 官方介绍是这样的: Python The main requirements are nu ...

  9. caffe的python接口学习(8):caffemodel中的参数及特征的抽取

    如果用公式  y=f(wx+b) 来表示整个运算过程的话,那么w和b就是我们需要训练的东西,w称为权值,在cnn中也可以叫做卷积核(filter),b是偏置项.f是激活函数,有sigmoid.relu ...

随机推荐

  1. wpa supplicant 保存 wifi 设置

    wpa suppliclant使用wpa gui连接wifi后,下次开机的时,不能保存,需要从新手动进行连接. 自动保存方法: 配置文件/etc/wpa_supplicant.conf 添加 upda ...

  2. Oracle的日期时间范围查询

    Oracle日期时间范围查询 Sql代码 /* 日期时间范围查询 */ ---------- 创建日期时间测试表-------------------------------------------- ...

  3. Aggregate

    对序列应用累加器函数. /// <summary> /// 计算校验和,SUM /// </summary> public byte CalculateCheckSum(byt ...

  4. kafka java代码实现消费者

    public class KafkaConsumer { public static void main(String[] args) { Properties props = new Propert ...

  5. JQuery对象操作支持链式法则源码分析

    JQuery链式法则 何为链式法则?先给出非链式写法的例子 //非链式写法 $("div").css("width", 45px); $("div&q ...

  6. RDIFramework.NET ━ .NET快速信息化系统开发框架 V2.7 版本发布

    历时数月,RDIFramework.NET V2.7 版本发布了,感谢大家的支持. RDIFramework.NET,基于.NET的快速信息化系统开发.整合框架,为企业或个人在.NET环境下快速开发系 ...

  7. EBS创建相应的用户

    登陆EBS,依次点击"System Administrator"-->"Security"-->"User"-->&quo ...

  8. SQL数据库操作命令大全

    一.基础 1.说明:创建数据库CREATE DATABASE database-name 2.说明:删除数据库drop database dbname3.说明:备份sql server--- 创建 备 ...

  9. Oracle配置本地网络服务名

    Oracle安装完成后,可以使用客户端自带的的网络配置向导(Net Configuration Assistant)进行配置 1.启动Net Configuration Assistant.选择&qu ...

  10. 《zw版·Halcon-delphi系列原创教程》 Halcon分类函数004·edge,边缘处理

    <zw版·Halcon-delphi系列原创教程> Halcon分类函数004·edge,边缘处理 为方便阅读,在不影响说明的前提下,笔者对函数进行了简化: :: 用符号“**”,替换:“ ...