caffe特征提取/C++数据格式转换

它们都是键/值对（Key/Value Pair）嵌入式数据库管理系统编程库。
虽然lmdb的内存消耗是leveldb的1.1倍，但是lmdb的速度比leveldb快10%至15%，更重要的是lmdb允许多种训练模型同时读取同一组数据集。
因此lmdb取代了leveldb成为Caffe默认的数据集生成格式。

create_babyface.sh调用的convertData的源代码如下：

#include<sys/types.h>

#include<sys/stat.h>

#include<dirent.h>

#include <stdio.h>

#include<string.h>

#include <fstream>  // NOLINT(readability/streams)

#include <string>

#include <vector>

#include "boost/scoped_ptr.hpp"

#include "glog/logging.h"

#include "google/protobuf/text_format.h"

#include "stdint.h"

#include "caffe/proto/caffe.pb.h"

#include "caffe/util/db.hpp"

#include <opencv/cv.h>

#include <opencv/highgui.h>

using caffe::Datum;

using boost::scoped_ptr;

using std::string;

namespace db = caffe::db;

using namespace std;

const int kCIFARSize = 32;

const int kCIFARChannelBytes = 1024;

const int kCIFARImageNBytes = 3072;

const int kCIFARBatchSize = 1000;//1000 for a batch!

const int kCIFARTrainBatches = 5;

void read_image(std::ifstream* file, int* label, char* buffer) {

    char label_char;

    file->read(&label_char, 1);

    *label = label_char;

    file->read(buffer, kCIFARImageNBytes);

    return;

}

//Read IPLimage to the buffer

void read_image(

        IplImage* out, char* buffer,

        char* RC, char* GC, char* BC)

{

    int x,y;

    int idx =0;

    for(y = 0; y<out->height; y++){

        char *ptr= out->imageData + y * out->widthStep;

        for( x = 0;x< out->width;x++){

            idx =y*out->height + x;

            BC[idx]= ptr[3*x];

            GC[idx]= ptr[3*x+1];

            RC[idx]=  ptr[3*x+2]; //这样就可以添加自己的操作，这里我使三通道颜色一样，就彩色图转黑白图了

        }

    }

    memcpy( buffer ,RC, kCIFARChannelBytes*sizeof(char) );

    memcpy( buffer+ kCIFARChannelBytes*sizeof(char) ,      GC,kCIFARChannelBytes*sizeof(char) );

    memcpy( buffer+ kCIFARChannelBytes*sizeof(char)  *2, BC,kCIFARChannelBytes*sizeof(char) );

    return;

}

//Travel the folder and load the filelist!

//使用linux dirent遍历目录

 int traveldir(char* path ,int depth, vector<string > &FileList)

{

    DIR* d;// a

    struct dirent *file; struct stat  sb;

    if( !(d=opendir(path ) ) ){

        printf("Read path %s error,wishchin! ", path);

        return -1;

    }

    while( (file= readdir(d ) ) != NULL ) {

        if(0== strncmp(file->d_name,  ".", 1 ) ) continue;

        char filename[256];

        strcpy( filename , file->d_name );

        string  Sfilename(filename);string  Spath(path);

        Spath.append(Sfilename);

        FileList.push_back(Spath);

    }

    if( stat(file->d_name,  &sb)>=0 && S_ISDIR(sb.st_mode) && depth <=4 )

        traveldir(file->d_name,depth+1,FileList);

    closedir(d);

    return 1;

}

// convert the data to the lmdb format !

void convert_dataset(

        const string& input_folder,

        const string& output_folder,

        const string& db_type) {

    scoped_ptr<db::DB> train_db(db::GetDB(db_type));

    train_db->Open(output_folder + "/babyface_train_" + db_type, db::NEW);

    scoped_ptr<db::Transaction> txn(train_db->NewTransaction());

    char* path=new char[256];

    int depth=2;

    vector<string > FileList(0);

    // Data buffer

    int label;

    IplImage* ImageS;

    char str_buffer[kCIFARImageNBytes];

    char* RC=new char[kCIFARChannelBytes];

    char* GC=new char[kCIFARChannelBytes];

    char* BC=new char[kCIFARChannelBytes];

    Datum datum;

    datum.set_channels(3);

    datum.set_height(kCIFARSize);

    datum.set_width(kCIFARSize);

    //"Writing Training data"//载入训练数据

    LOG(INFO) << "Writing Training data";

    strcpy(path,( input_folder+(string)("train1") ).c_str() );

    traveldir( path , depth, FileList);

    for (int fileid = 0; fileid < kCIFARTrainBatches; ++fileid) {

        // Open files

        LOG(INFO) << "Training Batch " << fileid + 1;

        snprintf(str_buffer, kCIFARImageNBytes, "/data_batch_%d.bin", fileid + 1);

        //CHECK(data_file) << "Unable to open train file #" << fileid + 1;

        label=1;//The Batch has 10000 pics!

        for (int itemid = 0; itemid < kCIFARBatchSize; ++itemid) {

            ImageS =cvLoadImage( (FileList[ fileid*kCIFARTrainBatches + itemid] ).c_str() );

            read_image( ImageS, str_buffer, RC,  GC, BC);

            datum.set_label(label);//datum.set_label(label);

            datum.set_data(str_buffer, kCIFARImageNBytes);

            int length = snprintf(str_buffer,  kCIFARImageNBytes,

                                  "%05d", fileid * kCIFARBatchSize + itemid);

            string out;

            CHECK(datum.SerializeToString( &out)  )  ;

            txn->Put(string(str_buffer, length),  out);//The main sentence ,put data to the txn!

        }

    }

    strcpy(path,( input_folder+(string)("train0") ).c_str() );

    traveldir( path , depth, FileList);

    for (int fileid = 0; fileid < kCIFARTrainBatches; ++fileid) {

        LOG(INFO) << "Training Batch " << fileid + 1;

        snprintf(str_buffer, kCIFARImageNBytes, "/data_batch_%d.bin", fileid + 1);

        //CHECK(data_file) << "Unable to open train file #" << fileid + 1;

        label=0;//The Batch has 10000 pics!

        for (int itemid = 0; itemid < kCIFARBatchSize; ++itemid) {

            ImageS =cvLoadImage( (FileList[ fileid*kCIFARTrainBatches + itemid] ).c_str() );

            read_image( ImageS, str_buffer, RC,  GC, BC);

            datum.set_label(label);//datum.set_label(label);

            datum.set_data(str_buffer, kCIFARImageNBytes);

            int length = snprintf(str_buffer,  kCIFARImageNBytes,

                                  "%05d", fileid * kCIFARBatchSize + itemid);

            string out;

            CHECK(datum.SerializeToString( &out)  )  ;

            txn->Put(string(str_buffer, length),  out);//The main sentence ,put data to the txn!

        }

    }

    txn->Commit();

    train_db->Close();

    //写入测试数据！

    LOG(INFO) << "Writing Testing data";

    scoped_ptr<db::DB> test_db(db::GetDB(db_type));

    test_db->Open(output_folder + "/babyface_test_" + db_type, db::NEW);

    txn.reset(test_db->NewTransaction());

    strcpy(path,( input_folder+(string)("test1") ).c_str() );

    traveldir( path , depth, FileList);

    for (int fileid = 0; fileid < 2; ++fileid) {

        LOG(INFO) << "Training Batch " << fileid + 1;

        snprintf(str_buffer, kCIFARImageNBytes, "/data_batch_%d.bin", fileid + 1);

        label=1;//The Batch has 10000 pics!

        for (int itemid = 0; itemid < kCIFARBatchSize; ++itemid) {

            ImageS =cvLoadImage( (FileList[ fileid*2 + itemid] ).c_str() );

            read_image( ImageS, str_buffer, RC,  GC, BC);

            datum.set_label(label);//datum.set_label(label);

            datum.set_data(str_buffer, kCIFARImageNBytes);

            int length = snprintf(str_buffer,  kCIFARImageNBytes,

                                  "%05d", fileid * kCIFARBatchSize + itemid);

            string out;

            CHECK(datum.SerializeToString( &out)  )  ;

            txn->Put(string(str_buffer, length),  out);//The main sentence ,put data to the txn!

        }

    }

    strcpy(path,( input_folder+(string)("test0") ).c_str() );

    traveldir( path , depth, FileList);

    for (int fileid = 0; fileid < 2; ++fileid) {

        LOG(INFO) << "Training Batch " << fileid + 1;

        snprintf(str_buffer, kCIFARImageNBytes, "/data_batch_%d.bin", fileid + 1);

        label=0;//The Batch has 10000 pics!

        for (int itemid = 0; itemid < kCIFARBatchSize; ++itemid) {

            ImageS =cvLoadImage( (FileList[ fileid*2 + itemid] ).c_str() );

            read_image( ImageS, str_buffer, RC,  GC, BC);

            datum.set_label(label);//datum.set_label(label);

            datum.set_data(str_buffer, kCIFARImageNBytes);

            int length = snprintf(str_buffer,  kCIFARImageNBytes,

                                  "%05d", fileid * kCIFARBatchSize + itemid);

            string out;

            CHECK(datum.SerializeToString( &out)  )  ;

            txn->Put(string(str_buffer, length),  out);//The main sentence ,put data to the txn!

        }

    }

    txn->Commit();

    test_db->Close();

    cvReleaseImage(&ImageS);

    delete [] RC;delete [] GC;delete [] BC;

}

int main(int argc, char** argv) {

    if (argc != 4) {

        printf("This script converts the CIFAR dataset to the leveldb format used\n"

               "by caffe to perform classification.\n"

               "Usage:\n"

               "    convert_cifar_data input_folder output_folder db_type\n"

               "Where the input folder should contain the binary batch files.\n"

               "The CIFAR dataset could be downloaded at\n"

               "    http://www.cs.toronto.edu/~kriz/cifar.html\n"

               "You should gunzip them after downloading.\n");

    } else {

        google::InitGoogleLogging(argv[0]);

        convert_dataset(string(argv[1]), string(argv[2]), string(argv[3]));

    }

    return 0;

}

后记：目的是载入32×32的三通道图像，直接输入3072维的char向量进行训练，至于怎样训练网络，还得仔细查看一下。

后记：代码出现 coredump 问题，利用 gcc path/...bin -o coredemo -g ，出现caffe.pb.h 包含丢失现象，why？？？

caffe特征提取/C++数据格式转换的更多相关文章

zw版【转发·台湾nvp系列Delphi例程】Delphi 使用 HALCON库件COM控件数据格式转换
zw版[转发·台湾nvp系列Delphi例程]Delphi 使用 HALCON库件COM控件数据格式转换 Delphi 使用 HALCON库件COM控件数据格式转换,与IHObjectX接口有关 va ...
Java将其他数据格式转换成json字符串格式
package com.wangbo.util; import java.beans.IntrospectionException; import java.beans.Introspector; i ...
完善GDAL与OpenCV间的数据格式转换与影像分块读写
本博客为原创内容,未经博主允许禁止转载,商用,谢谢. 一.前言关于GDAL与openCV间的数据格式转换,在我之前的博客中已有简要说明,这里,由于最近工作上经常用到openCV里的函数进行图像处理, ...
页面输入的数据格式转换类：BaseAction（经常使用于Struts框架中）
在我们接收页面传来的数据时,这些数据都是以String类型接收的,所以要进行数据格式转换,这时候就能够统一为它们进行转换,并且在处理这些数据的类中能够继承ActionSupport类,然后让每个接收数 ...
SBC数据格式转换软件
北京博信施科技有限公司是一家专业从事数据格式转换.数据处理领域研发软件产品和解决方案实施的技术型公司.在当今信息时代,PDF文档格式是在Internet上进行电子文档发行和数字化信息传播的理想文档格式 ...
【C#/WPF】图像数据格式转换时，透明度丢失的问题
问题:工作中涉及到图像的数据类型转换,经常转着转着发现,到了哪一步图像的透明度丢失了! 例如,Bitmap转BitmapImage的经典代码如下: public static BitmapImage ...
NetworkX系列教程(11)-graph和其他数据格式转换
小书匠 Graph 图论学过线性代数的都了解矩阵,在矩阵上的文章可做的很多,什么特征矩阵,单位矩阵等.grpah存储可以使用矩阵,比如graph的邻接矩阵,权重矩阵等,这节主要是在等到graph后 ...
python pandas数据分析基础入门2——（数据格式转换、排序、统计、数据透视表）
//2019.07.18pyhton中pandas数据分析学习——第二部分2.1 数据格式转换1.查看与转换表格某一列的数据格式:(1)查看数据类型:某一列的数据格式:df["列属性名称&q ...
【转】在Python的struct模块中进行数据格式转换的方法
这篇文章主要介绍了在Python的struct模块中进行数据格式转换的方法,文中还给出了C语言和Python语言的数据类型比较,需要的朋友可以参考下 Python是一门非常简洁的语言,对于数据类型的表 ...

随机推荐

15.5.2 【Task实现细节】骨架方法的结构
尽管骨架方法中的代码非常简单,但它暗示了状态机的职责.代码清单15-11生成的骨架方法如下所示: [DebuggerStepThrough] [AsyncStateMachine(typeof(De ...
[系统资源攻略]IO第二篇
IO 磁盘通常是计算机最慢的子系统,也是最容易出现性能瓶颈的地方,因为磁盘离 CPU 距离最远而且 CPU 访问磁盘要涉及到机械操作,比如转轴.寻轨等.访问硬盘和访问内存之间的速度差别是以数量级来计算 ...
当svn检出项目检出一半时停止，如何继续检出
1.当svn检出项目时,发现中断,又不想重新检出可以在已检出的项目目录下右键 2.然后点击之后直接update你的项目就可以了
天翼云 RDS数据库操作
1.RDS数据库创建好之后点击RDS实例管理找到已下信息官方文档 -1:http://www.ctyun.cn/help/qslist/567 官方文档 -2:http://www.ctyun.cn ...
7.IDEA创建Web项目和Tomcat配置
IntelliJ IDEA Tomcat配置详解 Tomcat 7.0 和jdk1.8 一起使用一.创建web项目 1.1 创建工程 1.2 创建java web项目并创建web.xml文件 1 ...
android 权限清单
常用权限: 读写存储卡装载和卸载文件系统 android.permission.WRITE_EXTERNAL_STORAGE android.permission.READ_EXTERNAL_STOR ...
关于Excel导入导出POI工具类
import java.io.FileNotFoundException; import java.io.IOException; import java.io.InputStream; import ...
Spring MVC-表单（Form）标签-复选框集合（Checkboxes）示例（转载实践）
以下内容翻译自:https://www.tutorialspoint.com/springmvc/springmvc_checkboxes.htm 说明:示例基于Spring MVC 4.1.6. 以 ...
Qt 3D的研究（十）：描边渲染（轮廓渲染）以及Silhouette Shader
Qt 3D的研究(十):描边渲染(轮廓渲染)以及Silhouette Shader 之前写了两篇文章,介绍了我在边缘检測上面的研究.实际上.使用GPU对渲染图像进行边缘检測.前提是须要进行两遍渲染.前 ...
关于SharePoint讨论板的一些知识（2）--视图中的栏目
关于SharePoint讨论板的一些知识(2)--视图中的栏目新建讨论后,默认显示四个栏目:主题.创建者.答复和上次更新时间. 从功能区的当前视图能够看出这是默认的主 ...

caffe特征提取/C++数据格式转换

caffe特征提取/C++数据格式转换的更多相关文章

随机推荐

热门专题