win10编译tensorflow C++接口
原文地址:https://www.bearoom.xyz/2018/08/28/win10-build-tf-cc/
首先,我觉得这是一个比较DT的活,因为,tensorflow支持最好的编程语言应该是python(应该说大部分深度学习框架支持的最好的语言都是Python),tensorflow的底层说是C/C++编写的,但是,感觉它对C/C++真的很不友好,有关Python的资料一查一大把,有关C/C++的一查寥寥无几,能看到的还有很多直接就照搬官网的那点少到可怜的例子...由于我可能会比较多的用C/C++来开发,所以,有点希望用上C/C++的API,所以才有了这篇笔记。
好了,就不废话了,在此先推荐一篇之前参考的文章,写得比较清楚了,但是我觉得可能还有点不太准确,或者说我没遇到的问题,或者说我不是这么解决的。
OK,废话不多说,直接上方法:
1、需要准备的东西
首先是软件:
1)、CMake Gui,我这里用的是CMake 3.11.0,基本上3.0以上的应该都OK;VS2015(社区版免费的,基本就可以了);
2)、CUDA9.0以及配套的cudnn7(深度学习必备精品,用CPU的那就不需要了);
3)、Anaconda,官网或者去清华镜像下载(python大蟒蛇的绝佳工具,学习和使用深度学习技术应该还是有必要弄一个的吧);
4)、swigwin-3.0.12(这个我不太清楚是干啥的,但是有用);
5)、梯子(梯子可以解决我参考的那篇博客提到的某些问题,当然这些问题其实也可以用博客的方法解决的);
6)、源码(我下载的是tensorflow1.8的,因为我电脑上装的就是tensorflow1.8 Python版本的);
7)、Git(这很重要,编译过程中要下载文件的,就是通过Git);
2、Cmake源码
以上材料和开发环境我就默认是装好的,Anaconda比较好办,参考我之前的一篇笔记,有很简单粗暴易行的方法,其他方法发也很简单,基本能搜到N多教程。然后解压下载下来的源码,用Cmake GUI打开,并设置源码路径和Cmake出来的工程路径:
然后按左下角的 ,配置工程,然后回报错的:
这里是由于没有设置SWIG的路径,SWIG再官网下载后解压出来就可以了,然后添加到
中,然后再次点击Configure再配置一遍,然后就修改一些项目
tensorflow项里面,有梯子的话就可以这样做:
如果没有梯子的话就这样:
没有GPU的话就把tensorflow_ENABLE_GPU也去掉吧。
然后再次点击Configure配置一边工程,没有报错的话就点击generate生成工程。
3、VS2015编译
用VS2015打开vs14_project/tensorflow.sln工程,整个工程Cmake出来时包含274个项目在里面:
首先修改配置属性,改为x64下的Release(因为Anaconda的时Release的,没有Debug,所以这里最好编译Release的,Debug可能会有错误,而且编译一个就差不多9G+了,不想尝试编译Debug了),之后需要修改前面五个文件的配置属性:
配置好后修改一个文件tensorflow\contrib\boosted_trees\lib\utils\sparse_column_iterable.cc,将第99~101行注释掉,改为:
bool operator<( const IndicesRowIterator& other ) const {
QCHECK_LT( iter_, other.iter_ );
return ( row_idx_ < other.row_idx_ );
}
然后就右击解决方案生成解决方案,这个过程会超级久,因为还要下载很多依赖项,甚至回有一点卡,我查了下任务管理器,主要时比较耗内存和CPU,CPU占有几乎快满了。然后我是会出现一个问题,跟tf_core_gpu_kernel编译不过有关的(看了下错误,感觉应该时跟访问权限有关,我的CUDA和VS都是装在C盘的,应该就导致访问权限不足,目测是这个原因),这个时候就关闭VS,然后以管理员身份运行VS2015,然后再打开tensorflow工程,然后点编译解决方案(不要重新编译,点编译就可以,不然又得花很多时间),然后这一项会编译很久,超级久的,以至于我都一度怀疑人生。然后还有一个DT的事情,tf_core_kernel编译的时候是很容易出现“compiler is out of heap space”导致这一项编译失败,然后就会出现别的问题,这个时候就是再点编译项目就可以了,再次编译但是不是重新编译,然后就可以了,因为在编译这一项的时候是很占CPU的,CPU几乎就爆满了,所以容易出现问题。
基本上这么做之后就可以编译通过了,但是我这边会有一个错误,跟Python API有关的,tf_python_api这一项我没有编译过,还是报了“cmd.exe”的错误,可能是跟我已经装了tensorflow的python版有关吧,具体没有查,因为这不是我的目的,况且我电脑上已经有tensorflow的Python版,所以这个我就忽略了,也不是很需要这个。
接下来就是打包头文件和lib文件、dll文件,在解决方案中找到INSTALL工程,右键单独对其进行编译,编译完成之后就回把相关的头文件、lib文件、dll文件和exe文件(如果需要的话可以找我要打包出来的文件,编译这个还挺花时间的)。
编译好之后做一下小的测试,试验一下是不是可以用。
4、测试
首先,新建一个控制台应用程序,然后在工程中添加打包出来的头文件和lib文件的路径,代码如下:
#include "stdafx.h"
COMPILER_MSVC
#define NOMINMAX
#include <vector>
#include <Eigen/Dense>
#include "tensorflow/core/public/session.h"
#include "tensorflow/cc/ops/standard_ops.h"
#include "tensorflow/cc/ops/training_ops.h"
#include "tensorflow/core/framework/graph.pb.h"
using namespace tensorflow;
GraphDef CreateGraphDef()
{
Scope root = Scope::NewRootScope();
auto X = ops::Placeholder(root.WithOpName("x"), DT_FLOAT, ops::Placeholder::Shape({ -1, 2 }));
auto A = ops::Const(root, { { 3.f, 2.f },{ -1.f, 0.f } });
auto Y = ops::MatMul(root.WithOpName("y"), A, X, ops::MatMul::TransposeB(true));
GraphDef def;
TF_CHECK_OK(root.ToGraphDef(&def));
return def;
}
int main()
{
GraphDef graph_def = CreateGraphDef();
// Start up the session
SessionOptions options;
std::unique_ptr<Session> session(NewSession(options));
TF_CHECK_OK(session->Create(graph_def));
// Define some data.
// This needs to be converted to an Eigen Tensor to be
// fed into the placeholder.
// Note that this will be broken up into two
// separate vectors of length 2: [1, 2] and [3, 4],
// which will separately
// be multiplied by the matrix.
std::vector<float> data = { 1, 2, 3, 4 };
auto mapped_X_ = Eigen::TensorMap<Eigen::Tensor<float, 2, Eigen::RowMajor> >(&data[0], 2, 2);
auto eigen_X_ = Eigen::Tensor<float, 2, Eigen::RowMajor>(mapped_X_);
Tensor X_(DT_FLOAT, TensorShape({ 2, 2 }));
X_.tensor<float, 2>() = eigen_X_;
std::vector<Tensor> outputs;
TF_CHECK_OK(session->Run({ { "x", X_ } }, { "y" }, {}, &outputs));
// Get the result and print it out
Tensor Y_ = outputs[0];
std::cout << Y_.tensor<float, 2>() << std::endl;
session->Close();
getchar();
return 0;
}
程序的输出信息如下:
跟Python版一样,也是会先显示一段系统和硬件信息,然后是输出结果,关于代码中的变量和函数等都是什么意思,或者怎么样些一个C++的tensorflow程序,后面我再研究研究吧,不过我Python版都不太会写,所以就还是要花点时间。
给一个我编译好的CPU版本的,Release的,64位,版本是1.8.
win10编译tensorflow C++接口的更多相关文章
- ubuntu14 编译tensorflow C++ 接口
tensorflow1.11 bazel 0.15.2 protobuf 3.6.0 eigen 3.3.5 wget -t 0 -c https://github.com/eigenteam/eig ...
- 编译 TensorFlow 的 C/C++ 接口
TensorFlow 的 Python 接口由于其方便性和实用性而大受欢迎,但实际应用中我们可能还需要其它编程语言的接口,本文将介绍如何编译 TensorFlow 的 C/C++ 接口. 安装环境: ...
- Ubuntu16.04编译tensorflow的C++接口
原文:https://www.bearoom.xyz/2018/09/27/ubuntu1604buildtf4cpp/ 之前有一篇介绍到在windows下利用VS2015编译tensorflow的C ...
- 编译TensorFlow源码
编译TensorFlow源码 参考: https://www.tensorflow.org/install/install_sources https://github.com/tensorflo ...
- win10安装Tensorflow
win10安装Tensorflow 前提: 保证你的pip>=8.1版本 否则利用python -m pip install -U pip 进行升级,或下载pip源文件 确定你的显卡是否支持c ...
- win10 安装 tensorflow 并运行helloworld
win10 安装 tensorflow 并运行helloworld 折腾了一下,在win10上成功安装tensorflow. 1 下载安装python,注意一定要是64位(比如python-3.5 ...
- 在Windows*上编译Tensorflow教程
背景介绍 最简单的 Tensorflow 的安装方法是在 pip 一键式安装官方预编译好的包 pip install tensorflow 通常这种预编译的包的编译参数选择是为了最大兼容性而不是为了最 ...
- 编译TensorFlow CPU指令集优化版
编译TensorFlow CPU指令集优化版 如题,CPU指令集优化版,说的是针对某种特定的CPU型号进行过优化的版本.通常官方给的版本是没有针对特定CPU进行过优化的,有网友称,优化过的版本相比优化 ...
- CentOS 6 编译 TensorFlow for Java 以及 Maven Pom
我们的系统环境 CentOS 6.5, JDK 1.8 更新yum源 $ yum update 安装 Python 2.7 $ yum install python27 python27-numpy ...
随机推荐
- netty权威指南学习笔记六——编解码技术之MessagePack
编解码技术主要应用在网络传输中,将对象比如BOJO进行编解码以利于网络中进行传输.平常我们也会将编解码说成是序列化/反序列化 定义:当进行远程跨进程服务调用时,需要把被传输的java对象编码为字节数组 ...
- maven在windows下的安装配置及手动引入oracle数据库jar包
一.maven的安装配置 注意:在进行如下配置之前,有个前提是你的java的jdk安装配置正确才行 1.首先,下载maven,网址http://maven.apache.org/download.cg ...
- 指令——history
作用:查看历史命令 一般用于查看已经输入执行过的命令,也可以作为自己练习时的指标衡量,因为在历史命令里有行号显示.
- Arduino函数
输入输出函数 pinMode(pin, mode)将数位脚位(digital pin)指定为输入或输出.如:pinMode(7,INPUT); // 将脚位 7 设定为输入模式 digitalWrit ...
- Lombok认知
Lombok的简介 Lombok是一款Java开发插件,公司项目到处使用,整体效果很棒,代码更干净.Java开发人员可以节省出重复构建,诸如hashCode和equals这样的方法以及各种业务对象模型 ...
- Mysql: if 结构
if结构 语法 if 条件1 then 语句1; elseif 条件2 then 语句2; ... else 语句n; # 可以不写 应用场合:应用在begin end 中 SEL ...
- P 1029 旧键盘
转跳点:
- windows driver 获取本地时间
#define ArrayLength 260 void MyGetLocalTime() { LARGE_INTEGER li_system; LARGE_INTEGER li_Local; cha ...
- storm on yarn安装时 提交到yarn失败 failed
最近在部署storm on yarn ,部署参考文章 http://www.tuicool.com/articles/BFr2Yvhttp://blog.csdn.net/jiushuai/artic ...
- 剑指offer_1.18_Day_2
怠惰怠惰,好好练练了要 二维数组中查找 在一个二维数组中(每个一维数组的长度相同),每一行都按照从左到右递增的顺序排序,每一列都按照从上到下递增的顺序排序.请完成一个函数,输入这样的一个二维数组和一个 ...