win10 vs2015源码编译tesseract4.0
1.安装软件
安装完毕后,需要将cmake.exe和cppan.exe加入环境变量PATH中
cmake简介
CMake全称为“cross platform make”,是一个开源的跨平台自动化构建系统。使用指定名为CMakeLists.txt的配置文件可以控制软件的构建、测试和打包等流程。同时,通过编写平台无关的CMakeLists.txt文件进行简单的配置,CMake就能生成对应目标平台的构建文件。例如:linux系统的makefile文件、Windows的项目和解决方案(.sln)。
配置包括: 创建哪些项目、项目间的依赖关系、include哪些头文件、编译时生成静态库,动态库还是可执行文件、以及生成的版本: (x86,x64)等。
cppan简介
CPPAN是建立在CMake之上具有构建系统功能的跨平台C / C ++依赖管理器。 它支持快速的脚本式编码和原型制作以及处理大型项目。 可以很方便的查找、共享和重用库以及发布您的项目。你只需要将时间花在代码上,而不需要管理依赖关系。 CPPAN帮您将包装时间降低至几秒钟!它支持简单的交叉编译,继承并且把你自己的设置、标志推送到每个依赖。
CPPAN之于C++就像Maven之于Java。CPPAN可以理解为C++的包管理器,包含了众多依赖包,只需要向CPPAN指定依赖包,CPPAN就会帮你下载好需要的依赖包和相关配置。
CPPAN通过cppan.yml文件配置相关依赖项目。
通过dependencies指令说明依赖项,这里依赖leptoncia,对应的版本为1,这里1表示1.*.*,也就是主版本为1的都可以。
2. 生成解决方案(.sln)
下载tesseract源码:
git clone https://github.com/tesseract-ocr/tesseract tesseract
生成x64版本的解决方案
cd tesseract # 进入源代码目录
cppan # 下载相关的的依赖,【下载时间可能很长,需要耐心等待】
mkdir win64 && cd win64
cmake .. -G "Visual Studio 14 2015 Win64"
生成x86版本的解决方案
cd tesseract
cppan
mkdir build && cd build
cmake ..
3. 编译
这里选择x64版本, 打开win64目录下的tesseract.sln,这里选择release模式。选择”生成" -> "生成解决方案"
编译过程中会遇到很多错误,如C2001和C3668,如图:
g_set_error (error, G_KEY_FILE_ERROR,
G_KEY_FILE_ERROR_UNKNOWN_ENCODING,
_("Key file contains unsupported "
"encoding “%s”"), value_utf8); # 上面代码中出现了中文双引号
错误的原因:
其实都是文件编码问题。下载得到的文件编码为UTF-8(不带签名),而Visual Studio (中文版)默认保存的文本文件是GB2312编码,对于UTF-8编码的某些字符,在中文版VS下就容易因解码错误导致乱码造成编译错误。
解决方法: 只需要双击对应的错误,跳转到对应的文件,然后点击左上角菜单 “文件选项" 下的"高级保存选项",选择unicode(utf-8带签名).保存后再“生成"即可。
需要修改的文件:
UTF-8 带签名或者UTF-8 无签名区别:
带签名比无签名开头多了BOM 信息,UTF-8 的 BOM 是 0xEFBBBF,带签名的将更容易被解析器以正确的编码方式进行解析。
建议:
先"生成”项目"cppan-d-b-d", 再“生成"整个解决方案
遇到错误,双击错误,进入错误提示行后,点击左上角菜单 “文件"下的"高级保存选项",选择unicode(utf-8带签名).保存后右击项目选择"生成",逐个解决错误。
效果:
4.安装
找到CMakeTargets中的INSTALL,然后右键选择仅限于项目–>仅生成INSTALL
此外, 还需要将win64\bin\Release目录下的dll拷贝到install\bin目录下
64位默认安装位置为C:/Program Files/tesseract,因此安装需要管理员权限
错误提示如下:
修改程序安装位置
# 通过指定CMAKE_INSTALL_PREFIX设置安装目录
cmake -D CMAKE_INSTALL_PREFIX=D:/tesseract/install -G "Visual Studio 14 2015 Win64" ..
打开解决方案所在目录下的CMakeCache.txt, 查看CMAKE_INSTALL_PREFIX 配置修改是否生效。
5. 环境变量配置
- 将tesseract.exe所在路径加入环境变量PATH中
- 添加环境变量TESSDATA_PREFIX,其值为tessdata目录所在路径
训练文件下载下载地址: https://github.com/tesseract-ocr/tessdata
没有设置TESSDATA_PREFIX,在命令行使用tesseract会出现如下提示:
参考: https://github.com/tesseract-ocr/tesseract/wiki/Compiling#windows
win10 vs2015源码编译tesseract4.0的更多相关文章
- win10 vs2015源码编译opencv、opencv_contrib、Tesseract
1.软件包准备 opencv源码包地址: 官网 github opencv_contrib源码包地址: github Tesseract源码包地址: ...
- 解决从源码编译ncurses6.0编译lib_gen.c报错的问题
直接从官网的源码编译时,会提示报错: gcc -DHAVE_CONFIG_H -I. -I../include -D_GNU_SOURCE -DNDEBUG -O2 --param max-inlin ...
- Win10 使用MinGW-w64编译Tesseract4.0
一开始尝试使用mingw+msys编译tesseract, 但是苦于mingw-get安装的软件版本都太旧,要安装新版本只能下载源码编译安装. 在编译过程中遇到了很多麻烦,最后还遇到了包直接循环依赖问 ...
- hadoop-1.2.0源码编译
以下为在CentOS-6.4下hadoop-1.2.0源码编译步骤. 1. 安装并且配置ant 下载ant,将ant目录下的bin文件夹加入到PATH变量中. 2. 安装git,安装autoconf, ...
- hadoop-2.0.0-mr1-cdh4.2.0源码编译总结
准备编译hadoop-2.0.0-mr1-cdh4.2.0的同学们要谨慎了.首先看一下这篇文章: Hadoop作业提交多种方案 http://www.blogjava.net/dragonHadoop ...
- 英蓓特Mars board的android4.0.3源码编译过程
英蓓特Mars board的android4.0.3源码编译过程 作者:StephenZhu(大桥++) 2013年8月22日 若要转载,请注明出处 一.编译环境搭建及要点: 1. 虚拟机软件virt ...
- 源码编译安装 PHP5.5.0,解决curl_exec访问HTTPS返回502错误的问题(修改PATH路径)
最近碰到一个奇怪的问题, PHP使用 curl_exec 访问 HTTPS 网页时, 返回502错误, 访问HTTP网页时没有问题, 用 echo phpinfo() ; 查看, 支持op ...
- hadoop-2.6.0源码编译问题汇总
在上一篇文章中,介绍了hadoop-2.6.0源码编译的一般流程,因个人计算机环境的不同, 编译过程中难免会出现一些错误,下面是我编译过程中遇到的错误. 列举出来并附上我解决此错误的方法,希望对大家有 ...
- Ubantu16.04进行Android 8.0源码编译
参考这篇博客 经过测试,8.0源码下载及编译之后,占用100多G的硬盘空间,尽量给ubantu系统多留一些硬盘空间,如果后续需要在编译好的源码上进行开发,需要预留更多的控件,为了防止后续出现文件权限问 ...
随机推荐
- 关于实时监听input的值得变化的问题
onchange 关于input的onchange事件 其实是有出发条件的 并非实时监听的 1.鼠标点击事件 或者键盘事件(tab和wins键都可以触发 enter在ie9时不触发,火狐和ch ...
- Java学习笔记(4)
比较两个String时,用==比较两个String是否引用同一个对象,s1.equals(s2)比较两个对象的内容是否相同,也可以用s1.compareTo(s2)来确定两个String的内容是否相同 ...
- B-食物链-经典并查集
动物王国中有三类动物A,B,C,这三类动物的食物链构成了有趣的环形.A吃B, B吃C,C吃A. 现有N个动物,以1-N编号.每个动物都是A,B,C中的一种,但是我们并不知道它到底是哪一种. 有人用两种 ...
- 定时清理elasticsearch
索引这种格式 以下脚本加入crontab #每天清理es数据 0 1 * * * /data/sh/rm_esindex.sh >> /data/logs/crontab/rm_esind ...
- 作为程序员你不知道中国互联网300强你就OUT了!
很多程序员们工作一段时间之后,都想跳槽到综合实力更强的公司以获取高薪资或者接触到前沿的技术,但是哪些行业值得我们投入大量的时间,哪些公司属于我们行业中的佼佼者呢, 那么小编给您分析下2018年中国互联 ...
- Spring XML文件配置
singleton不能创建多对象(默认) <?xml version="1.0" encoding="UTF-8"?> <beans xmln ...
- git教程:删除文件
在Git中,删除也是一个修改操作,我们实战一下,先添加一个新文件test.txt到Git并且提交: $ git add test.txt $ git commit -m "add test. ...
- C#中简单操作SQLserver数据库(ADO.NET的简单应用)
本篇文章以 ADO.NET 访问SQL SERVER 数据库为例, 其中需用System.Data.SqlClient; 数据库连接字符串写法为:server=数据源(服务器名称);uid=用户名;p ...
- QT | 一些学习心得
1. 如何使控件随着窗口大小变化而自动填充? 选中控件中最外层的那个控件,如centralWidget(不要去选中内部的小控件,这样能够保证内部的相对位置) 然后对centralWidget选择布局方 ...
- python 8
一.文件操作初识 1. path 文件路径 F:\文件.txt encoding 编码方式 utf-8, gbk ... mode 操作方式 只读,只写,读写,写读,追加... f1 = open(r ...