转：关于使用ImageMagick和Tesseract进行简单数字图像识别

据说Tesseract可是世界排名第三的OCR神器，2010年又更新了3.0版本。Tesseract原先是HP写的，现在Open Source了。

下面介绍怎么用Tesseract配合ImageMagick进行简单的数字图像识别。

首先Tesseract只能识别bmp，tif，所以先拿ImageMagick转换一下图像。注意得无压缩转换，否则Tesseract报错。

convert -compress none ./pict.gif./in1.tif

然后将图片灰度化-colorspace Gray，或者直接二值化-monochrome成黑白，这样识别率会高一点。

接下来裁剪出想要进行精确识别的部分：-crop widthxheight+x+y

比如-crop 320x40+0+1，从左上角开始坐标为(0,1)处，裁剪出320*40大小的图像。注意参数里是英文字母x，不是乘号*。

还有就是网上搜到的-depth 8和-alpha off参数，实践表明加不加效果不大。

一步完成就像这样：

convert -compress none-depth 8 -alpha off -crop 535x24+2+2 -monochrome ./pict.gif ./in1.tif

预处理完之后最好再放大一下，这次的样例放大到500%~600%的识别效率就能令人满意。

convert ./in1.tif -scale600% ./in2.tif

然后就可以开始用Tesseract进行识别了。

tesseract ./in2.tif ./1-l eng -psm 7

-l eng是选择语言，-psm 7是说源图像是只在一行上的文字。具体说明看Tesseract的帮助。

下面就是一些实例。

原图如下：

下面是二值化之后的效果，可以看见还是有些噪点的。

下面是灰度化之后的效果。

识别之后的结果是：

05093519038515450004738373775251263J91648J94318529731857

可以看到有些误报，针对这个问题又特殊处理一下误报字符，结果识别率在90%左右

参考资料：

ImageMagick: http://www.imagemagick.org

Tesseract: http://code.google.com/p/tesseract-ocr

转：关于使用ImageMagick和Tesseract进行简单数字图像识别的更多相关文章

使用ImageMagick和Tesseract进行简单数字图像识别
使用ImageMagick和Tesseract进行简单数字图像识别由于直接使用 tesseract 进行识别,识别率很低, ImageMagick 安装.配置及使用: 平台:winXP 1. 安装I ...
用imagemagick和tesseract-ocr破解简单验证码
用imagemagick和tesseract-ocr破解简单验证码 Tesseract-ocr据说辨识程度是世界排名第三,可谓神器啊. 准备工作: 1.安装tesseract-ocr sudo apt ...
百度 OCR API 的使用以及与 Tesseract 的简单对比
目录百度 OCR API 初探用 Python 调用百度 OCR API 与 Tesseract 的简单对比百度 OCR API 初探近日得知百度在其 APIStore 上开放了 OCR 的 ...
利用Python进行简单的图像识别（验证码）
这是一个最简单的图像识别,将图片加载后直接利用Python的一个识别引擎进行识别将图片中的数字通过 pytesseract.image_to_string(image)识别后将结果存入到本地的txt ...
通过Tesseract实现简单的OCR
Tesseract 简介 Tesseract 的 OCR 引擎最先由 HP 实验室于 1985 年开始研发,至 1995 年时已经成为 OCR 业内最准确的三款识别引擎之一.然而,HP 不久便决定放弃 ...
Tesseract OCR简单实用介绍
做字符识别,不能不了解google的Tesseract-OCR,但是如何在自己的工程中使用其API倒是语焉不详,官网上倒是很详尽地也很啰嗦地介绍如何重新编译生成适合自己平台的lib和dll,经过近些天 ...
验证码识别 Tesseract的简单使用和总结
Tesseract是什么 OCR即光学字符识别,是指通过电子设备扫描纸上的打印的字符,然后翻译成计算机文字的过程.也就是说通过输入图片,经过识别引擎,去识别图片上的文字.Tesseract是一种适用于 ...
Tesseract：简单的Java光学字符识别
1.1 介绍开发具有一定价值的符号是人类特有的特征.对于人们来说识别这些符号和理解图片上的文字是非常正常的事情.与计算机那样去抓取文字不同,我们完全是基于视觉的本能去阅读它们. 另一方面,计算机的工 ...
[Solution] 简单数字识别之Tesseract
图像识别涉及的理论:傅里叶变换,图形形态学,滤波,矩阵变换等等. Tesseract的出现为了解决在没有这些复杂的理论基础,快速识别图像的框架. 准备: 1.样本图像学习,预处理 (平均每1个元素出现 ...

随机推荐

数字pid笔记（1）
针对stm32中可以如下实现: p->IncrementVal = (p->Kp * (p->err - p->err_next)) + (p->Ki * p->e ...
stm32独立看门狗实验
//ALIENTEK Mini STM32开发板V1.9范例代码5//独立看门狗实验//正点原子@ALIENTEK//技术论坛:www.openedv.com STM32F103RBT6属于中容量版本 ...
POJ 1791 Parallelogram Counting（求平行四边形数量）
Description There are n distinct points in the plane, given by their integer coordinates. Find the n ...
Java获得字节码对象的三种方式
1.Class 类的forName方法 Class clazz = Class.forName("com.test.Test"); 该方法要注意的是会抛出一个ClassNotFou ...
NO_PUBKEY
* 现象:$ sudo apt-get update时警告如下: W: GPG error: http://ppa.launchpad.net precise Release: The followi ...
UIAutomator输入中文
之前一直是英文的测试环境,包括手机也是英文的,app也是英文的,涉及不到中文输入法的东西.但现在在写中文的app,所以需要输入中文.看到网上的解决办法如下: 下载https://github.com/ ...
rocketmq源码分析3-consumer消息获取
使用rocketmq的大体消息发送过程如下: 在前面已经分析过MQ的broker接收生产者客户端发过来的消息的过程,此文主要讲述订阅者获取消息的过程,或者说broker是怎样将消息传递给消费者客户端的 ...
Spring Cloud(2.0)能力大致列表
微服务九大特性出自Martin Fowler的<Microservices> 服务组件化按业务组织团队做"产品"的态度智能端点与哑管道去中心化治理去中心化管 ...
Leetcode34--->Search for a Range(在排序数组中找出给定值出现的范围)
题目:给定一个排序数组,找出给定的target值出现的范围:算法复杂度要求在O(logn);如果没有找到,则返回[-1, -1]; 举例: For example,Given [5, 7, 7, 8, ...
django model的设计
1 设计blog的显示界面: 在blog/admin.py修改 from django.contrib import admin from blog.models import BlogPost # ...

转：关于使用ImageMagick和Tesseract进行简单数字图像识别

转：关于使用ImageMagick和Tesseract进行简单数字图像识别的更多相关文章

随机推荐

热门专题