python 识别图片中的汉字

我们就识别上面的汉字。

安装软件tesseract和python库

https://www.cnblogs.com/sea-stream/p/10961580.html

然后新建一个文件夹test,把上面那张图片放在文件夹里面，再新建一个test文件

写入如下内容

#coding=utf-

from PIL import Image

import pytesseract

#上面都是导包，只需要下面这一行就能实现图片文字识别

text=pytesseract.image_to_string(Image.open('xxx.png'),lang='chi_sim')

print(text)

目录如下：

运行可能会出现错误：

C:\Users\k\Desktop\test>python test.py

Traceback (most recent call last):

  File "test.py", line , in <module>

    text=pytesseract.image_to_string(Image.open('xxx.png'),lang='chi_sim')

  File "C:\Users\k\Anaconda3\lib\site-packages\pytesseract\pytesseract.py", line , in image_to_string

    }[output_type]()

  File "C:\Users\k\Anaconda3\lib\site-packages\pytesseract\pytesseract.py", line , in <lambda>

    Output.STRING: lambda: run_and_get_output(*args),

  File "C:\Users\k\Anaconda3\lib\site-packages\pytesseract\pytesseract.py", line , in run_and_get_output

    run_tesseract(**kwargs)

  File "C:\Users\k\Anaconda3\lib\site-packages\pytesseract\pytesseract.py", line , in run_tesseract

    raise TesseractError(status_code, get_errors(error_string))

pytesseract.pytesseract.TesseractError: (, 'Error opening data file C:\\Program Files (x86)\\Tesseract-OCR/tessdata/chi_sim.traineddata Please make sure the TESSDATA_PREFIX environment variable is set to the parent directory of your "tessdata" directory. Failed loading language \'chi_sim\' Tesseract couldn\'t load any languages! Could not initialize tesseract.')

因为tesseract-ocr默认不支持中文识别。将下载到的文件：chi_sim.traineddata 放到Tesseract-OCR安装目录 D:\Program Files (x86)\Tesseract-OCR\tessdata 下

链接：https://pan.baidu.com/s/1c-fveIYnm1sQHxX9WRpUZw
提取码：9ovq

再次运行

python test.py

下面是输出结果

C:\Users\k\Desktop\test>python test.py

风急天高猿啸衷′ 渚麦冒麦少丑弓飞口。

u边洛木萧萧下′ 不〖长江滚滚来。

万 悲禾火常作畜′ 年多病独登台。

艰难苦恨萦霜 渣倒新停澍酉木不=

参考：

https://www.cnblogs.com/lizhe860/p/8969171.html

https://blog.csdn.net/showgea/article/details/82656515

python 识别图片中的汉字的更多相关文章

python实战===用python识别图片中的中文
需要安装的模块 PIL pytesseract 需要下载的工具: http://download.csdn.net/download/bo_mask/10196285 因为之前百度云的链接总失效,所以 ...
python识别图片中的代码。
在看并发编程网的时候,有些示例代码是以图片的形式出现的,要是此时自己想复制下来的话,只能对着图片敲了,很不爽,于是搜了一下识别图片的网站,有! 把图片上传上去解析,下来txt文本,打开一看,大部分能解 ...
python识别图片中的信息
好好学习的第一步一心一意的干好一件事儿,问自己我做什么我怎么做做的结果是啥例子1 问题回答我做什么: 识别图片上的信息我怎么做: 百度+谷歌结果是啥: 完成识别 1 安装PIL pi ...
Python识别图片中的文字
1 import os,glob 2 def photo_compression(original_imgage,tmp_image_path): 3 '''图片备份.压缩:param origina ...
Python通过百度Ai识别图片中的文字
版本:python3.7 工作中有需要识别图片中的汗字,查看了半天大神们的博客,但没找到完全可以用的源码,经过自己的实践,以下源码可以实现: 创建应用首先你需要登录百度AI,选择文字识别,创建一个应 ...
Python识别网站验证码
http://drops.wooyun.org/tips/6313 Python识别网站验证码 Manning · 2015/05/28 10:57 0x00 识别涉及技术验证码识别涉及很多方面的内 ...
深入学习使用ocr算法识别图片中文字的方法
公司有个需求,简单点说需要从一张图片中识别出中文,通过python来实现,当然其他程序也行,只要能实现,而小编主要学习python,所以就提了python.一个小白在网上遨游了一天,终于找到一丝丝思绪 ...
python ocr图片中汉字识别
import os os.chdir("C:\Program Files (x86)\Tesseract-OCR") main = "Tesseract.exe d:/t ...
numpy 构建深度神经网络来识别图片中是否有猫
目录 1 构建数据 2 随机初始化数据 3 前向传播 4 计算损失 5 反向传播 6 更新参数 7 构建模型 8 预测 9 开始训练 10 进行预测 11 以图片的形式展示预测后的结果搭建简单神经网 ...

随机推荐

PAT-1015 Reversible Primes (20 分) 进制转换+质数
A reversible prime in any number system is a prime whose "reverse" in that number system i ...
网络知识（1）TCP/IP五层结构
图1 数据流向图 1,网络基础 1.1 发展古代:①烽火狼烟最为原始的0-1单bit信息传递:②飞鸽传书.驰道快马通信,多字节通信: 近代:①轮船信号灯:②无线电报[摩尔斯码]: 现代:①有线模拟通 ...
“df: cannot read table of mounted file systems”.
“df: cannot read table of mounted file systems”.“df -l” returned an error: “df: cannot read table of ...
原生js上传图片遇到的坑（axios封装）
后台给我写了一个上传图片的接口,自己用form表单测试成功接口可以正常跳转测试的代码: <!doctype html> <html lang="en"> ...
javamail "535 5.7.3 Authentication unsuccessful" 问题排查
有一家odm的服务器用Javamail发邮件的时候报错 Authentication unsuccessful 其他的有些又是正常的网上查了一下解决方法如下 JavaMailSenderImpl ...
MyBatis-Spring 学习笔记一 SqlSessionFactoryBean以及映射器类
MyBatis-Spring 是一个用来整合 MyBatis 和 Spring 框架的小类库,通过这个jar包可以将 MyBatis 代码地整合到 Spring 中. 使用这个类库中的类, Sprin ...
windows系统编辑过的脚本文件，在linxu上执行报错 /bin/sh^M: bad interpreter: No such file or directory
如题! 现象: 当时的场景是这样的:我在IDEA中编辑了项目中的脚本sh,然后利用maven打成zip包.把zip包上传到linux服务器解压运行. 当在linux服务器上运行该sh脚本文件时,提示错 ...
Vs2017 FrameWork EF Mysql Mvc 三层整合1
1 运行环境 vs2017 Net FromWork 4.6.2 手动版没有 ado.net 实体数据模型 2 NuGet MySql.Data.Entity 6.10.9, MySq ...
EF Migraiton错误解决
System.Runtime.Serialization.SerializationException: Type is not resolved for member 'Oracle.Managed ...
Python实现神经网络算法识别手写数字集
最近忙里偷闲学习了一点机器学习的知识,看到神经网络算法时我和阿Kun便想到要将它用Python代码实现.我们用了两种不同的方法来编写它.这里只放出我的代码. MNIST数据集基于美国国家标准与技术研究 ...

python 识别图片中的汉字

python 识别图片中的汉字的更多相关文章

随机推荐

热门专题