python实现图片提取文字功能

安装需要的包

# pip install pytesseract

# pip install Pillow

# 安装OCR环境

# 下载exe安装文件

# https://digi.bib.uni-mannheim.de/tesseract/

# 下载需要的版本,安装时下载需要的语言

# 安装完成后添加全局环境遍历 path

核心代码如下

from PIL import Image

import io

import pytesseract

pytesseract.pytesseract.tesseract_cmd = r'安装OCR的地址\\tesseract.exe'

#img 为Image图片
#lan为获取的语言
#pytesseract.get_languages(config='') 获取下载的所有语言
#这里拼接了所有语言

try: 
ling= pytesseract.get_languages(config='') 
lan='' 
for k in ling: 
lan=f'{lan}+{k}' 
text = pytesseract.image_to_string(img, lang=lan) 

return text 

except : 

raise Exception("错误信息!")

如有好的方法还请多多指教

python实现图片提取文字功能的更多相关文章

C# 10分钟完成百度图片提取文字（文字识别）——入门篇
现在图片文字识别已经很成熟了,比如qq长按图片,点击图片识别就可以识别图片的文字,将不认识的.文字数量大的.或者不能赋值的值进行二次可复制功能. 我们现在就基于百度Ai开放平台进行个人文字识别,dem ...
Python实现图片转文字并翻译至剪切板
一.环境搭建: 1.PySimpleGUI: pip3 install pysimplegui 2.pytesseract需要有tesseract环境才行: 1. 先搭建tesseract: brew ...
Tesseract识别图片提取文字&字库训练
文中测试了3.0和4.0两个版本.发现3.0识别效率不准确,需要训练词库.4.0识别效率就比较高了,而且支持结果生成pdf.txt等格式.所以推荐使用4.0版本. 这个工具可以用在爬虫的时候获取验证码 ...
用python给图片添加文字（水印）
题目来源于:Python 练习册,每天一个小程序第0000题代码如下: #-*- coding:utf-8 -*- import PIL from PIL import Image from PI ...
【Windows】免费图片提取文字的方法
今天意外的看到一个可以提取图片中文字的网站,自己试了下,提取效果还不错网址为: https://zhcn.109876543210.com/ 现在有图片如下我想从中提取的文字 1.打开网址,上传图 ...
python给图片添加文字
如何用几行代码给图片加上想要的文字呢? 下面为大家说下实现过程. 关注公众号 "轻松学编程"了解更多. 有图如下,想添加自写的诗句诗句静安心野朝有赤羽暮落霞, 小舟载我湖旋停 ...
python实现图片文字提取，准确率高达99%，强无敌！！！
上次我使用的百度AI开放平台的API接口实现图片的转化,后来有许多小伙伴都私信问我,怎么获取百度AI平台的AK和SK.为了统一回答大家的问题,今天我又使用百度API实现了一个从图片中提取文字和识别身份 ...
使用 Python 识别并提取图像中的文字
1. 介绍介绍使用 python 进行图像的文字识别,将图像中的文字提取出来,可以帮助我们完成很多有趣的事情. 2. 必备工具 tesseract-ocr 下载地址: https://github. ...
Python实现给图片加水印功能
前言最近忙得连轴转,很久没更新博客了,代码倒是没啥写,积累了好些东西,接下来一有时间就来更新吧~ 本文记录使用Python实现给图片添加水印的功能实现过程先看效果把公众号的封面作为素材原图是这 ...
本图片处理类功能非常之强大可以实现几乎所有WEB开发中对图像的处理功能都集成了，包括有缩放图像、切割图像、图像类型转换、彩色转黑白、文字水印、图片水印等功能
import java.awt.AlphaComposite; import java.awt.Color; import java.awt.Font; import java.awt.Graphic ...

随机推荐

如何通过Java代码将 PDF文档转为 HTML格式
虽然PDF文件适合用于打印和发布,但不适合所有类型的文档.例如,包含复杂图表和图形的文档可能无法在PDF中呈现得很好.但是HTML文件可以在任何可运行浏览器的计算机上进行阅读并显示.并且HTML还具有 ...
linux PXE和无人值守
目录一.pxe概念二.pxe相关服务三.pxe装机流程四.pxe四大文件五.无人值守六.实验自动装机一.pxe概念概念:PXE(预启动执行环境)是由Intel公司开发的网络引导技术, ...
vscode 配置代码自动格式化加修复
子曰:"工欲善其事,必先利其器", 编码必须的就是有一个顺手的ide,然而光有还不行,还要懂得配置,毕竟不同的团队代码规范不同,如目前用得较多的就是eslint,今天就顺便记录下v ...
WPF 入门笔记 - 03 - 样式基础及控件模板
原学习路线是按照圣殿骑士的<WPF基础到企业应用系列>的路线走的,但是布局之后直接依赖属性学起来有些僵硬,不太好理解,尝试了文章的前部分内容后放弃,调整为本篇博文内容.笔记路线将按照痕迹g ...
【Python&RS】GDAL对栅格数据重采样/对齐栅格
GDAL(Geospatial Data Abstraction Library)是一个在X/MIT许可协议下的开源栅格空间数据转换库.它利用抽象数据模型来表达所支持的各种文件格式.它 ...
【有奖调研】HarmonyOS新物种，鸿蒙流量新阵地——元服务邀你来答题！
"聊技术无话不谈,一起来吹吹元服务!畅聊你对元服务的想法,说不定,你就能撬动元服务的爆发增长!" 元服务(即原子化服务)是华为"轻量化"服务的新物种,可提供全新 ...
Python编程和数据科学中的人工智能：如何创建复杂的智能系统并提高模型性能
目录 1. 引言 2. 技术原理及概念 3. 实现步骤与流程 4. 应用示例与代码实现讲解标题:<Python编程和数据科学中的人工智能:如何创建复杂的智能系统并提高模型性能> 1. 引 ...
C++面试八股文：知道std::unordered_set/std::unordered_map吗？
某日二师兄参加XXX科技公司的C++工程师开发岗位第27面: 面试官:知道std::unordered_set/std::unordered_map吗? 二师兄:知道.两者都是C++11引入的新容器, ...
微调用于多语言 ASR 的 MMS 适配器模型
新内容 (06/2023): 这篇博文受到 "在多语言 ASR 上微调 XLS-R" 的强烈启发,可以看作是它的改进版本. Wav2Vec2 是自动语音识别 (ASR) 的预训练模 ...
kali问题排查
kali从2020的更新到最新版就卡在了启动界面猜想会不会是内核的问题,选择到这个最新内核就可以正常进入系统了由于觉得这样启动太过于麻烦,想办法把这个内核作为默认启动内核,从网上了解到要修改/et ...

python实现图片提取文字功能

python实现图片提取文字功能的更多相关文章

随机推荐

热门专题