一,OCR OCR,即Optical Character Recognition,光学字符识别,通过扫描字符,分析形状,然后将其翻译成电子文本的过程.tesserocr是Python的一个OCR识别库,但其实是对tesseract做的一层封装.安装tesserocr之前需要先按照tesseract. 二,准备工具 安装库tesserocr,windows下安装前需要下载安装tesseract, tesseract下载地址:https://digi.bib.uni-mannheim.de/tess