Tesseract是开源的OCR引擎,可以识别的图片里的文字,支持unicode(UTF-8)编码,100多种语言,需要下载相应语言的训练数据. 安装: 有两种方法,一种是通过编译源码,比较麻烦.我使用的是另外一种方法,在windows下,使用编译好的二进制文件. 安装文件下载地址:https://sourceforge.net/projects/tesseract-ocr-alt/files/ 最新训练数据下载地址:https://github.com/tesseract-ocr/tessda…