PaddleOCR之高性能Go语言实现OCR识别

最近为了让python语言能够直接调用PaddleOCR的C++的动态链接库，针对本人已经开源的PaddleOCR项目https://gitee.com/raoyutian/paddle-ocrsharp使用的PaddleOCR的C++动态库，进行了大量代码修改，修改后PaddleOCR，导出标准C函数接口，极大地方便了其他语言直接调用并进行OCR文字识别。

__declspec(dllexport) void Initializejson(char* modelPath_det_infer, char* modelPath_cls_infer, char* modelPath_rec_infer, char* keys, char* parameterjson);

  __declspec(dllexport) char* Detect(char* imagefile);

  __declspec(dllexport) char* DetectByte(char* imagebytedata, size_t* size);

  __declspec(dllexport) char* DetectBase64(char* imagebase64);

  __declspec(dllexport) char* DetectByteData(const char* img, int nWidth, int nHeight, int nChannel);

  __declspec(dllexport) void FreeEngine();

　　本文将介绍python ,go ,c#几种开发语言的识别结果。

一、pyhon：

import os

import ctypes

import Parameter

from ctypes import *

import json

from datetime import datetime

import numpy as np

paddleOCR=cdll.LoadLibrary(".\PaddleOCR.dll")#加载C++动态库

encode="gbk"

#传入OCR模型参数

root="./"

cls_infer =root+"/inference/ch_ppocr_mobile_v2.0_cls_infer"

rec_infer = root+"/inference/ch_PP-OCRv3_rec_infer"

det_infer = root+"/inference/ch_PP-OCRv3_det_infer"

ocrkeys = root+"/inference/ppocr_keys.txt"

#OCR识别参数对象，后面序列化为json字符串

parameter=Parameter.Parameter()

p_cls_infer=cls_infer.encode(encode)

p_rec_infer=rec_infer.encode(encode)

p_det_infer=det_infer.encode(encode)

p_ocrkeys=ocrkeys.encode(encode)

def main():

   #序列化参数为json字符串

    parameterjson= json.dumps(parameter,default=Parameter.Parameter2dict)

     #初始化OCR引擎，一次即可

    paddleOCR.Initializejson( p_det_infer,  p_cls_infer,  p_rec_infer,  p_ocrkeys, parameterjson.encode(encode))

    result=""

    paddleOCR.Detect.restype = ctypes.c_wchar_p #识别结果是宽字节编码，

    imagepath=os.path.abspath('.')+"\\image\\"

    imagefiles=os.listdir(imagepath)

    total=[]

    for image in imagefiles:

       imagefile=imagepath+image

       t1= datetime.utcnow()

       #调用OCR识别接口，调用的是文件路径接口

       result= paddleOCR.Detect(imagefile.encode(encode))

       t2=datetime.utcnow()

       c=t2-t1

       total.append(c)

       print("time:",c)

       print(result)

    print("平均时间:",   np.mean(total))

if __name__=="__main__":

    main()

    input()

　　Python直接调用C++的动态库进行OCR识别，相比python调用python的预测库进行OCR，性能提升了不少。

二、Go：

package main

import (

    "fmt"

    "syscall"

    "unsafe"

    "os"

    "bufio"

    "C"

)

// 获取字符串的长度指针

func lenPtr(s string) uintptr {

    return uintptr(len(s))

}

// 获取数字的指针

func intPtr(n int) uintptr {

    return uintptr(n)

}

// 获取字符串的指针

func strPtr(s string) uintptr {

    return uintptr(unsafe.Pointer(syscall.StringBytePtr(s)))

}

func main() {

 dll,err:= syscall.LoadDLL("PaddleOCR.dll")

 if err!=nil {

    fmt.Println(err)

    return

 }

 Initjson,err:=dll.FindProc("Initializejson")

 if err!=nil {

    fmt.Println(err)

    return

 }

 detect,err:=dll.FindProc("Detect")

 if err!=nil {

    fmt.Println(err)

    return

 }

Initjson.Call(strPtr("D:\\PaddleOCR\\deploy\\Go\\inference\\ch_PP-OCRv3_det_infer"),

strPtr("D:\\PaddleOCR\\deploy\\Go\\inference\\ch_ppocr_mobile_v2.0_cls_infer"),

strPtr("D:\\PaddleOCR\\deploy\\Go\\inference\\ch_PP-OCRv3_rec_infer"),

strPtr("D:\\PaddleOCR\\deploy\\Go\\inference\\ppocr_keys.txt"),strPtr("{}"))

 res, _, _:=detect.Call(strPtr("D:\\PaddleOCR\\deploy\\Go\\image\\test.jpg"))

  p_result := (*C.char)(unsafe.Pointer(res))

 ocrresult:= C.GoString(p_result)

 fmt.Println(ocrresult)

 input := bufio.NewScanner(os.Stdin)

 input.Scan()

}

go语言现学现卖。Go实现，主要采用CGo,syscall.LoadDLL("PaddleOCR.dll")

使用syscall.LoadDLL加载PaddleOCR.dll动态链接库。

三、C#

c#语言调用C++动态库，直接采用DllImport方法。


        [DllImport(PaddleOCRdllName, CallingConvention = CallingConvention.StdCall, SetLastError = true)]

        internal static extern void Initialize(string det_infer, string cls_infer, string rec_infer, string keys, OCRParameter parameter);

        [DllImport(PaddleOCRdllName, CallingConvention = CallingConvention.StdCall, SetLastError = true)]

        internal static extern void Initializejson(string det_infer, string cls_infer, string rec_infer, string keys, string parameterjson);

        [DllImport(PaddleOCRdllName, CallingConvention = CallingConvention.StdCall, SetLastError = true)]

        internal static extern IntPtr Detect(string imagefile);

        [DllImport(PaddleOCRdllName, CallingConvention = CallingConvention.StdCall, SetLastError = true)]

        internal static extern IntPtr DetectByte(byte[] imagebytedata, long size);

        [DllImport(PaddleOCRdllName, CallingConvention = CallingConvention.StdCall, SetLastError = true)]

        internal static extern IntPtr DetectBase64(string imagebase64);

        [DllImport(PaddleOCRdllName, CallingConvention = CallingConvention.StdCall, SetLastError = true)]

        internal static extern int FreeEngine();

开源项目地址： https://gitee.com/raoyutian/paddle-ocrsharp

更多内容，欢迎关注公众号，加入QQ群，了解更多内容。

PaddleOCR之高性能Go语言实现OCR识别的更多相关文章

【Win10 应用开发】OCR识别
OCR,即Optical Character Recognition,光学字符识别.以下介绍来自搜索: OCR(Optical Character Recognition,光学字符识别)是指电子设备( ...
Atitit ocr识别原理与概论 attilax总结
Atitit ocr识别原理与概论 attilax总结 1.1. Ocr的过程与流程1 1.2. OCR不同技术细分略有不同,但大概原理是一样的. 即主要技术过程是:二值化(又叫归一化)----- ...
基于Python实现对PDF文件的OCR识别
http://www.jb51.net/article/89955.htm https://pythontips.com/2016/02/25/ocr-on-pdf-files-using-pytho ...
OCR识别-python版（一）
需求:识别图片中的文字信息环境:windows系统开发语言:python 使用工具类:1.pyocr 2.PIL 3.tesseract-ocr 步骤: 1.pyocr 网络通直接使用命令:pip ...
以API方式调用C# dll，使用OneNote2013 sp1实现OCR识别本地图片
http://www.cnblogs.com/Charltsing/p/OneNoteOCRAPI.html OneNote2013 OCR API调用使用说明2019.4.17 使用说明:1.安装干 ...
AI时代的OCR识别技术浅析
人工智能这个词可谓是耳熟能详,近几年人工智能热潮再次席卷而来,引起轰动的要数google的AlphaGo,相继打败了围棋界的韩国选手李世石以及世界冠军柯洁,见证了人工智能发展的里程碑式的变革,人工智能 ...
OCR识别-python3.5版
刚接触,啥子都不会,按着教程走需求:识别图片中的文字信息环境:windows系统开发语言:python3.5 使用工具类:1.pyocr 2.PIL 3.tesseract-ocr 步骤: 1.p ...
基于百度云的OCR识别（Python）
2019年7月3日早上,在百度AI开发者大会上,一个来自山西的青年,将一瓶矿泉水浇在了同样来自山西的李彦宏身上. 可以回顾一下 https://b23.tv/av57665929/p1 ,着实让人一惊 ...
百度DMLC分布式深度机器学习开源项目（简称“深盟”）上线了如xgboost（速度快效果好的Boosting模型）、CXXNET（极致的C++深度学习库）、Minerva（高效灵活的并行深度学习引擎）以及Parameter Server（一小时训练600T数据）等产品，在语音识别、OCR识别、人脸识别以及计算效率提升上发布了多个成熟产品。
百度为何开源深度机器学习平台? 有一系列领先优势的百度却选择开源其深度机器学习平台,为何交底自己的核心技术?深思之下,却是在面对业界无奈时的远见之举. 5月20日,百度在github上开源了其 ...
基于Tesseract的OCR识别小程序
一.背景先说下开发背景,今年有次搬家找房子(2020了应该叫去年了),发现每天都要对着各种租房广告打很多电话.(当然网上也找了实地也找),每次基本都是对着墙面看电话号码然后拨打,次数一多就感觉非常麻 ...

随机推荐

B端架构升级之路
一.背景随着B端业务快速发展,系统愈趋复杂.我们发起了B端架构升级专项,基于B端业务的特点,从研发规范建设.B端架构基建.系统架构升级和落地保障等多方面提升了B端的架构水平. 二.升级思路架构是一 ...
Mac OS 中JDK 环境（jdk 1.8.0_831）安装配置、环境变量配置及卸载操作
前言: 摊牌了,本来就有点喜新厌旧的我,特意把系统和开发环境都拉到比较高,想试验一下兼容性和某些新特性,探索了一下新大陆,也见识了各种光怪陆离的妖魔鬼怪. 因为要着手云平台项目的重构改版和新系统的架构 ...
RocketMQ实战系列（一）——RocketMQ简介
RocketMQ是一款分布式消息引擎,由阿里巴巴旗下的MetaQ和RocketMQ合并而来.RocketMQ提供了高可靠.高吞吐量.可伸缩.易于使用的消息发布/订阅服务,适用于大规模分布式系统的消息通 ...
Mac搭建appium环境及python运行代码示例
Appium主要是通过调用安卓提供的接口来执行命令的,所以需要安装Java和安卓SDK. 1.安装Appium服务端 appium的服务端是基于node的,直接使用npm(node包管理器)安装即可, ...
急速上线 Serverless 钉钉机器人“防疫精灵”
新型冠状病毒疫情肆虐的春节,大家都过得人心惶惶,作为被关在家的程序狗,总觉得要做点什么.于是阿里云 IoT 事业部的几个同学就开始了防疫精灵的开发之路. 从点子到防疫宝,只花了一个下午时间:从防疫宝到 ...
龙蜥正式开源 SysOM：百万级实战经验打造！一站式运维管理平台 | 龙蜥技术
简介:SysOM集监控.告警.诊断.修复.安全能力于一体的操作系统运维平台. 文/系统运维 SIG 如果你被突如其来的 OOPS 和满屏奇怪的函数弄得满头问号?机器内存明明很大,却申请不出来内存 ...
dubbogo 3.0：牵手 gRPC 走向云原生时代
作者 | 李志信于雨来源|阿里巴巴云原生公众号自从 2011 年 Dubbo 开源之后,被大量中小公司采用,一直是国内最受欢迎的 RPC 框架.2014 年,由于阿里内部组织架构调整,Dubbo ...
Maxcompute造数据-方法详解
简介: 造一点模拟数据的方法概述造数据在一些奇怪的场合会被用到.一般我们是先有数据才有基于数据的应用场合,但是反过来如果应用拿到另外一个场景,没有数据功能是没有方法演示的.一般较为真实的数据,脱敏 ...
RDS PostgreSQL一键大版本升级技术解密
简介: 内容简要: 一.PostgreSQL行业位置二.PostgreSQL版本升级背景三.PostgreSQL版本升级解密四.PostgreSQL版本升级成果一.PostgreSQL行业位 ...
[FAQ] Sortable 拖拽组件, 火狐浏览器中打开新窗口问题
Q:用了 sortable 组件,在火狐浏览器中进行拖拽时,会打开新窗口 ? Sortable组件地址,https://github.com/SortableJS/Sortable 当前处理方式 ...

PaddleOCR之高性能Go语言实现OCR识别

PaddleOCR之高性能Go语言实现OCR识别的更多相关文章

随机推荐

热门专题