最近研究C#相关的OCR技术，图像识别一般C和C++这种底层语言做的比较多，C#主要是依托一些封装好的组件进行调用，这里介绍三种身份证识别的方法。

一：调用大公司API接口，百度、云脉，文通科技都有相关的API介绍。

二：调用图像处理类库，EmguCV是OpenCV的一个跨平台的.Net封装，该封装也可以被编译到Mono平台和允许在Windows、Mac OS、Android、iPhone、iPad等多个平台上运行

三：调用Office2007 组件

一、证件识别API接口

以聚合数据中的API接口为例，因为官方API没有提供C#的调用方式，网址如下：证件识别接口

/// <summary>

/// 上传图片

/// </summary>

/// <returns></returns>

public static string CardUpload()

{

    try

    {

        string appkey = "网站自己申请的key"; //配置您申请的appkey

        HttpPostedFile file = HttpContext.Current.Request.Files[0];

        string url = "http://api2.juheapi.com/cardrecon/upload";

        var parameters = new Dictionary<string, string>();

        parameters.Add("key", appkey);

        parameters.Add("cardType", "2");

        string result = HttpPostData(url, 60000, "pic", file.InputStream, parameters);

        JObject info = JObject.Parse(JObject.Parse(result)["result"].ToString());

        var cardInfo = new

        {

            name = info["姓名"],

            card = info["公民身份号码"]

        };

        return cardInfo.ToJson();

    }

    catch (Exception ex)

    {

        return ex.ToString();

    }

}

/// <summary>

/// Post调用API

/// </summary>

/// <param name="url">api地址</param>

/// <param name="timeOut">访问超时时间</param>

/// <param name="fileKeyName">文件参数名</param>

/// <param name="file">文件流</param>

/// <param name="stringDict">参数列表</param>

/// <returns>结果集</returns>

private static string HttpPostData(string url, int timeOut, string fileKeyName,

                           Stream file, Dictionary<string, string> stringDict)

{

    string responseContent;

    var memStream = new MemoryStream();

    var webRequest = (HttpWebRequest)WebRequest.Create(url);

    // 边界符

    var boundary = "---------------" + DateTime.Now.Ticks.ToString("x");

    // 边界符

    var beginBoundary = Encoding.ASCII.GetBytes("--" + boundary + "\r\n");

    // 最后的结束符

    var endBoundary = Encoding.ASCII.GetBytes("--" + boundary + "--\r\n");

    // 设置属性

    webRequest.Method = "POST";

    webRequest.Timeout = timeOut;

    webRequest.ContentType = "multipart/form-data; boundary=" + boundary;

    //写入开始边界符

    memStream.Write(beginBoundary, 0, beginBoundary.Length);

    // 写入文件

    const string filePartHeader =

        "Content-Disposition: form-data; name=\"{0}\"; filename=\"{1}\"\r\n" +

         "Content-Type: application/octet-stream\r\n\r\n";

    var header = string.Format(filePartHeader, fileKeyName, "card.jpg");

    var headerbytes = Encoding.UTF8.GetBytes(header);

    memStream.Write(headerbytes, 0, headerbytes.Length);

    file.CopyTo(memStream);

    // 写入字符串的Key

    var stringKeyHeader = "\r\n--" + boundary +

                           "\r\nContent-Disposition: form-data; name=\"{0}\"" +

                           "\r\n\r\n{1}\r\n";

    foreach (byte[] formitembytes in from string key in stringDict.Keys

                                     select string.Format(stringKeyHeader, key, stringDict[key])

                                         into formitem

                                         select Encoding.UTF8.GetBytes(formitem))

    {

        memStream.Write(formitembytes, 0, formitembytes.Length);

    }

    // 写入最后的结束边界符

    memStream.Write(endBoundary, 0, endBoundary.Length);

    webRequest.ContentLength = memStream.Length;

    // 构造完毕，执行POST方法

    var requestStream = webRequest.GetRequestStream();

    memStream.Position = 0;

    var tempBuffer = new byte[memStream.Length];

    memStream.Read(tempBuffer, 0, tempBuffer.Length);

    memStream.Close();

    requestStream.Write(tempBuffer, 0, tempBuffer.Length);

    requestStream.Close();

    var httpWebResponse = (HttpWebResponse)webRequest.GetResponse();

    using (var httpStreamReader = new StreamReader(httpWebResponse.GetResponseStream(),

                                                    Encoding.GetEncoding("utf-8")))

    {

        responseContent = httpStreamReader.ReadToEnd();

    }

    httpWebResponse.Close();

    webRequest.Abort();

    return responseContent;

}

二、EmguCV类库调用

环境搭建

下载地址：EmguCV官网

在File类别下下载这个EXE，进行安装，安装后在目录下能找相应组件，还有些应用的案例。

C#进行识别，需进行图片二值化处理和OCR调用相关DLL可在我整理的地址下载：360云盘提取码：89f4

dll文件夹中的dll引用到C#项目中，x64，x86，tessdata对应OCR识别的类库和语言库，我tessdata中已添加中文语言包，将这三个文件夹放入程序执行文件夹中。

Demo

自己做的小Demo如图：身份证图片是百度上下载的

相关代码如下：

using System;

using System.Collections.Generic;

using System.ComponentModel;

using System.Data;

using System.Drawing;

using System.Linq;

using System.Text;

using System.Windows.Forms;

using Emgu.CV;

using Emgu.CV.OCR;

using Emgu.CV.Structure;

using System.IO;

namespace ImageManage

{

    public partial class Form1 : Form

    {

        Image<Gray, Byte> imageThreshold;

        public Form1()

        {

            InitializeComponent();

        }

        private void btn_convert_Click(object sender, EventArgs e)

        {

            //第一个参数是语言包文件夹的地址，不写默认在执行文件夹下

            Tesseract _ocr = new Tesseract("", "chi_sim", OcrEngineMode.TesseractOnly);

            _ocr.Recognize(imageThreshold);

            String text = _ocr.GetText();

            this.textBox1.Text = text;

        }

        private void pictureBox1_Click(object sender, EventArgs e)

        {

            OpenFileDialog of = new OpenFileDialog();

            of.Title = "请选择图片";

            if (of.ShowDialog() == DialogResult.OK)

            {

                string file = of.FileName;

                Image img = Image.FromFile(file);

                pictureBox1.Image = img;

            }

            Bitmap bitmap = (Bitmap)this.pictureBox1.Image;

            Image<Bgr, Byte> imageSource = new Image<Bgr, byte>(bitmap);

            Image<Gray, Byte> imageGrayscale = imageSource.Convert<Gray, Byte>();

            imageGrayscale = randon(imageGrayscale);

            imageThreshold = imageGrayscale.ThresholdBinary(new Gray(100), new Gray(255));

            this.pictureBox2.Image = imageThreshold.ToBitmap();

        }

        /// <summary>

        /// 旋转校正

        /// </summary>

        /// <param name="imageInput"></param>

        /// <returns></returns>

        private Image<Gray, Byte> randon(Image<Gray, Byte> imageInput)//图像投影旋转法倾斜校正子函数定义

        {

            int nwidth = imageInput.Width;

            int nheight = imageInput.Height;

            int sum;

            int SumOfCha;

            int SumOfChatemp = 0;

            int[] sumhang = new int[nheight];

            Image<Gray, Byte> resultImage = imageInput;

            Image<Gray, Byte> ImrotaImage;

            //20度范围内的调整

            for (int ang = -20; ang < 20; ang = ang + 1)

            {

                ImrotaImage = imageInput.Rotate(ang, new Gray(1));

                for (int i = 0; i < nheight; i++)

                {

                    sum = 0;

                    for (int j = 0; j < nwidth; j++)

                    {

                        sum += ImrotaImage.Data[i, j, 0];

                    }

                    sumhang[i] = sum;

                }

                SumOfCha = 0;

                for (int k = 0; k < nheight - 1; k++)

                {

                    SumOfCha = SumOfCha + (Math.Abs(sumhang[k] - sumhang[k + 1]));

                }

                if (SumOfCha > SumOfChatemp)

                {

                    resultImage = ImrotaImage;

                    SumOfChatemp = SumOfCha;

                }

            }

            return resultImage;

        }

    }

}

三、Office 2007组件

该组件免费而且识别度比较高。

环境搭建

Office 2007组件MODI，需要安装Ofiice2007，且由于兼容性需要安装补丁，SP1或者SP2都行，补丁下载地址如下：

SP1下载地址 SP2下载地址

安装后控制面板-->卸载或更新程序-->选择Office2007-->选择更改-->选择添加或修复功能-->弹出下面界面，运行相应组件。

将Office工具-->Microsoft Office Document Imaging 下的工具运行

在C#项目中引用Com组件即可：

如果Office组件应用不是在本地程序而需要部署在IIS上，还需将应用程序的应用池的权限设置为如下图所示：程序应用池-->高级设置-->标识

Demo

StringBuilder sb = new StringBuilder();

MODI.Document doc = new MODI.Document();

doc.Create(fullFileName);

MODI.Image image;

MODI.Layout layout;

doc.OCR(MODI.MiLANGUAGES.miLANG_CHINESE_SIMPLIFIED, true, true);  // 识别文字类型

for (int i = 0; i < doc.Images.Count; i++)

{

    image = (MODI.Image)doc.Images[i];

    layout = image.Layout;

    sb.Append(layout.Text);

}

以上即一些C#进行身份证识别的方法，可根据自己项目的不同需求进行选用。

C#身份证识别相关技术的更多相关文章

Android安卓身份证识别SDK
一.Android安卓身份证识别SDK应用背景这些年,随着互联网金融的极速发展,第三方支付.理财.P2P网贷.征信等APP应用成爆发式的增长,在众多APP中都涉及到对身份证信息的录入,如第三方支付. ...
baidu-aip-SDK node.js 身份证识别
最近项目中客户需要实现身份证识别功能,合理计划了之后决定使用百度ai的身份证识别. 身份证识别是文字识别的一种,类似的功能有很多比如驾驶证识别等等,原理都是相同的. 对于前端初学者来说,如果要实现这种 ...
JavaScript对SVG进行操作的相关技术
原文地址:http://www.ibm.com/developerworks/cn/xml/x-svgscript/ 本文主要介绍在 SVG 中通过编程实现动态操作 SVG 图像的知识. SVG ...
身份证识别OCR，开启视频模式扫一扫即可识别身份证信息
文章摘要:身份证识别等证件识别OCR技术在各个行业得到广泛应用,例如:车险移动查勘会用到身份证识别.行驶证识别.车架号识别: 寿险移动展业会用到名片识别.银行卡识别:电信实名制代理网点采集身份证信息会 ...
百度OCR文字识别-身份证识别
简介一.介绍身份证识别 API 接口文档地址:http://ai.baidu.com/docs#/OCR-API/top 接口描述用户向服务请求识别身份证,身份证识别包括正面和背面. 请求说明 ...
SLAM+语音机器人DIY系列：（七）语音交互与自然语言处理——1.语音交互相关技术
摘要这一章将进入机器人语音交互的学习,让机器人能跟人进行语音对话交流.这是一件很酷的事情,本章将涉及到语音识别.语音合成.自然语言处理方面的知识.本章内容: 1.语音交互相关技术 2.机器人语音交互 ...
Android Study 玩转百度ocr身份证识别不是梦~
前言 Today,由于昨晚喝蒙了,今天晕乎乎的为大家带来如何快速集入ocr身份证识别. 关于ocr的前世今生这里不做过多的说明,百度一抓一大把. 前期准备百度AI开放平台ocr地址: https:/ ...
开发ActiveX控件调用另一个ActiveX系列0——身份证识别仪驱动的问题
程序员要从0下表开始,这篇是介绍这个系列的背景的,没有兴趣的人可以直接跳过. 为什么要开发ActiveX控件由于工作需要,我们开发了一个网站,使用了一款身份证识别仪的网页ActiveX(OCX)插件 ...
TCP-IP-part7-IP协议相关技术（一）
仅凭IP是无法完成通信的,需要一些IP的辅助技术.这些技术的包格式可能不一样,但它们都是基于IP地址进行的,都是通过匹配路由表来进行的,只是功能不一样.例如DHCP分配IP地址,它只管通知这条信息,具 ...

随机推荐

[ZigBee] 12、ZigBee之看门狗定时器——饿了就咬人的GOOD DOG
引言:硬件中的看门狗,不是门卫的意思,而是一只很凶的狗!如果你不按时喂它,它就会让系统重启!这反而是我们想要的功能~ 1.看门狗概述看门狗定时器(WDT,Watch Dog Timer)是单片机的一 ...
用批处理文件进行TCP/IP设置,方便在家与办公IP切换
在公司用公司分配的固定IP上网,回家后又要将本本设置为家里的固定IP上网,每次都要手动重复一个过程: 打开网络中心,选择本地连接,进入属性然后选择IPV4进行TCP/IP的设置,填入IP,子网掩码DN ...
EF架构~二级域名中共享Session
回到目录对于一个有点规模的网站,都会有各个子网站,说是子网站,其实也都是独立的站点,一般通过二次域名来分开,如www.zzl.com,它可以有很多子网站,如image.zzl.com,file.zz ...
Java六大问题你都懂了吗？
这些问题对于认真学习java的人都要必知的,当然如果你只是初学者就没必要那么严格了,那如果你认为自己已经超越初学者了,却不很懂这些问题,请将你自己重归初学者行列. 一.到底要怎么样初始化! 本问题讨论 ...
Piwik 扩展获取客户端IP地址
piwik 数据库浏览记录存放在piwik_log_visit表中 piwik_log_visit 表有个location_ip字段,该字段存储为Byte[]字节解析出来后的IP地址为 XXX.XX ...
CI Weekly #2 | 如何优化开发流程，实现项目持续集成？
原文首发于 flow.ci Blog >> 链接,转载请联系:) CI Weekly 围绕『软件工程效率提升』进行一系列技术内容分享,包括国内外持续集成.持续交付,持续部署.自动化测试 ...
发布iOS应用程序到苹果APP STORE完整流程
参考:http://blog.csdn.net/mad1989/article/details/8167529(xcode APP 打包以及提交apple审核详细流程(新版本更新提交审核)) http ...
sql分组(orderBy、GroupBy)获取每组前一(几)条数据
sql数据库实现分组并取每组的前1(几)条数据测试数据准备工作: 根据某一个字段分组取最大(小)值所在行的数据: 创建表并且插入数据 ),Val )) , 'a1--a的第一个值') , 'b2b2 ...
Linux快速入门01-基础概念
4年多前,刚到上海时报过一个关于Oracle的培训班,在那里接触到了Linux,不过一直都没真正去试着使用它.现在经过慢慢的成长,越来越觉得,Linux是每一个服务端工程师必须掌握的系统,即使是现在最 ...
StringUtils 的用法
1.public static boolean isEmpty(String str) 判断某字符串是否为empty,标准是 null == str 或 str.length() == 0 2.pub ...

C#身份证识别相关技术

一、证件识别API接口

二、EmguCV类库调用

环境搭建

Demo

三、Office 2007组件

环境搭建

Demo

C#身份证识别相关技术的更多相关文章

随机推荐

热门专题