阿里云OCR图片转换成文字识别调用

using Newtonsoft.Json;

using System;

using System.Collections.Generic;

using System.Drawing;

using System.Drawing.Imaging;

using System.IO;

using System.Linq;

using System.Net;

using System.Net.Security;

using System.Security.Cryptography.X509Certificates;

using System.Text;

namespace Common.Utils

{

    public static class OCRUtil

    {

        private const String Host = "https://ocrapi-document.taobao.com";

        private const String Path = "/ocrservice/document";

        private const String Method = "POST";

        private const String Appcode = "************";

        private static readonly IList<string> ImageExList = new List<string>()

        {

            ".jpg",

            ".png",

            ".bmp"

        };

        /// <summary>

        /// 确保图片可用

        /// </summary>

        /// <param name="fileName"></param>

        private static void EnsureImageCanUse(string fileName)

        {

            if (string.IsNullOrWhiteSpace(fileName))

            {

                throw new ArgumentNullException(nameof(fileName), "文件名为空");

            }

            if (!File.Exists(fileName))

            {

                throw new FileNotFoundException("文件不存在", fileName);

            }

            string ex = System.IO.Path.GetExtension(fileName);

            if (ImageExList.IndexOf(ex.ToLower()) == -)

            {

                throw new FileFormatException("图片格式需为jpg，png，bmp");

            }

            FileInfo fileInfo = new FileInfo(fileName);

            if (fileInfo.Length >  *  * )

            {

                throw new Exception("文件不能大于4M");

            }

        }

        /// <summary>

        /// 将图片转换为Base64字符串

        /// </summary>

        /// <param name="fileName"></param>

        /// <returns></returns>

        private static string ImageToBase64String(string fileName)

        {

            Bitmap bitmap = new Bitmap(fileName);

            string ex = System.IO.Path.GetExtension(fileName).ToLower();

            using (MemoryStream ms = new MemoryStream())

            {

                ImageFormat format;

                switch (ex)

                {

                    case ".png":

                        format = ImageFormat.Png;

                        break;

                    case ".jpg":

                        format = ImageFormat.Jpeg;

                        break;

                    default:

                        format = ImageFormat.Bmp;

                        break;

                }

                bitmap.Save(ms, format);

                byte[] arr = new byte[ms.Length];

                ms.Position = ;

                ms.Read(arr, , (int)ms.Length);

                ms.Close();

                return Convert.ToBase64String(arr);

            }

        }

        /// <summary>

        /// 阿里云OCR图片转文字

        /// </summary>

        /// <param name="fileName"></param>

        /// <returns></returns>

        public static string ImageToText(string fileName)

        {

            EnsureImageCanUse(fileName);

            String querys = "";

            String bodys = "{\"img\":\"" + ImageToBase64String(fileName) + "\",\"url\":\"\",\"prob\":false}";

            String url = Host + Path;

            HttpWebRequest httpRequest = null;

            HttpWebResponse httpResponse = null;

            if ( < querys.Length)

            {

                url = url + "?" + querys;

            }

            if (Host.Contains("https://"))

            {

                ServicePointManager.ServerCertificateValidationCallback = new RemoteCertificateValidationCallback(CheckValidationResult);

                httpRequest = (HttpWebRequest)WebRequest.CreateDefault(new Uri(url));

            }

            else

            {

                httpRequest = (HttpWebRequest)WebRequest.Create(url);

            }

            httpRequest.Method = Method;

            httpRequest.Headers.Add("Authorization", "APPCODE " + Appcode);

            //根据API的要求，定义相对应的Content-Type

            httpRequest.ContentType = "application/json; charset=UTF-8";

            if ( < bodys.Length)

            {

                byte[] data = Encoding.UTF8.GetBytes(bodys);

                using (Stream stream = httpRequest.GetRequestStream())

                {

                    stream.Write(data, , data.Length);

                }

            }

            httpResponse = (HttpWebResponse)httpRequest.GetResponse();

            if (httpResponse.StatusCode != HttpStatusCode.OK)

            {

                throw new WebException("阿里云OCR接口调用识别失败");

            }

            Stream st = httpResponse.GetResponseStream();

            StreamReader reader = new StreamReader(st, Encoding.GetEncoding("utf-8"));

            string responseStr = reader.ReadToEnd();

            OcrResult ocrResult = JsonConvert.DeserializeObject<OcrResult>(responseStr);

            return OcrResultToString(ocrResult);

        }

        private static string OcrResultToString(OcrResult ocrResult)

        {

            StringBuilder sb = new StringBuilder();

            var wordList = ocrResult.prism_wordsInfo;

            foreach (var item in wordList)

            {

                int leftX = item.pos[].x;

                int blankSpaceCount = (int)Math.Floor((double)leftX / );

                if (blankSpaceCount > )

                {

                    sb.Append(' ', blankSpaceCount*);

                }

                sb.AppendLine(item.word);

            }

            return sb.ToString();

        }

        public static bool CheckValidationResult(object sender, X509Certificate certificate, X509Chain chain, SslPolicyErrors errors)

        {

            return true;

        }

    }

    /// <summary>

    /// OCR识别结果

    /// </summary>

    public class OcrResult

    {

        public string sid { get; set; }

        public string prism_version { get; set; }

        public int prism_wnum { get; set; }

        public List<Prism_Wordsinfo> prism_wordsInfo { get; set; }

        public int height { get; set; }

        public int width { get; set; }

        public int orgHeight { get; set; }

        public int orgWidth { get; set; }

    }

    public class Prism_Wordsinfo

    {

        public string word { get; set; }

        public IList<Pos> pos { get; set; }

    }

    public class Pos

    {

        public int x { get; set; }

        public int y { get; set; }

    }

}

阿里云OCR图片转换成文字识别调用的更多相关文章

利用百度AI OCR图片识别，Java实现PDF中的图片转换成文字
序言:我们在读一些PDF版书籍的时候,如果PDF中不是图片,做起读书笔记的还好:如果PDF中的是图片的话,根本无法编辑,做起笔记来,还是很痛苦的.我是遇到过了.我们搞技术的,当然得自己学着解决现在的痛 ...
使用阿里云的图片识别成表格ocr（将图片表格转换成excel）
为了简便财务总是要对照着别人发来的表格图片制作成自己的表格图片识别识别成表格表格识别 ocr 使用阿里云api 购买(印刷文字识别-表格识别) https://market.aliyun.com ...
ABBYY如何把图片转换成pdf格式
在制作工作文件的时候,有时候会遇到需要进行文件格式转换的情况,比较常见的文件格式转换就包含了Office与pdf格式之间的转换.但除此之外,图片与pdf格式也是可以进行转换的,那么图片要怎么操作,才能 ...
教你一招：Word中的文字转换成表格，把表格转换成文字
在使用office软件时,常常会在Word中加入表格,这时候我们一般想到的是,建立表格,然后一格一格的填写;或者用Excel表格制作在复制到Word文档中.其实在Word中就可以将文本文档转换成电子表 ...
UI进阶科大讯飞(1) 语音听写(语音转换成文字)
一.科大讯飞开放平台: http://www.xfyun.cn/ 注册.登录之后创建新应用. 因为本项目只实现了语音听写,所以在SDK下载中心勾选语音听写单项SDK就可以了开发平台选择iOS,应用选 ...
jpg、png格式的图片转换成webp后颜色失真的问题
今天简单的试用了一下 cweb.exe 将 jpg, png 格式的图片转换成 webp 格式. 我今天下载的是当前最新版:1.0.0 cwebp 3.jpg -q 85 -o 3.webp 发现图 ...
使用CSS将图片转换成黑白(灰色、置灰)z转
小tip: 使用CSS将图片转换成黑白(灰色.置灰) by zhangxinxu from http://www.zhangxinxu.com 本文地址:http://www.zhangxinxu.c ...
[转]C#将image中的显示的图片转换成二进制
本文转自:http://www.cnblogs.com/shuang121/archive/2012/07/09/2582654.html .将Image图像文件存入到数据库中我们知道数据库里的Im ...
小tip: 使用CSS将图片转换成模糊(毛玻璃)效果
去年盛夏之时,曾写过“小tip: 使用CSS将图片转换成黑白”一文,本文的模式以及内容其实走得是类似路线.CSS3 → SVG → IE filter → canvas. 前段时间,iOS7不是瓜未熟 ...

随机推荐

css样式的继承性、层叠性、优先级
一.css样式的继承性: 作用:给父元素设置一些属性,子元素也可以使用应用场景: 一般用于设置网页上的一些共性信息,例如网页的文字颜色,字体,文字大小等内容.优化代码,降低工作量注意点: 1.并不 ...
Challenges-XSS
https://alf.nu/alert1 warmup adobe JSON
提升机器学习数学基础，这7本书一定要读-附pdf资源
文章发布于公号[数智物语] (ID:decision_engine),关注公号不错过每一篇干货. 来源 | KDnuggets 作者 | Ajit Jaokar 转自 | 新智元编辑 | 大明 [编 ...
geopyspark入门
背景对于GIS的大数据量实时数据分析和渲染的需求,ArcGIS Server和Geoserver.普通空间数据库往往难以满足,对此我一直感觉很沮丧.这时就要寻求大数据的分布式框架帮助.(Ar ...
基于OpenStreetMap计算驾车距离（Java）
最近公司有个项目需要计算6000个点之间的驾车距离,第一时间想到的是利用Google的Distance Matrix API,但是免费Key每天只能计算2500个元素(元素 = 起点数量 * 终点数量 ...
Android音视频之AudioTrack播放音频(二)
前一篇讲了如何录制wav音频文件,本篇就来讲讲如何播放wav文件,这里就是使用AudioTrack来播放音频,确切的说是播放pcm格式数据,使用AudioTrack播放也没什么难度,主要就是将数据写入 ...
github常见操作和常见错误！错误提示：fatal: remote origin already exist
如果输入$ git remote add origin git@github.com:djqiang(github帐号名)/gitdemo(项目名).git 提示出错信息:fatal: remote ...
CentOS_关机与重启命令详解
Linux centos关机与重启命令详解 Linux centos重启命令: 1.reboot 2.shutdown -r now 立刻重启(root用户使用) 3.shutdown -r 10 过 ...
sqlite数据库如何远程连接?
sqlite数据库如何远程连接代码如下:QSqlDatabase db =QSqlDatabase::addDatabase("QSQLITE"); db.setHostName( ...
sql 语句获取某张表某列字段最短的某几行数据
sql 语句获取某张表某列字段最短的某几行数据 SELECT C_name,C_code FROM Catalog where LEN(C_code)=LEN((SELECT top 1 C_cod ...

阿里云OCR图片转换成文字识别调用

阿里云OCR图片转换成文字识别调用的更多相关文章

随机推荐

热门专题