一. 应用背景 OCR(Optical Character Recognition)文字识别技术的应用领域主要包括:证件识别.车牌识别.智慧医疗.pdf文档转换为Word.拍照识别.截图识别.网络图片识别.无人驾驶.无纸化办公.稿件编辑校对.物流分拣.舆情监控.文档检索.字幕识别文献资料检索等.OCR文字识别主要可以分为:印刷体文字识别和手写体文字识别.文字识别方法的一般流程为:识别出文字区域.对文字区域矩形分割成不同的字符.字符分类.识别出文字.后处理识别矫正. 二. 文字检测 文字检测是文字…
[训练测试过程记录]Faster-RCNN用于场景文字检测 原创 2017年11月06日 20:09:00 标签: 609 编辑 删除 写在前面:github上面的Text-Detection-with-FRCN项目是基于py-faster-rcnn项目在场景文字识别领域的扩展. 和py-faster-rcnn相比,该项目的主要改动为:将检测类别换成了背景和文字,并且更改了数据集. 对于初学者而言,要实现一个自己的baseline,第一步可以尝试训练别人已经实现了的网络,看看整个的运行流程是怎么…
参考链接:https://github.com/argman/EAST (项目来源) https://github.com/opencv/opencv/issues/12491  (遇到的问题)   https://www.pyimagesearch.com/2018/08/20/opencv-text-detection-east-text-detector/   (opencv加载) 文字检测有很多比较好的现成的模型比如yolov3,pesnet,pennet,east.不一一赘述,讲一下自…
论文提出了新的少样本目标检测算法,创新点包括Attention-RPN.多关系检测器以及对比训练策略,另外还构建了包含1000类的少样本检测数据集FSOD,在FSOD上训练得到的论文模型能够直接迁移到新类别的检测中,不需要fine-tune   来源:晓飞的算法工程笔记 公众号 论文: Few-Shot Object Detection with Attention-RPN and Multi-Relation Detector 论文地址:https://arxiv.org/abs/1908.0…
文字定位 经过前面的特征提取,我们已经较好地提取了图像的文本特征,下面进行文字定位. 主要过程分两步: 1.邻近搜索,目的是圈出单行文字: 2.文本切割,目的是将单行文本切割为单字. 邻近搜索 我们可以对提取的特征图进行连通区域搜索,得到的每个连通区域视为一个汉字. 这对于大多数汉字来说是适用,但是对于一些比较简单的汉字却不适用,比如“小”.“旦”.“八”.“元” 这些字,由于不具有连通性,所以就被分拆开了,如图13. 因此,我们需要通过邻近搜索算法,来整合可能成字的区域,得到单行的文本区域.…
Yolo训练自定义目标检测 参考darknet:https://pjreddie.com/darknet/yolo/ 1. 下载darknet 在 https://github.com/pjreddie/darknet 下载zip (注意:git clone 之后'make'有"Counldn't open coco.name"的error,搜了一下,直接下载zip可以解决) 2. make 3. 下载pretrained weight 4. 运行单图片检测 ./darknet det…
文字,一种信息记录的图像符号,千年来承载了太多的人类文明印记.OCR,一种自动解读这种图像符号的技术,一直以来都备受关注.尤其在信息时代的今天,数字图像纷繁复杂,如何便捷高效的获取其中的文字信息,更有着重要的时代意义.作为模式识别领域最为经典的研究热点之一,OCR经历了长时间的发展变化,各种新技术.新方法.新应用层出不穷. OCR技术的过去和现在: OCR(光学字符识别技术),是通过扫描仪或相机等光学输入设备获取纸张上的文字.图片信息,利用各种模式识别算法对文字的形态结构进行分析,形成相应的字符…
目标检测(object detection)是计算机视觉中非常具有挑战性的一项工作,一方面它是其他很多后续视觉任务的基础,另一方面目标检测不仅需要预测区域,还要进行分类,因此问题更加复杂.最近的5年使用深度学习方法进行目标检测取得了很大的突破,因此想写一个系列来介绍这些方法.这些比较重要的方法可以分成两条主线,一条是基于区域候选(region proposal)的方法,即通过某种策略选出一部分候选框再进行后续处理,比如RCNN-SPP-Fast RCNN-Faster RCNN-RFCN等:另一…
简介   OpenCV是一个基于BSD许可(开源)发行的跨平台计算机视觉库,可以运行在Linux.Windows.Android和Mac OS操作系统上.它轻量级而且高效--由一系列 C 函数和少量 C++ 类构成,同时提供了Python.Ruby.MATLAB等语言的接口,实现了图像处理和计算机视觉方面的很多通用算法.  OpenCV的官方网址为:https://opencv.org/, 其Github网址为:https://github.com/opencv .  本文将会介绍OpenCV在…
Haar特征与积分图 1. Adaboost方法的引入 1.1 Boosting方法的提出和发展 在了解Adaboost方法之前,先了解一下Boosting方法. 回答一个是与否的问题,随机猜测可以获得50%的正确率.如果一种方法能获得比随机猜测稍微高一点的正确率,则就可以称该得到这个方法的过程为弱学习:如果一个方法可以显著提高猜测的正确率,则称获取该方法的过程为强学习.1994年,Kearns和Valiant证明,在Valiant的PAC(Probably ApproximatelyCorre…