CTPN】的更多相关文章

上次拜读了CTPN论文,趁热打铁,今天就从网上找到CTPN 的tensorflow代码实现一下,这里放出大佬的github项目地址:https://github.com/eragonruan/text-detection-ctpn 博客里的代码都是经过实际操作可以运行的,这里只是总结一下代码的实现过程,提高一下自己的代码能力,争取早日会自己写代码 !!!>o<!!! 首先从train_net.py开始开刀吧.... import pprint import sys import os.path…
前面曾提到过CTPN,这里就学习一下,首先还是老套路,从论文学起吧.这里给出英文原文论文网址供大家阅读:https://arxiv.org/abs/1609.03605. CTPN,以前一直认为缩写一般是从题目的开始依次排序选取首字母的,怕是孤陋寡闻了,全称是“ Detecting Text in Natural Image with Connectionist Text Proposal Network”,翻译过来是基于连接Proposal(直译太难受!!)网络的文本检测. 作者在论文中描述了…
这几天一直在用Pytorch来复现文本检测领域的CTPN论文,本文章将从数据处理.训练标签生成.神经网络搭建.损失函数设计.训练主过程编写等这几个方面来一步一步复现CTPN.CTPN算法理论可以参考这里. 训练数据处理 我们的训练选择天池ICPR2018和MSRA_TD500两个数据集,天池ICPR的数据集为网络图像,都是一些淘宝商家上传到淘宝的一些商品介绍图像,其标签方式参考了ICDAR2015的数据标签格式,即一个文本框用4个坐标来表示,即左上.右上.右下.左下四个坐标,共八个值,记作[x1…
文字识别分为两个具体步骤:文字的检测和文字的识别,两者缺一不可,尤其是文字检测,是识别的前提条件,若文字都找不到,那何谈文字识别.今天我们首先来谈一下当今流行的文字检测技术有哪些. 文本检测不是一件简单的任务,尤其是复杂场景下的文本检测,非常具有挑战性.自然场景下的文本检测有如下几个难点: 文本存在多种分布,文本排布形式多样: 文本存在多个方向: 多种语言混合. 我们先从直观上理解文本检测任务.给定一张图片,我们需要找出这张图里文字出现的所有位置位置,那这个任务其实跟目标检测任务差别不大,即找出…
一.SWT识别: yestinsong/Text-Detection( Text Detection System with MSER , SWT and Text Verification(fft and pca) ) https://github.com/yestinsong/Text-Detection aperrau/DetectText:Detect text with stroke width transform. https://github.com/aperrau/DetectT…
源码地址:https://github.com/eragonruan/text-detection-ctpn 该地址提供了 CTPN 的 tf 版本的实现,代码文档写得很详细,issue 里面也帮助解决了不少问题. 下面简单记录在复现训练的时候遇到的一些问题: 1.首先,必要的环境配置 2.可以尝试用已有的训练好的模型,运行 demo.py 测试一些图片 3.训练数据准备,按照作者的要求,将他已经准备好的数据(一定的格式)拷贝到data/ 目录下面,然后将对应的名字命名正确,能找到对应的文件 4…
参考: https://zhuanlan.zhihu.com/p/37363942 https://zhuanlan.zhihu.com/p/34757009 https://zhuanlan.zhihu.com/p/31426458 [ Faster RCNN 非常详尽] 对于理解RNN/LSTM首先推荐阅读以下2篇文章,里面有详细的公式推导: 零基础入门深度学习(5) - 循环神经网络 零基础入门深度学习(6) - 长短时记忆网络(LSTM) 简介 文章基本信息 论文题目:Detecting…
本文主要对常用的文本检测模型算法进行总结及分析,有的模型笔者切实run过,有的是通过论文及相关代码的分析,如有错误,请不吝指正. 一下进行各个模型的详细解析 CTPN 详解 代码链接:https://github.com/xiaofengShi/CHINESE-OCR CTPN是目前应用非常广泛的印刷体文本检测模型算法. CTPN由fasterrcnn改进而来,可以看下二者的异同 网络结构 FasterRcnn CTPN basenet Vgg16 ,Vgg19,resnet Vgg16,也可以…
GitHub:https://github.com/pengcao/chinese_ocr https://github.com/xiaofengShi/CHINESE-OCR |-angle 基于VGG分类模型的文字方向检测预测|-bash 环境安装|----setup-python3.sh 安装python3环境|----setup-python3-cpu.sh 安装CPU环境|----setup-python3-gpu.sh 安装CPU环境|-crnn |-ctpn 基于CTPN模型的文本…