Cong_Yao_CVPR2017_EAST_An_Efficient_and_Accurate_Scene_Text_Detector 作者和代码 非官方版tensorflow实现 非官方版keras实现 支持长文本检测的keras改进版实现 方法流程 该方法利用多层卷积神经网络提取图像特征,再利用该特征分别进行两个任务,像素点的分类,以及对应像素点的框的回归.最后将两个任务结果结合起来,并用非极大值抑制NMS来得到最终检测结果. GroundTruth生成 点的分类任务,实际上是一个图像分割…
Chuhui Xue--[arxiv2019]MSR_Multi-Scale Shape Regression for Scene Text Detection 论文 Chuhui Xue--[arxiv2019]MSR_Multi-Scale Shape Regression for Scene Text Detection 作者 Chuhui Xue, Shijian Lu, Wei Zhang 亮点 multi-scale网络中利用FPN的up-sampling把多个不同scale得到的结…
Jiaming Liu--[2019]Detecting Text in the Wild with Deep Character Embedding Network 论文 Jiaming Liu--[2019]Detecting Text in the Wild with Deep Character Embedding Network 作者 亮点 通过将文字的字符合并问题转成字符embedding问题,利用一个网络来学习字符间的连接关系 方法概述 针对任意文字检测(水平.倾斜.曲文),采用从…
Yongchao Xu--[2018]TextField_Learning A Deep Direction Field for Irregular Scene Text Detection 论文 Yongchao Xu--[2018]TextField_Learning A Deep Direction Field for Irregular Scene Text Detection 作者 亮点 提出的TextField方法非常新颖,用点到最近boundary点的向量来区分不同instance…
Yuliang Liu_2017_Detecting Curve Text in the Wild_New Dataset and New Solution 作者和代码 caffe版代码 关键词 文字检测.曲文.直接回归.14个点.one-stage.开源 方法亮点 第一篇做曲文检测,还提出一个数据集CTW1500 使用14个点多边形来表示曲文 提出了一个结合CNN-RPN+RNN的检测方法专门做曲文检测 方法概述 本文方法基于RPN进行修改,除了学习text/non-text分类,多边形的bo…
XiangBai_CVPR2018_Rotation-Sensitive Regression for Oriented Scene Text Detection 作者和代码 caffe代码 关键词 文字检测.多方向.SSD.$$xywh\theta$$.one-stage,开源 方法亮点 核心思想认为,分类问题对于旋转不敏感,但回归问题对于旋转是敏感的,因此两个任务不应该用同样的特征.所以作者提出来基于旋转CNN的思路,先对特征做不同角度的旋转,该特征用于做框的回归,而对分类问题,采用沿ori…
XiangBai_TIP2018_TextBoxes++_A Single-Shot Oriented Scene Text Detector 作者和代码 Minghui Liao, Baoguang Shi, Xiang Bai, Senior Member, IEEE caffe检测torch7识别代码 关键词 文字检测.多方向.SSD.四个点.one-stage.开源 方法亮点 把原本只能做水平的TextBoxes改为可以预测任意四边形的多方向文本检测 除了常规的分类.回归损失,还增加了四…
Shitala Prasad_ECCV2018]Using Object Information for Spotting Text 作者和代码 关键词 文字检测.水平文本.FasterRCNN.xywh.multi-stage 方法亮点 作者argue图像中的文字不可能单独出现,文字一定是写在什么载体上的,比如衣服,包装袋,交通部标志牌,黑板上,而且文字不会出现在某些载体上,比如天空,水面上,也就是说文字背后的载体对文字是否出现也有很强的相关性和指导性.所以,他串联了两个网络,第一个用来做通用…
Sheng Zhang_AAAI2018_Feature Enhancement Network_A Refined Scene Text Detector 作者 关键词 文字检测.水平文字.Faster- RCNN.xywh.multi-stage 方法亮点 Feature Enhancement RPN (FE-RPN) :在原来的RPN基础上增加了两个卷积分支来增强文字特征的鲁棒性,一个分支通过增加长条形卷积核来提高对长条形文字的检测能力, 另一个分支利用增加池化和上采样层等方式来扩大感受…
Shangbang Long_ECCV2018_TextSnake_A Flexible Representation for Detecting Text of Arbitrary Shapes 作者 关键词 文字检测,曲线文本,多方向,multi-stage,圆盘表示法 方法亮点 提出一个新的曲线文本表示方法TextSnake(由圆盘序列组成) 提出了一个新的曲文检测方法,并且精度比之前的高40%+(Total-Text数据集) 方法概述 本文方法基于一个新的曲线文本表示方法TextSnak…