Sheng Zhang_AAAI2018_Feature Enhancement Network_A Refined Scene Text Detector 作者 关键词 文字检测.水平文字.Faster- RCNN.xywh.multi-stage 方法亮点 Feature Enhancement RPN (FE-RPN) :在原来的RPN基础上增加了两个卷积分支来增强文字特征的鲁棒性,一个分支通过增加长条形卷积核来提高对长条形文字的检测能力, 另一个分支利用增加池化和上采样层等方式来扩大感受…
XiangBai_TIP2018_TextBoxes++_A Single-Shot Oriented Scene Text Detector 作者和代码 Minghui Liao, Baoguang Shi, Xiang Bai, Senior Member, IEEE caffe检测torch7识别代码 关键词 文字检测.多方向.SSD.四个点.one-stage.开源 方法亮点 把原本只能做水平的TextBoxes改为可以预测任意四边形的多方向文本检测 除了常规的分类.回归损失,还增加了四…
XiangBai_CVPR2018_Rotation-Sensitive Regression for Oriented Scene Text Detection 作者和代码 caffe代码 关键词 文字检测.多方向.SSD.$$xywh\theta$$.one-stage,开源 方法亮点 核心思想认为,分类问题对于旋转不敏感,但回归问题对于旋转是敏感的,因此两个任务不应该用同样的特征.所以作者提出来基于旋转CNN的思路,先对特征做不同角度的旋转,该特征用于做框的回归,而对分类问题,采用沿ori…
Chuhui Xue--[arxiv2019]MSR_Multi-Scale Shape Regression for Scene Text Detection 论文 Chuhui Xue--[arxiv2019]MSR_Multi-Scale Shape Regression for Scene Text Detection 作者 Chuhui Xue, Shijian Lu, Wei Zhang 亮点 multi-scale网络中利用FPN的up-sampling把多个不同scale得到的结…
Yongchao Xu--[2018]TextField_Learning A Deep Direction Field for Irregular Scene Text Detection 论文 Yongchao Xu--[2018]TextField_Learning A Deep Direction Field for Irregular Scene Text Detection 作者 亮点 提出的TextField方法非常新颖,用点到最近boundary点的向量来区分不同instance…
Xiang Bai--[arXiv2016]Scene Text Detection via Holistic, Multi-Channel Prediction 目录 作者和相关链接 方法概括 创新点和贡献 方法细节 实验结果 问题讨论 总结与收获点 参考文献 作者和相关链接 作者 白翔个人主页 论文下载 方法概括  Step 1: 用修改版的hed(参考文献1)得到text region map(binary), character map(binary), linking orientat…
XiangBai——[AAAI2017]TextBoxes:A Fast Text Detector with a Single Deep Neural Network 目录 作者和相关链接 方法概括 创新点和贡献 方法细节 实验结果 总结与收获点 作者和相关链接 作者 论文下载 廖明辉,石葆光, 白翔, 王兴刚 ,刘文予 代码下载 方法概括 文章核心: 改进版的SSD用来解决文字检测问题 端到端识别的pipeline: Step 1: 图像输入到修改版SSD网络中 + 非极大值抑制(NMS)→…
Jiaming Liu--[2019]Detecting Text in the Wild with Deep Character Embedding Network 论文 Jiaming Liu--[2019]Detecting Text in the Wild with Deep Character Embedding Network 作者 亮点 通过将文字的字符合并问题转成字符embedding问题,利用一个网络来学习字符间的连接关系 方法概述 针对任意文字检测(水平.倾斜.曲文),采用从…
Cong_Yao_CVPR2017_EAST_An_Efficient_and_Accurate_Scene_Text_Detector 作者和代码 非官方版tensorflow实现 非官方版keras实现 支持长文本检测的keras改进版实现 方法流程 该方法利用多层卷积神经网络提取图像特征,再利用该特征分别进行两个任务,像素点的分类,以及对应像素点的框的回归.最后将两个任务结果结合起来,并用非极大值抑制NMS来得到最终检测结果. GroundTruth生成 点的分类任务,实际上是一个图像分割…
Yuliang Liu_2017_Detecting Curve Text in the Wild_New Dataset and New Solution 作者和代码 caffe版代码 关键词 文字检测.曲文.直接回归.14个点.one-stage.开源 方法亮点 第一篇做曲文检测,还提出一个数据集CTW1500 使用14个点多边形来表示曲文 提出了一个结合CNN-RPN+RNN的检测方法专门做曲文检测 方法概述 本文方法基于RPN进行修改,除了学习text/non-text分类,多边形的bo…
Shitala Prasad_ECCV2018]Using Object Information for Spotting Text 作者和代码 关键词 文字检测.水平文本.FasterRCNN.xywh.multi-stage 方法亮点 作者argue图像中的文字不可能单独出现,文字一定是写在什么载体上的,比如衣服,包装袋,交通部标志牌,黑板上,而且文字不会出现在某些载体上,比如天空,水面上,也就是说文字背后的载体对文字是否出现也有很强的相关性和指导性.所以,他串联了两个网络,第一个用来做通用…
Shangbang Long_ECCV2018_TextSnake_A Flexible Representation for Detecting Text of Arbitrary Shapes 作者 关键词 文字检测,曲线文本,多方向,multi-stage,圆盘表示法 方法亮点 提出一个新的曲线文本表示方法TextSnake(由圆盘序列组成) 提出了一个新的曲文检测方法,并且精度比之前的高40%+(Total-Text数据集) 方法概述 本文方法基于一个新的曲线文本表示方法TextSnak…
Pan He_ICCV2017_Single Shot Text Detector With Regional Attention 作者和代码 caffe代码 关键词 文字检测.多方向.SSD.$$xywh\theta$$ .one-stage.开源 方法亮点 Attention机制强化文字特征: Text Attentional Module 引入Inception来增强detector对文字大小的鲁棒性:Hierarchical Inception Module(HIM) 方法概述 本文方法…
Lianwen_Jin_CVPR2017_Deep_Matching_Prior_Network_Toward_Tighter_Multi-oriented_Text_Detection 作者 关键词 文字检测,多方向,SSD,四个点,one-stage 方法亮点 首先提出(并成功学习)用四个点的多边形来表示文字 用旋转anchor来解决倾斜文字检测问题 计算四边形的IOU方式(蒙特卡罗法) 方法概述 本文方法是对SSD(水平文字检测)进行改进,通过学习四个点相对多方向anchor的位置信息,用…
Han Hu--[ICCV2017]WordSup_Exploiting Word Annotations for Character based Text Detection 作者和代码 caffe检测torch7识别代码 关键词 文字检测.多方向.直接回归.$$xywh\theta$$ .multi-stage.监督学习 方法亮点 采用单词.文本行的标注信息进行监督学习来辅助字符检测 在ICDAR2013数据集上F值90+,后来的方法能超过这篇文章的寥寥无几 方法概述 利用Faster RC…
Dan Deng--[AAAI2018]PixelLink_Detecting Scene Text via Instance Segmentation 作者和代码 tensorflow代码 关键词 文字检测.多方向.直接回归.$$xywh\theta$$.one-stage.开源 方法亮点 使用instance segmentation的思路做(利用了二类分类+每个像素点与周围8个顶点的link分类) 利用图像处理方法进行后处理,不需要用NMS 方法概述 本文方法采用instance segm…
Chuhui Xue_ECCV2018_Accurate Scene Text Detection through Border Semantics Awareness and Bootstrapping 作者和代码 关键词 文字检测.多方向.FCN.$$xywh\theta$$.multi-stage.border 方法亮点 采用Bootstrapping进行数据扩增 增加border-loss 方法概述 本文方法是直接回归的方法,除了学习text/non-text分类任务,四个点到边界的回归…
ChengLin Liu_ICCV2017_Deep Direct Regression for Multi-Oriented Scene Text Detection 作者 关键词 文字检测.多方向.直接回归.4个点.one-stage 方法亮点 第一次提出Direct Regression这个概念 提出用Scale & shift方案来降低坐标位置学习的难度 方法概述 本文方法首次提出直接回归的概念,用自己搭建的FPN网络结构,直接学习四个点相对于中心点(feature map上的某个点)的…
方法概述 该方法用一个端到端网络完成文字检测整个过程——除了基础卷积网络(backbone)外,包括两个并行分支和一个后处理.第一个分支是通过一个DSSD网络进行角点检测来提取候选文字区域,第二个分支是利用类似于RFCN进行网格划分的方式来做position-sensitive的segmentation.后处理是利用segmentation的score map的综合得分,过滤角点检测得到的候选区域中的噪声. 文章亮点: (1)不是用一般的目标检测的框架,而是用角点检测(corner point…
常常遇到 php composer.phar update 等待一二十分钟还没有更新完成的情况. 提升速读的方法: 1. 升级PHP 版本到5.4以上 2. 删除文件夹Vender(或者重命名),之后执行 php composer.phar install --prefer-dist 这样避免了每次文件版本的比较而是直接下载zip压缩包 3. 在composer.json文件中直接生命具体的bundle版本 This problem is often related to xdebug loda…
虽然ICCV2019已经公布了接收ID名单,但是具体的论文都还没放出来,为了让大家更快得看论文,我们汇总了目前已经公布的大部分ICCV2019 论文,并组织了ICCV2019论文汇总开源项目(https://github.com/extreme-assistant/iccv2019),目前已经收集到70篇论文,其中10篇Oral,13篇开源,见下方list.建议Oral的文章一定要去读一读. 本文中所有论文PDF已经打包上传到百度云,可以直接在GitHub项目上看到或者直接微信后台回复"ICCV…
欢迎访问我的GitHub https://github.com/zq2599/blog_demos 内容:所有原创文章分类汇总及配套源码,涉及Java.Docker.Kubernetes.DevOPS等: 前文回顾 本篇是欣宸<spring-cloud-square原创>系列的第三篇,咱们快速回顾一下前面两篇: <五分钟搞懂spring-cloud-square>:说清楚了spring-cloud-square是什么 <spring-cloud-square开发实战(三种类型…
欢迎访问我的GitHub 这里分类和汇总了欣宸的全部原创(含配套源码):https://github.com/zq2599/blog_demos spring-cloud-square系列文章 五分钟搞懂spring-cloud-square spring-cloud-square开发实战(三种类型全覆盖) spring-cloud-square源码速读(spring-cloud-square-okhttp篇) spring-cloud-square源码速读(retrofit + okhttp篇…
Weilin Huang--[AAAI2016]Reading Scene Text in Deep Convolutional Sequences 目录 作者和相关链接 方法概括 创新点和贡献 方法细节 实验结果 问题讨论 总结与收获点 参考文献 作者和相关链接 论文下载 黄伟林主页 , 乔宇,汤晓欧 所有作者 方法概括 解决问题:单词识别 主要流程:maxout版的CNN提取特征,RNN(LSTM)进行分类,CTC对结果进行调整.整个流程端到端训练和测试,和白翔的CRNN(参考文献1)方法几…
Weilin Huang--[TIP2015]Text-Attentional Convolutional Neural Network for Scene Text Detection) 目录 作者和相关链接 方法概括 创新点和贡献 方法细节 实验结果 问题讨论 总结与收获点 作者补充信息 参考文献 作者和相关链接 论文下载 作者: tong he, 黄伟林,乔宇,姚剑 方法概括 使用改进版的MSER(CE-MSERs,contrast-enhancement)提取候选字符区域: 使用新的CN…
Lukas Neuman--[ICDAR2015]Efficient Scene Text Localization and Recognition with Local Character Refinement 算法介绍 Fig. 2. Overview of the method. Initial text hypotheses efficiently generatedby a MSER detector are further refined using a local text mod…
白翔的CRNN论文阅读 1.  论文题目 Xiang Bai--[PAMI2017]An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition 2.  论文思路和方法 1)  问题范围: 单词识别 2)  CNN层:使用标准CNN提取图像特征,利用Map-to-Sequence表示成特征向量: 3)  RNN层:使…
目录 XiangBai--[PAMI2018]ASTER_An Attentional Scene Text Recognizer with Flexible Rectification 作者和论文 方法概述 1. 主要思路 2. 方法框架和流程 3. 文章亮点 方法细节 1. 背景 2. Rectification Network 3. Recognition Network 4. 网络训练 实验结果 总结与收获 参考文献 XiangBai--[PAMI2018]ASTER_An Attent…
Lukas Neumann——[ICCV2017]Deep TextSpotter_An End-to-End Trainable Scene Text Localization and Recognition Framework 目录 作者和相关链接 方法概括 方法细节 实验结果 总结与收获点 参考文献和链接 作者和相关链接 作者 论文下载 代码下载 方法概括 方法概述 该方法将文字检测和识别整合到一个端到端的网络中.检测使用YOLOv2+RPN,并利用双线性采样将文字区域统一为高度一致的变长…
论文标题:An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition 论文作者: Baoguang Shi, Xiang Bai and Cong Yao 论文代码的下载地址:http://mc.eistar.net/~xbai/CRNN/crnn_code.zip 论文地址:https://arxiv.org/p…