【论文速读】Sheng Zhang_AAAI2018_Feature Enhancement Network_A Refined Scene Text Detector

Sheng Zhang_AAAI2018_Feature Enhancement Network_A Refined Scene Text Detector 作者关键词文字检测.水平文字.Faster- RCNN.xywh.multi-stage 方法亮点 Feature Enhancement RPN (FE-RPN) :在原来的RPN基础上增加了两个卷积分支来增强文字特征的鲁棒性,一个分支通过增加长条形卷积核来提高对长条形文字的检测能力, 另一个分支利用增加池化和上采样层等方式来扩大感受…

【论文速读】XiangBai_TIP2018_TextBoxes++_A Single-Shot Oriented Scene Text Detector

XiangBai_TIP2018_TextBoxes++_A Single-Shot Oriented Scene Text Detector 作者和代码 Minghui Liao, Baoguang Shi, Xiang Bai, Senior Member, IEEE caffe检测torch7识别代码关键词文字检测.多方向.SSD.四个点.one-stage.开源方法亮点把原本只能做水平的TextBoxes改为可以预测任意四边形的多方向文本检测除了常规的分类.回归损失,还增加了四…

【论文速读】XiangBai_CVPR2018_Rotation-Sensitive Regression for Oriented Scene Text Detection

XiangBai_CVPR2018_Rotation-Sensitive Regression for Oriented Scene Text Detection 作者和代码 caffe代码关键词文字检测.多方向.SSD.$$xywh\theta$$.one-stage,开源方法亮点核心思想认为,分类问题对于旋转不敏感,但回归问题对于旋转是敏感的,因此两个任务不应该用同样的特征.所以作者提出来基于旋转CNN的思路,先对特征做不同角度的旋转,该特征用于做框的回归,而对分类问题,采用沿ori…

论文速读（Chuhui Xue——【arxiv2019】MSR_Multi-Scale Shape Regression for Scene Text Detection）

Chuhui Xue--[arxiv2019]MSR_Multi-Scale Shape Regression for Scene Text Detection 论文 Chuhui Xue--[arxiv2019]MSR_Multi-Scale Shape Regression for Scene Text Detection 作者 Chuhui Xue, Shijian Lu, Wei Zhang 亮点 multi-scale网络中利用FPN的up-sampling把多个不同scale得到的结…

论文速读（Yongchao Xu——【2018】TextField_Learning A Deep Direction Field for Irregular Scene Text）

Yongchao Xu--[2018]TextField_Learning A Deep Direction Field for Irregular Scene Text Detection 论文 Yongchao Xu--[2018]TextField_Learning A Deep Direction Field for Irregular Scene Text Detection 作者亮点提出的TextField方法非常新颖,用点到最近boundary点的向量来区分不同instance…

论文阅读（Xiang Bai——【arXiv2016】Scene Text Detection via Holistic, Multi-Channel Prediction）

Xiang Bai--[arXiv2016]Scene Text Detection via Holistic, Multi-Channel Prediction 目录作者和相关链接方法概括创新点和贡献方法细节实验结果问题讨论总结与收获点参考文献作者和相关链接作者白翔个人主页论文下载方法概括 Step 1: 用修改版的hed(参考文献1)得到text region map(binary), character map(binary), linking orientat…

论文阅读（XiangBai——【AAAI2017】TextBoxes_A Fast Text Detector with a Single Deep Neural Network）

XiangBai——[AAAI2017]TextBoxes:A Fast Text Detector with a Single Deep Neural Network 目录作者和相关链接方法概括创新点和贡献方法细节实验结果总结与收获点作者和相关链接作者论文下载廖明辉,石葆光, 白翔, 王兴刚 ,刘文予代码下载方法概括文章核心: 改进版的SSD用来解决文字检测问题端到端识别的pipeline: Step 1: 图像输入到修改版SSD网络中 + 非极大值抑制(NMS)→…

论文速读（Jiaming Liu——【2019】Detecting Text in the Wild with Deep Character Embedding Network ）

Jiaming Liu--[2019]Detecting Text in the Wild with Deep Character Embedding Network 论文 Jiaming Liu--[2019]Detecting Text in the Wild with Deep Character Embedding Network 作者亮点通过将文字的字符合并问题转成字符embedding问题,利用一个网络来学习字符间的连接关系方法概述针对任意文字检测(水平.倾斜.曲文),采用从…

【论文速读】Cong_Yao_CVPR2017_EAST_An_Efficient_and_Accurate_Scene_Text_Detector

Cong_Yao_CVPR2017_EAST_An_Efficient_and_Accurate_Scene_Text_Detector 作者和代码非官方版tensorflow实现非官方版keras实现支持长文本检测的keras改进版实现方法流程该方法利用多层卷积神经网络提取图像特征,再利用该特征分别进行两个任务,像素点的分类,以及对应像素点的框的回归.最后将两个任务结果结合起来,并用非极大值抑制NMS来得到最终检测结果. GroundTruth生成点的分类任务,实际上是一个图像分割…

【论文速读】Yuliang Liu_2017_Detecting Curve Text in the Wild_New Dataset and New Solution

Yuliang Liu_2017_Detecting Curve Text in the Wild_New Dataset and New Solution 作者和代码 caffe版代码关键词文字检测.曲文.直接回归.14个点.one-stage.开源方法亮点第一篇做曲文检测,还提出一个数据集CTW1500 使用14个点多边形来表示曲文提出了一个结合CNN-RPN+RNN的检测方法专门做曲文检测方法概述本文方法基于RPN进行修改,除了学习text/non-text分类,多边形的bo…

【论文速读】Shitala Prasad_ECCV2018】Using Object Information for Spotting Text

Shitala Prasad_ECCV2018]Using Object Information for Spotting Text 作者和代码关键词文字检测.水平文本.FasterRCNN.xywh.multi-stage 方法亮点作者argue图像中的文字不可能单独出现,文字一定是写在什么载体上的,比如衣服,包装袋,交通部标志牌,黑板上,而且文字不会出现在某些载体上,比如天空,水面上,也就是说文字背后的载体对文字是否出现也有很强的相关性和指导性.所以,他串联了两个网络,第一个用来做通用…

【论文速读】Shangbang Long_ECCV2018_TextSnake_A Flexible Representation for Detecting Text of Arbitrary Shapes

Shangbang Long_ECCV2018_TextSnake_A Flexible Representation for Detecting Text of Arbitrary Shapes 作者关键词文字检测,曲线文本,多方向,multi-stage,圆盘表示法方法亮点提出一个新的曲线文本表示方法TextSnake(由圆盘序列组成) 提出了一个新的曲文检测方法,并且精度比之前的高40%+(Total-Text数据集) 方法概述本文方法基于一个新的曲线文本表示方法TextSnak…

【论文速读】Pan He_ICCV2017_Single Shot Text Detector With Regional Attention

Pan He_ICCV2017_Single Shot Text Detector With Regional Attention 作者和代码 caffe代码关键词文字检测.多方向.SSD.$$xywh\theta$$ .one-stage.开源方法亮点 Attention机制强化文字特征: Text Attentional Module 引入Inception来增强detector对文字大小的鲁棒性:Hierarchical Inception Module(HIM) 方法概述本文方法…

【论文速读】Lianwen_Jin_CVPR2017_Deep_Matching_Prior_Network_Toward_Tighter_Multi-oriented_Text_Detection

Lianwen_Jin_CVPR2017_Deep_Matching_Prior_Network_Toward_Tighter_Multi-oriented_Text_Detection 作者关键词文字检测,多方向,SSD,四个点,one-stage 方法亮点首先提出(并成功学习)用四个点的多边形来表示文字用旋转anchor来解决倾斜文字检测问题计算四边形的IOU方式(蒙特卡罗法) 方法概述本文方法是对SSD(水平文字检测)进行改进,通过学习四个点相对多方向anchor的位置信息,用…

【论文速读】Fangfang Wang_CVPR2018_Geometry-Aware Scene Text Detection With Instance Transformation Network

Han Hu--[ICCV2017]WordSup_Exploiting Word Annotations for Character based Text Detection 作者和代码 caffe检测torch7识别代码关键词文字检测.多方向.直接回归.$$xywh\theta$$ .multi-stage.监督学习方法亮点采用单词.文本行的标注信息进行监督学习来辅助字符检测在ICDAR2013数据集上F值90+,后来的方法能超过这篇文章的寥寥无几方法概述利用Faster RC…

【论文速读】Dan_Deng_AAAI2018_PixelLink_Detecting_Scene_Text_via_Instance_Segmentation

Dan Deng--[AAAI2018]PixelLink_Detecting Scene Text via Instance Segmentation 作者和代码 tensorflow代码关键词文字检测.多方向.直接回归.$$xywh\theta$$.one-stage.开源方法亮点使用instance segmentation的思路做(利用了二类分类+每个像素点与周围8个顶点的link分类) 利用图像处理方法进行后处理,不需要用NMS 方法概述本文方法采用instance segm…

【论文速读】Chuhui Xue_ECCV2018_Accurate Scene Text Detection through Border Semantics Awareness and Bootstrapping

Chuhui Xue_ECCV2018_Accurate Scene Text Detection through Border Semantics Awareness and Bootstrapping 作者和代码关键词文字检测.多方向.FCN.$$xywh\theta$$.multi-stage.border 方法亮点采用Bootstrapping进行数据扩增增加border-loss 方法概述本文方法是直接回归的方法,除了学习text/non-text分类任务,四个点到边界的回归…

【论文速读】ChengLin_Liu_ICCV2017_Deep_Direct_Regression_for_Multi-Oriented_Scene_Text_Detection

ChengLin Liu_ICCV2017_Deep Direct Regression for Multi-Oriented Scene Text Detection 作者关键词文字检测.多方向.直接回归.4个点.one-stage 方法亮点第一次提出Direct Regression这个概念提出用Scale & shift方案来降低坐标位置学习的难度方法概述本文方法首次提出直接回归的概念,用自己搭建的FPN网络结构,直接学习四个点相对于中心点(feature map上的某个点)的…

【论文速读】Multi-Oriented Scene Text Detection via Corner Localization and Region Segmentation[2018-CPVR]

方法概述该方法用一个端到端网络完成文字检测整个过程——除了基础卷积网络(backbone)外,包括两个并行分支和一个后处理.第一个分支是通过一个DSSD网络进行角点检测来提取候选文字区域,第二个分支是利用类似于RFCN进行网格划分的方式来做position-sensitive的segmentation.后处理是利用segmentation的score map的综合得分,过滤角点检测得到的候选区域中的噪声. 文章亮点: (1)不是用一般的目标检测的框架,而是用角点检测(corner point…

提升 composer 的执行速读

常常遇到 php composer.phar update 等待一二十分钟还没有更新完成的情况. 提升速读的方法: 1. 升级PHP 版本到5.4以上 2. 删除文件夹Vender(或者重命名),之后执行 php composer.phar install --prefer-dist 这样避免了每次文件版本的比较而是直接下载zip压缩包 3. 在composer.json文件中直接生命具体的bundle版本 This problem is often related to xdebug loda…

ICCV 2019|70 篇论文抢先读，含目标检测／自动驾驶／GCN／等（提供PDF下载）

虽然ICCV2019已经公布了接收ID名单,但是具体的论文都还没放出来,为了让大家更快得看论文,我们汇总了目前已经公布的大部分ICCV2019 论文,并组织了ICCV2019论文汇总开源项目(https://github.com/extreme-assistant/iccv2019),目前已经收集到70篇论文,其中10篇Oral,13篇开源,见下方list.建议Oral的文章一定要去读一读. 本文中所有论文PDF已经打包上传到百度云,可以直接在GitHub项目上看到或者直接微信后台回复"ICCV…

spring-cloud-square源码速读(spring-cloud-square-okhttp篇)

欢迎访问我的GitHub https://github.com/zq2599/blog_demos 内容:所有原创文章分类汇总及配套源码,涉及Java.Docker.Kubernetes.DevOPS等: 前文回顾本篇是欣宸<spring-cloud-square原创>系列的第三篇,咱们快速回顾一下前面两篇: <五分钟搞懂spring-cloud-square>:说清楚了spring-cloud-square是什么 <spring-cloud-square开发实战(三种类型…

spring-cloud-square源码速读（retrofit + okhttp篇）

欢迎访问我的GitHub 这里分类和汇总了欣宸的全部原创(含配套源码):https://github.com/zq2599/blog_demos spring-cloud-square系列文章五分钟搞懂spring-cloud-square spring-cloud-square开发实战(三种类型全覆盖) spring-cloud-square源码速读(spring-cloud-square-okhttp篇) spring-cloud-square源码速读(retrofit + okhttp篇…

论文阅读（Weilin Huang——【AAAI2016】Reading Scene Text in Deep Convolutional Sequences）

Weilin Huang--[AAAI2016]Reading Scene Text in Deep Convolutional Sequences 目录作者和相关链接方法概括创新点和贡献方法细节实验结果问题讨论总结与收获点参考文献作者和相关链接论文下载黄伟林主页 , 乔宇,汤晓欧所有作者方法概括解决问题:单词识别主要流程:maxout版的CNN提取特征,RNN(LSTM)进行分类,CTC对结果进行调整.整个流程端到端训练和测试,和白翔的CRNN(参考文献1)方法几…

论文阅读（Weilin Huang——【TIP2016】Text-Attentional Convolutional Neural Network for Scene Text Detection）

Weilin Huang--[TIP2015]Text-Attentional Convolutional Neural Network for Scene Text Detection) 目录作者和相关链接方法概括创新点和贡献方法细节实验结果问题讨论总结与收获点作者补充信息参考文献作者和相关链接论文下载作者: tong he, 黄伟林,乔宇,姚剑方法概括使用改进版的MSER(CE-MSERs,contrast-enhancement)提取候选字符区域: 使用新的CN…

论文阅读（Lukas Neuman——【ICDAR2015】Efficient Scene Text Localization and Recognition with Local Character Refinement）

Lukas Neuman--[ICDAR2015]Efficient Scene Text Localization and Recognition with Local Character Refinement 算法介绍 Fig. 2. Overview of the method. Initial text hypotheses efficiently generatedby a MSER detector are further refined using a local text mod…

论文阅读（Xiang Bai——【PAMI2017】An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition）

白翔的CRNN论文阅读 1. 论文题目 Xiang Bai--[PAMI2017]An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition 2. 论文思路和方法 1) 问题范围: 单词识别 2) CNN层:使用标准CNN提取图像特征,利用Map-to-Sequence表示成特征向量: 3) RNN层:使…

论文阅读（XiangBai——【PAMI2018】ASTER_An Attentional Scene Text Recognizer with Flexible Rectification )

目录 XiangBai--[PAMI2018]ASTER_An Attentional Scene Text Recognizer with Flexible Rectification 作者和论文方法概述 1. 主要思路 2. 方法框架和流程 3. 文章亮点方法细节 1. 背景 2. Rectification Network 3. Recognition Network 4. 网络训练实验结果总结与收获参考文献 XiangBai--[PAMI2018]ASTER_An Attent…

论文阅读（Lukas Neumann——【ICCV2017】Deep TextSpotter_An End-to-End Trainable Scene Text Localization and Recognition Framework）

Lukas Neumann——[ICCV2017]Deep TextSpotter_An End-to-End Trainable Scene Text Localization and Recognition Framework 目录作者和相关链接方法概括方法细节实验结果总结与收获点参考文献和链接作者和相关链接作者论文下载代码下载方法概括方法概述该方法将文字检测和识别整合到一个端到端的网络中.检测使用YOLOv2+RPN,并利用双线性采样将文字区域统一为高度一致的变长…

深度学习论文翻译解析（二）：An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition

论文标题:An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition 论文作者: Baoguang Shi, Xiang Bai and Cong Yao 论文代码的下载地址:http://mc.eistar.net/~xbai/CRNN/crnn_code.zip 论文地址:https://arxiv.org/p…

【【论文速读】Sheng Zhang_AAAI2018_Feature Enhancement Network_A Refined Scene Text Detector】的更多相关文章