摘要:语言模型往往被用于文字识别的后处理阶段,本文将语言模型的先验信息和文字的视觉特征进行交互和增强,从而进一步提升文字识别的性能. 本文分享自华为云社区<Multi-Model Text Recognition Network>,作者:谷雨润一麦 . 语言模型经常被用于文字识别的后处理阶段,用来优化识别结果.但该先验信息是独立作用于识别器的输出,所以之前的方法并没有充分利用该信息.本文提出MATRN,对语义特征和视觉特征之间进行跨模态的特征增强,从而提高识别性能. 方法 方法的流程图如上图所…
如何实现refine的? 几何误差和阴影误差如何加到一起? 为了解决什么问题? 弱纹理或无纹理:单纯的多视图立体算法在物体表面弱纹理或者无纹理区域重建完整度不够高,精度也不够高,因此结合阴影恢复形状来重建物体表面的高频细节. 物体表面具有随空间变化的反照率的区域:使用双三次模型完成光滑表面面片的表达,从而隐式保证了模型对空间变化反照率区域的有效性. 能量方程权重因子:利用图像梯度,在梯度大的区域纹理丰富使用几何约束,梯度小的区域表面平坦均匀使用明暗阴影约束. 同样是利用图片中的阴影信息,是否有考…
读这篇论文“ Multi Column Deep Neural Network for Traffic Sign Classification”是为了更加理解,论文“Multi-column Deep Neural Networks for Image Classification”…
Weilin Huang——[ECCV2016]Detecting Text in Natural Image with Connectionist Text Proposal Network 目录 作者和相关链接 几个关键的Idea出发点 方法概括 方法细节 实验结果 总结与收获点 作者和相关链接 个人主页:Zhi Tian,黄伟林,Tong He,Pan He,乔宇 作者简单信息: 论文下载:论文传送门 代码下载:代码传送门 几个关键的Idea出发点 文本检测和一般目标检测的不同——文本线是…
论文标题:An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition 论文作者: Baoguang Shi, Xiang Bai and Cong Yao 论文代码的下载地址:http://mc.eistar.net/~xbai/CRNN/crnn_code.zip 论文地址:https://arxiv.org/p…
本系列的第六篇,一起读论文~ 本人才疏学浅,不足之处欢迎大家指出和交流. 今天要分享的是另一个Deep模型NFM(串行结构).NFM也是用FM+DNN来对问题建模的,相比于之前提到的Wide&Deep(Google).DeepFM(华为+哈工大).PNN(上交)和之后会分享的的DCN(Google).DIN(阿里)等,NFM有什么优点呢,下面就走进模型我们一起来看看吧. 原文:Neural Factorization Machines for Sparse Predictive Analytic…
白翔的CRNN论文阅读 1.  论文题目 Xiang Bai--[PAMI2017]An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition 2.  论文思路和方法 1)  问题范围: 单词识别 2)  CNN层:使用标准CNN提取图像特征,利用Map-to-Sequence表示成特征向量: 3)  RNN层:使…
读论文系列:Deep transfer learning person re-identification arxiv 2016 by Mengyue Geng, Yaowei Wang, Tao Xiang, Yonghong Tian Transfer Learning 旧数据训练得到的分类器,在新的数据上重新训练,从而在新数据上取得比较好的表现,新数据与旧数据有相似的地方,但具有不同的分布. Fine tuning一般步骤 这是InceptionV4的图示 移除Softmax分类层 换成与…
前面曾提到过CTPN,这里就学习一下,首先还是老套路,从论文学起吧.这里给出英文原文论文网址供大家阅读:https://arxiv.org/abs/1609.03605. CTPN,以前一直认为缩写一般是从题目的开始依次排序选取首字母的,怕是孤陋寡闻了,全称是“ Detecting Text in Natural Image with Connectionist Text Proposal Network”,翻译过来是基于连接Proposal(直译太难受!!)网络的文本检测. 作者在论文中描述了…
论文标题:Detecting Text in Natural Image with Connectionist Text Proposal Network 论文作者:Zhi Tian , Weilin Huang, Tong He , Pan He , and Yu Qiao 论文源代码的下载地址:https://github.com/tianzhi0549/CTPN 论文代码的下载地址:https://github.com/eragonruan/text-detection-ctpn 论文地址…