Text Region Mask

本系列文章由 @yhl_leo 出品，转载请注明出处。

文章链接： http://blog.csdn.net/yhl_leo/article/details/52886351

根据图像中文本字符的坐标信息，生成文本区域mask图像。如下图

文本字符信息记录格式为：

bjtextset01_0004.jpg

1

1 527.50 243.50 581.67 311.00 "2"

其中，bjtextset01_0004.jpg为图像名（全小写字符），紧接着的1为包含文本字符的数量，后面接着就是对应的文本字符的位置坐标527.50 243.50 581.67 311.00（格式为x, y, x, y，即两个顶点坐标），2为字符内容，该行最前面的1为标记符，可以忽略。

首先，读取文本内容：

import os

import copy as cp

class DataGt(object):

    """docstring for DataGt"""

    def __init__(self, fname, trlist):

        super(DataGt, self).__init__()

        self.fname = fname

        self.trlist = trlist

def loaddata(path):

    fp = open(path).read().splitlines()

    gt = DataGt([],[])

    niter = 0

    idx = 0

    while niter < len(fp):

        if '.jpg' in fp[idx]:

            textlst = []

            gt.fname.append(fp[idx]);

            idx = idx + 1

            num = int(fp[idx])

            for i in range(num):

                idx = idx + 1

                if '1' in fp[idx] and '\"' in fp[idx]:

                    loc = fp[idx].split(' ')[1:5]

                    textlst.append(loc)

            gt.trlist.append(textlst)

        else:

            idx = idx + 1

        niter = idx

    return gt

然后，绘制mask图：

import os

import cv2

import loadgt

import numpy as np

def im_lists( path ):

    return os.listdir(path);

def path_insensitive(lst, fn):

    for ln in lst:

        if ln.lower() == fn.lower():

            return ln

    return None

def genMask(gt, im_path, savepath):

    num = len(gt.fname)

    ims = im_lists(im_path)

    for idx in range(num):

        fn = path_insensitive( ims, gt.fname[idx] )

        fname = os.path.join(im_path, fn)

        sname = os.path.join(savepath, fn)

        im = cv2.imread(fname)

        size_im = im.shape

        #print size_im

        mask = np.zeros([size_im[0], size_im[1]], dtype=np.uint8)

        for ls in gt.trlist[idx]:

            mask[int(float(ls[1])):int(float(ls[3])), int(float(ls[0])): int(float(ls[2]))] = 255

        cv2.imwrite(sname, mask, [cv2.cv.CV_IMWRITE_PNG_COMPRESSION, 0])

im_path = "./data"

savepath = "./mask"

gtpath = "./test.txt"

gt = loadgt.loaddata(gtpath)

genMask(gt,im_path, savepath)

结果如图：

Image	TextRegionMask

Text Region Mask的更多相关文章

【论文速读】Shangbang Long_ECCV2018_TextSnake_A Flexible Representation for Detecting Text of Arbitrary Shapes
Shangbang Long_ECCV2018_TextSnake_A Flexible Representation for Detecting Text of Arbitrary Shapes 作 ...
论文阅读（Xiang Bai——【arXiv2016】Scene Text Detection via Holistic, Multi-Channel Prediction）
Xiang Bai--[arXiv2016]Scene Text Detection via Holistic, Multi-Channel Prediction 目录作者和相关链接方法概括创新 ...
论文阅读（Xiang Bai——【CVPR2015】Symmetry-Based Text Line Detection in Natural Scenes）
Xiang Bai--[CVPR2015]Symmetry-Based Text Line Detection in Natural Scenes 目录作者和相关链接方法概括创新点和贡献方法细 ...
论文速读（Chuhui Xue——【arxiv2019】MSR_Multi-Scale Shape Regression for Scene Text Detection）
Chuhui Xue--[arxiv2019]MSR_Multi-Scale Shape Regression for Scene Text Detection 论文 Chuhui Xue--[arx ...
【论文速读】Yuliang Liu_2017_Detecting Curve Text in the Wild_New Dataset and New Solution
Yuliang Liu_2017_Detecting Curve Text in the Wild_New Dataset and New Solution 作者和代码 caffe版代码关键词文字 ...
【论文速读】Chuhui Xue_ECCV2018_Accurate Scene Text Detection through Border Semantics Awareness and Bootstrapping
Chuhui Xue_ECCV2018_Accurate Scene Text Detection through Border Semantics Awareness and Bootstrappi ...
论文阅读（Weilin Huang——【arXiv2016】Accurate Text Localization in Natural Image with Cascaded Convolutional Text Network）
Weilin Huang——[arXiv2016]Accurate Text Localization in Natural Image with Cascaded Convolutional Tex ...
halcon 如何把一个region截取出来保存为图像
read_image(Image,'monkey') gen_circle(region,200,200,150) reduce_domain(Image,region,Mask) crop_doma ...
Region Normalization for Image Inpainting, AAAI 2020
论文:Region Normalization for Image Inpainting, AAAI 2020 代码:https://github.com/geekyutao/RN 图像修复的目的是重 ...

随机推荐

想系统化快速学习人工智能？上Azure School就够了！
要说目前最热门的技术,非人工智能莫属了,让计算机程序能够看懂.听懂.读懂.理解我们的世界!想想就激动!! 上至高大上的个人数字化助理,下至P图软件,各种应用都开始增加AI相关的功能,试问又有哪个技术爱 ...
jsHint-静态代码检查工具eclipse中使用
今天介绍一个关于js静态代码的检查工具,此工具可以帮助更好的规范代码的编写形式以及检查错误.由于jslint的分支jsHint有跟多的配置项相对使用也比较方便,依次本文主要介绍jsHint的使用方式. ...
如何在Netweaver SE16里直接查看某数据库行记录
有的数据库表字段类型为RAWSTRING, 包含的是XML的二进制内容,无法直接在SE16里显示. 如果确实想看其内容,怎么办?在下面SE16页面的命令提示栏输入命令/h, 回车进入调试模式.然后双击 ...
UVA 10537 Toll! Revisited （逆推，最短路）
从终点逆推,d[u]表示进入u以后剩下的货物,那么进入u之前的货物数量设为y,d[u] = x,那么y-x=ceil(y/20.0)=(y-1)/20+1=(y+19)/20. (y-x)*20+r= ...
ListView适配器Adapter介绍与优化
一.ListView与Adapter的关系 ListView是Android开发过程中较为常见的组件之一,它将数据以列表的形式展现出来.一般而言,一个ListView由以下三个元素组成: 1.View ...
Memcached笔记之分布式算法
1.根据余数进行分散:离散度高,但是增加或者移除服务器的时候,缓存充足的代价非常大.添加服务器后,余数就会产生巨变,这样就无法获取与保存时相同的服务器,从而音像缓存的命中率. 2.Consistent ...
WINDOWS-基础：LPTSTR
1. LPTSTR解释与char*等价,表示普通字符/字符串变量,指向字符/字符串的指针. LP: 长指针(long pointer). T: win32环境中有一个_T宏,用来标识字符是否采 ...
关于SQL语言的初步认识
关于SQL语言的初步认识 1.一个SQL数据库是表(Table)的集合,它由一个或多个SQL模式定义. 2.一个SQL表由行集构成,一行是列的序列(集合),每列与行对应一个数据项. 3.一个表或者是一 ...
mutt+msmtp做linux邮件客户端
mutt+msmtp做linux邮件客户端 1. 安装配置msmtp l 安装 wget https://sourceforge.net/projects/msmtp/files/msmtp/1.4 ...
C++ 学习笔记（四）类的内存分配及this指针
类,是使用C++的最主要的内容.如果将c++与C语言做比较,我感觉类更像是结构体的加强进化版.在刚接触C++不久的时候总是让类,对象,this指针弄得一脸懵逼,我对类有比较清楚的认识是从理解类在内存中 ...

Text Region Mask

Text Region Mask的更多相关文章

随机推荐

热门专题