cnn进行端到端的验证码识别改进

keras_cnn.py 训练及建模

#!/usr/bin/env python

# coding=utf-

"""

利用keras cnn进行端到端的验证码识别， 简单直接暴力。

迭代100次可以达到95%的准确率，但是很容易过拟合，泛化能力糟糕， 除了增加训练数据还没想到更好的方法.

__autho__: jkmiao

__email__: miao1202@.com

___date__:--

"""

from keras.models import Model

from keras.layers import Dense, Dropout, Flatten, Input, merge

from keras.layers import Convolution2D, MaxPooling2D

from keras.preprocessing.image import ImageDataGenerator

from PIL import Image

import os, random

import numpy as np

from keras.models import model_from_json

from util import CharacterTable

from keras.callbacks import EarlyStopping

from sklearn.model_selection import train_test_split

# from keras.utils.visualize_util import plot

def load_data(path='img/clearNoise/'):

    fnames = [os.path.join(path, fname) for fname in os.listdir(path) if fname.endswith('jpg')]

    random.shuffle(fnames)

    data, label = [], []

    for i, fname in enumerate(fnames):

        imgLabel = fname.split('/')[-].split('_')[]

        if len(imgLabel)!=:

            print 'error: ', fname

            continue

        imgM = np.array(Image.open(fname).convert('L'))

        imgM =  * (imgM>)

        data.append(imgM.reshape((, , )))

        label.append(imgLabel.lower())

    return np.array(data), label

ctable = CharacterTable()

data, label = load_data()

print data[].max(), data[].min()

label_onehot = np.zeros((len(label), ))

for i, lb in enumerate(label):

    label_onehot[i,:] = ctable.encode(lb)

print data.shape, data[-].max(), data[-].min()

print label_onehot.shape

datagen = ImageDataGenerator(shear_range=0.08, zoom_range=0.08, horizontal_flip=False,

                            rotation_range=, width_shift_range=0.06, height_shift_range=0.06)

datagen.fit(data)

x_train, x_test, y_train, y_test = train_test_split(data, label_onehot, test_size=0.1)

DEBUG = False

# 建模

if DEBUG:

    input_img = Input(shape=(, , ))

    inner = Convolution2D(, , , border_mode='same', activation='relu')(input_img)

    inner = MaxPooling2D(pool_size=(,))(inner)

    inner = Convolution2D(, , , border_mode='same')(inner)

    inner = Convolution2D(, , , border_mode='same')(inner)

    inner = MaxPooling2D(pool_size=(,))(inner)

    inner = Convolution2D(, , , border_mode='same')(inner)

    encoder_a = Flatten()(inner)

    inner = Convolution2D(, , , border_mode='same', activation='relu')(input_img)

    inner = MaxPooling2D(pool_size=(,))(inner)

    inner = Convolution2D(, , , border_mode='same')(inner)

    inner = Convolution2D(, , , border_mode='same')(inner)

    inner = MaxPooling2D(pool_size=(,))(inner)

    inner = Convolution2D(, , , border_mode='same')(inner)

    encoder_b = Flatten()(inner)

    inner = Convolution2D(, , , border_mode='same', activation='relu')(input_img)

    inner = MaxPooling2D(pool_size=(,))(inner)

    inner = Convolution2D(, , , border_mode='same')(inner)

    inner = Convolution2D(, , , border_mode='same')(inner)

    inner = MaxPooling2D(pool_size=(,))(inner)

    inner = Convolution2D(, , , border_mode='same')(inner)

    encoder_c = Flatten()(inner)

    input = merge([encoder_a, encoder_b, encoder_c], mode='concat', concat_axis=-)

    drop = Dropout(0.5)(input)

    flatten = Dense()(drop)

    flatten = Dropout(0.5)(flatten)

    fc1 = Dense(, activation='softmax')(flatten)

    fc2 = Dense(, activation='softmax')(flatten)

    fc3 = Dense(, activation='softmax')(flatten)

    fc4 = Dense(, activation='softmax')(flatten)

    fc5 = Dense(, activation='softmax')(flatten)

    fc6 = Dense(, activation='softmax')(flatten)

    merged = merge([fc1, fc2, fc3, fc4, fc5, fc6], mode='concat', concat_axis=-)

    model = Model(input=input_img, output=merged)

else:

    model = model_from_json(open('model/ba_cnn_model3.json').read())

    model.load_weights('model/ba_cnn_model3.h5')

# 编译

# model.compile(loss='categorical_crossentropy', optimizer='sgd', metrics=['accuracy'])

model.summary()

model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

# plot(model, to_file='model3.png', show_shapes=True)

# 训练

early_stopping = EarlyStopping(monitor='val_loss', patience=)

model.fit_generator(datagen.flow(x_train, y_train, batch_size=), samples_per_epoch=len(x_train), nb_epoch=, validation_data=(x_test, y_test), callbacks=[early_stopping] )

json_string = model.to_json()

with open('./model/ba_cnn_model4.json', 'w') as fw:

    fw.write(json_string)

model.save_weights('./model/ba_cnn_model4.h5')

print 'done saved model cnn3'

# 测试

y_pred = model.predict(x_test, verbose=)

cnt =

for i in range(len(y_pred)):

    guess = ctable.decode(y_pred[i])

    correct = ctable.decode(y_test[i])

    if guess == correct:

        cnt +=

    if i%==:

        print '--'*, i

        print 'y_pred', guess

        print 'y_test', correct

print cnt/float(len(y_pred))

apicode.py 模型使用

#!/usr/bin/env python

# coding=utf-

from util import CharacterTable

from keras.models import model_from_json

from PIL import Image

import matplotlib.pyplot as plt

import os

import numpy as np

from prepare import clearNoise

def img2vec(fname):

    data = []

    img = clearNoise(fname).convert('L')

    imgM = 1.0 * (np.array(img)>)

    print imgM.max(), imgM.min()

    data.append(imgM.reshape((, , )))

    return np.array(data), imgM

ctable = CharacterTable()

model = model_from_json(open('model/ba_cnn_model4.json').read())

model.load_weights('model/ba_cnn_model4.h5')

def test(path):

    fnames = [ os.path.join(path, fname) for fname in os.listdir(path) ][:]

    correct =

    for idx, fname in enumerate(fnames, ):

        data, imgM = img2vec(fname)

        y_pred = model.predict(data)

        result = ctable.decode(y_pred[])

        label = fname.split('/')[-].split('_')[]

        if result == label:

            correct +=

            print 'correct', fname

        else:

            print result, label

        print 'accuracy: ',idx, float(correct)/idx

        print '=='*

#        plt.subplot()

#        plt.imshow(Image.open(fname).convert('L'), plt.cm.gray)

#        plt.title(fname)

#

#        plt.subplot()

#        plt.imshow(imgM, plt.cm.gray)

#        plt.title(result)

#        plt.show()

test('test')

cnn进行端到端的验证码识别改进的更多相关文章

基于tensorflow的‘端到端’的字符型验证码识别源码整理(github源码分享)
基于tensorflow的‘端到端’的字符型验证码识别 1 Abstract 验证码(CAPTCHA)的诞生本身是为了自动区分自然人和机器人的一套公开方法, 但是近几年的人工智能技术的发展 ...
基于python语言的tensorflow的‘端到端’的字符型验证码识别源码整理(github源码分享)
基于python语言的tensorflow的‘端到端’的字符型验证码识别 1 Abstract 验证码(CAPTCHA)的诞生本身是为了自动区分自然人和机器人的一套公开方法, 但是近几年的 ...
CNN+BLSTM+CTC的验证码识别从训练到部署
项目地址:https://github.com/kerlomz/captcha_trainer 1. 前言本项目适用于Python3.6,GPU>=NVIDIA GTX1050Ti,原mast ...
【转】CNN+BLSTM+CTC的验证码识别从训练到部署
[转]CNN+BLSTM+CTC的验证码识别从训练到部署转载地址:https://www.jianshu.com/p/80ef04b16efc 项目地址:https://github.com/ker ...
[验证码识别技术] 字符型验证码终结者-CNN+BLSTM+CTC
验证码识别(少样本,高精度)项目地址:https://github.com/kerlomz/captcha_trainer 1. 前言本项目适用于Python3.6,GPU>=NVIDIA G ...
Python实现各类验证码识别
项目地址: https://github.com/kerlomz/captcha_trainer 编译版下载地址: https://github.com/kerlomz/captcha_trainer ...
基于SVM的字母验证码识别
基于SVM的字母验证码识别摘要本文研究的问题是包含数字和字母的字符验证码的识别.我们采用的是传统的字符分割识别方法,首先将图像中的字符分割出来,然后再对单字符进行识别.首先通过图像的初步去噪.滤波 ...
[验证码识别技术]字符验证码杀手--CNN
字符验证码杀手--CNN 1 abstract 目前随着深度学习,越来越蓬勃的发展,在图像识别和语音识别中也表现出了强大的生产力.对于普通的深度学习爱好者来说,一上来就去跑那边公开的大型数据库,比如I ...
强智教务系统验证码识别 Tensorflow CNN
强智教务系统验证码识别 Tensorflow CNN 一直都是使用API取得数据,但是API提供的数据较少,且为了防止API关闭,先把验证码问题解决使用Tensorflow训练模型,强智教务系统的验 ...

随机推荐

20165313 《Java程序设计》第八周学习总结
教材学习总结线程常用方法 1.start() 2.run()定义线程线程对象被调度之后所执行的操作 3.sleep(int millsecond),必须在try-catch语句块中调用sleep方法 ...
【传输协议】什么是CA证书
1.什么是CA证书. 看过一些博客,写的比较形象具体. ◇ 普通的介绍信想必大伙儿都听说过介绍信的例子吧?假设 A 公司的张三先生要到 B 公司去拜访,但是 B 公司的所有人都不认识他,他咋办捏?常 ...
c# 自定义log4net过滤器
有时候为了实现自己想要的多个日志文件记录不同的内容,可能需要自定义log4net过滤器,比如我这里需要记录三个文件,这三个文件的内容又不能重复,多次尝试未果. 为了不更改任何现有日志代码的情况下,于是 ...
java_架构与模式
框架有哪些?C++语言的QT.MFC.gtk,Java语言的SSH,php语言的 smarty(MVC模式),python语言的django(MTV模式)等等设计模式有哪些?工厂模式.适配器模式.策略 ...
HTTP请求属性说明
1)URL:页面地址. 2)Method :页面的提交方式,POST或GET. 3)EncType:编码类型.此参数给出一个内容类型(Content-Type),指定其做为回放脚本时“Content- ...
Java基础语法第2节 Java语言基本语法
一.标识符和关键字 1.标识符 1)java中标识符用来为程序的白能量.常量.方法.类.接口和包名命名,标识符由字母.数字.下划线.美元符号组成,且第一个字符不能是数字: 2)标志符命名规则:见名知意 ...
redis之 3.0集群安装
1. 集群即使有了主从复制,每个数据库都要保存整个集群中的所有数据,容易形成木桶效应. 使用Jedis实现了分片集群,是由客户端控制哪些key数据保存到哪个数据库中,如果在水平扩容时就必须手动进行数 ...
linux应用之gcc环境的安装
使用如下两个命令就可把gcc,gcc-c++统统安装 yum -y install gcc yum -y install gcc-c++ 但是用yum install gcc安装gcc编译环境,关于 ...
LOJ 2587 「APIO2018」铁人两项——圆方树
题目:https://loj.ac/problem/2587 先写了 47 分暴力. 对于 n<=50 的部分, n3 枚举三个点,把图的圆方树建出来,合法条件是 c 是 s -> f 路 ...
CF 316G3 Good Substrings——广义后缀自动机
题目:http://codeforces.com/contest/316/problem/G3 对询问串和模式串一起建一个后缀自动机,做出在每个串上的 right 集合大小之后枚举自动机上的每个点看看 ...

cnn进行端到端的验证码识别改进

cnn进行端到端的验证码识别改进的更多相关文章

随机推荐

热门专题