U-net网络实现医学图像分割以及遥感图像分割源代码

U-net网络主要思路是源于FCN，采用全卷积网络，对图像进行逐像素分类，能在图像分割领域达到不错的效果。

因其网络结构类似于U型，所以以此命名，可以由其架构清晰的看出，其构成是由左端的卷积压缩层，以及右端的转置卷积放大层组成；

左右两端之间还有联系，通过灰色箭头所指，右端在进行转置卷积操作的时候，会拼接左端前几次卷积后的结果，这样可以保证得到

更多的信息。

在网络的末端得到两张feature map之后还需要通过softmax函数得到概率图，整个网络输出的是类别数量的特征图，最后得到的是类别的概率图，针对每个像素点给出其属于哪个类别的概率。

Unet网络的结构提出主要是为了使用在医学图像分割领域，它与fcn相比，有以下有优点：1.多尺度 2.能适应超大图像的

输入。

unet的卷积过程，是从高分辨率（浅层特征）到低分辨率（深层特征）的过程。

unet的特点就是通过反卷积过程中的拼接，使得浅层特征和深层特征结合起来。对于医学图像来说，unet能用深层特征用于定位，浅层特征用于精确分割，所以unet常见于很多图像分割任务。

其在Keras实现的部分代码解析如下：

 from model import *

 from data import *#导入这两个文件中的所有函数

 #os.environ[“CUDA_VISIBLE_DEVICES”] = “0”

 data_gen_args = dict(rotation_range=0.2,

                     width_shift_range=0.05,

                     height_shift_range=0.05,

                     shear_range=0.05,

                     zoom_range=0.05,

                     horizontal_flip=True,

                     fill_mode=‘nearest’)#数据增强时的变换方式的字典

 myGene = trainGenerator(2,‘data/membrane/train’,‘image’,‘label’,data_gen_args,save_to_dir = None)

 #得到一个生成器，以batch=2的速率无限生成增强后的数据

 model = unet()

 model_checkpoint = ModelCheckpoint(‘unet_membrane.hdf5’, monitor=‘loss’,verbose=1, save_best_only=True)

 #回调函数，第一个是保存模型路径，第二个是检测的值，检测Loss是使它最小，第三个是只保存在验证集上性能最好的模型

 model.fit_generator(myGene,steps_per_epoch=300,epochs=1,callbacks=[model_checkpoint])

 #steps_per_epoch指的是每个epoch有多少个batch_size，也就是训练集总样本数除以batch_size的值

 #上面一行是利用生成器进行batch_size数量的训练，样本和标签通过myGene传入

 testGene = testGenerator(“data/membrane/test”)

 results = model.predict_generator(testGene,30,verbose=1)

 #30是step,steps: 在停止之前，来自 generator 的总步数 (样本批次)。 可选参数 Sequence：如果未指定，将使用len(generator) 作为步数。

 #上面的返回值是：预测值的 Numpy 数组。

 saveResult(“data/membrane/test”,results)#保存结果

 1

 data.py文件：

 from __future__ import print_function

 from keras.preprocessing.image import ImageDataGenerator

 import numpy as np

 import os

 import glob

 import skimage.io as io

 import skimage.transform as trans

 Sky = [128,128,128]

 Building = [128,0,0]

 Pole = [192,192,128]

 Road = [128,64,128]

 Pavement = [60,40,222]

 Tree = [128,128,0]

 SignSymbol = [192,128,128]

 Fence = [64,64,128]

 Car = [64,0,128]

 Pedestrian = [64,64,0]

 Bicyclist = [0,128,192]

 Unlabelled = [0,0,0]

 COLOR_DICT = np.array([Sky, Building, Pole, Road, Pavement,

                           Tree, SignSymbol, Fence, Car, Pedestrian, Bicyclist, Unlabelled])

 def adjustData(img,mask,flag_multi_class,num_class):

     if(flag_multi_class):#此程序中不是多类情况，所以不考虑这个

         img = img / 255

         mask = mask[:,:,:,0] if(len(mask.shape) == 4) else mask[:,:,0]

 #if else的简洁写法，一行表达式，为真时放在前面，不明白mask.shape=4的情况是什么，由于有batch_size，所以mask就有3维[batch_size,wigth,heigh],估计mask[:,:,0]是写错了，应该写成[0,:,:],这样可以得到一片图片，

         new_mask = np.zeros(mask.shape + (num_class,))

 #np.zeros里面是shape元组，此目的是将数据厚度扩展到num_class层，以在层的方向实现one-hot结构

         for i in range(num_class):

             #for one pixel in the image, find the class in mask and convert it into one-hot vector

             #index = np.where(mask == i)

             #index_mask = (index[0],index[1],index[2],np.zeros(len(index[0]),dtype = np.int64) + i) if (len(mask.shape) == 4) else (index[0],index[1],np.zeros(len(index[0]),dtype = np.int64) + i)

             #new_mask[index_mask] = 1

             new_mask[mask == i,i] = 1#将平面的mask的每类，都单独变成一层，

         new_mask = np.reshape(new_mask,(new_mask.shape[0],new_mask.shape[1]*new_mask.shape[2],new_mask.shape[3])) if flag_multi_class else np.reshape(new_mask,(new_mask.shape[0]*new_mask.shape[1],new_mask.shape[2]))

         mask = new_mask

     elif(np.max(img) > 1):

         img = img / 255

         mask = mask /255

         mask[mask > 0.5] = 1

         mask[mask <= 0.5] = 0

     return (img,mask)

 #上面这个函数主要是对训练集的数据和标签的像素值进行归一化

 def trainGenerator(batch_size,train_path,image_folder,mask_folder,aug_dict,image_color_mode = "grayscale",

                     mask_color_mode = "grayscale",image_save_prefix  = "image",mask_save_prefix  = "mask",

                     flag_multi_class = False,num_class = 2,save_to_dir = None,target_size = (256,256),seed = 1):

     '''

     can generate image and mask at the same time

     use the same seed for image_datagen and mask_datagen to ensure the transformation for image and mask is the same

     if you want to visualize the results of generator, set save_to_dir = "your path"

     '''

     image_datagen = ImageDataGenerator(**aug_dict)

     mask_datagen = ImageDataGenerator(**aug_dict)

     image_generator = image_datagen.flow_from_directory(#https://blog.csdn.net/nima1994/article/details/80626239

         train_path,#训练数据文件夹路径

         classes = [image_folder],#类别文件夹,对哪一个类进行增强

         class_mode = None,#不返回标签

         color_mode = image_color_mode,#灰度，单通道模式

         target_size = target_size,#转换后的目标图片大小

         batch_size = batch_size,#每次产生的（进行转换的）图片张数

         save_to_dir = save_to_dir,#保存的图片路径

         save_prefix  = image_save_prefix,#生成图片的前缀，仅当提供save_to_dir时有效

         seed = seed)

     mask_generator = mask_datagen.flow_from_directory(

         train_path,

         classes = [mask_folder],

         class_mode = None,

         color_mode = mask_color_mode,

         target_size = target_size,

         batch_size = batch_size,

         save_to_dir = save_to_dir,

         save_prefix  = mask_save_prefix,

         seed = seed)

     train_generator = zip(image_generator, mask_generator)#组合成一个生成器

     for (img,mask) in train_generator:

 #由于batch是2，所以一次返回两张，即img是一个2张灰度图片的数组，[2,256,256]

         img,mask = adjustData(img,mask,flag_multi_class,num_class)#返回的img依旧是[2,256,256]

         yield (img,mask)

 #每次分别产出两张图片和标签，不懂yield的请看https://blog.csdn.net/mieleizhi0522/article/details/82142856

  # yield相当于生成器

 #上面这个函数主要是产生一个数据增强的图片生成器，方便后面使用这个生成器不断生成图片

 def testGenerator(test_path,num_image = 30,target_size = (256,256),flag_multi_class = False,as_gray = True):

     for i in range(num_image):

         img = io.imread(os.path.join(test_path,"%d.png"%i),as_gray = as_gray)

         img = img / 255

         img = trans.resize(img,target_size)

         img = np.reshape(img,img.shape+(1,)) if (not flag_multi_class) else img

         img = np.reshape(img,(1,)+img.shape)

 #将测试图片扩展一个维度，与训练时的输入[2,256,256]保持一致

         yield img

 #上面这个函数主要是对测试图片进行规范，使其尺寸和维度上和训练图片保持一致

 def geneTrainNpy(image_path,mask_path,flag_multi_class = False,num_class = 2,image_prefix = "image",mask_prefix = "mask",image_as_gray = True,mask_as_gray = True):

     image_name_arr = glob.glob(os.path.join(image_path,"%s*.png"%image_prefix))

 #相当于文件搜索，搜索某路径下与字符匹配的文件https://blog.csdn.net/u010472607/article/details/76857493/

     image_arr = []

     mask_arr = []

     for index,item in enumerate(image_name_arr):#enumerate是枚举，输出[(0,item0),(1,item1),(2,item2)]

         img = io.imread(item,as_gray = image_as_gray)

         img = np.reshape(img,img.shape + (1,)) if image_as_gray else img

         mask = io.imread(item.replace(image_path,mask_path).replace(image_prefix,mask_prefix),as_gray = mask_as_gray)

 #重新在mask_path文件夹下搜索带有mask字符的图片（标签图片）

         mask = np.reshape(mask,mask.shape + (1,)) if mask_as_gray else mask

         img,mask = adjustData(img,mask,flag_multi_class,num_class)

         image_arr.append(img)

         mask_arr.append(mask)

     image_arr = np.array(image_arr)

     mask_arr = np.array(mask_arr)#转换成array

     return image_arr,mask_arr

 #该函数主要是分别在训练集文件夹下和标签文件夹下搜索图片，然后扩展一个维度后以array的形式返回，是为了在没用数据增强时的读取文件夹内自带的数据

 def labelVisualize(num_class,color_dict,img):

     img = img[:,:,0] if len(img.shape) == 3 else img

     img_out = np.zeros(img.shape + (3,))

 #变成RGB空间，因为其他颜色只能再RGB空间才会显示

     for i in range(num_class):

         img_out[img == i,:] = color_dict[i]

 #为不同类别涂上不同的颜色，color_dict[i]是与类别数有关的颜色，img_out[img == i,:]是img_out在img中等于i类的位置上的点

     return img_out / 255

 #上面函数是给出测试后的输出之后，为输出涂上不同的颜色，多类情况下才起作用，两类的话无用

 def saveResult(save_path,npyfile,flag_multi_class = False,num_class = 2):

     for i,item in enumerate(npyfile):

         img = labelVisualize(num_class,COLOR_DICT,item) if flag_multi_class else item[:,:,0]

 #多类的话就图成彩色，非多类（两类）的话就是黑白色

         io.imsave(os.path.join(save_path,"%d_predict.png"%i),img)

 #下面是model.py：

 import numpy as np

 import os

 import skimage.io as io

 import skimage.transform as trans

 import numpy as np

 from keras.models import *

 from keras.layers import *

 from keras.optimizers import *

 from keras.callbacks import ModelCheckpoint, LearningRateScheduler

 from keras import backend as keras

 def unet(pretrained_weights = None,input_size = (256,256,1)):

     inputs = Input(input_size)

     conv1 = Conv2D(64, 3, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal')(inputs)

     conv1 = Conv2D(64, 3, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal')(conv1)

     pool1 = MaxPooling2D(pool_size=(2, 2))(conv1)

     conv2 = Conv2D(128, 3, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal')(pool1)

     conv2 = Conv2D(128, 3, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal')(conv2)

     pool2 = MaxPooling2D(pool_size=(2, 2))(conv2)

     conv3 = Conv2D(256, 3, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal')(pool2)

     conv3 = Conv2D(256, 3, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal')(conv3)

     pool3 = MaxPooling2D(pool_size=(2, 2))(conv3)

     conv4 = Conv2D(512, 3, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal')(pool3)

     conv4 = Conv2D(512, 3, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal')(conv4)

     drop4 = Dropout(0.5)(conv4)

     pool4 = MaxPooling2D(pool_size=(2, 2))(drop4)

     conv5 = Conv2D(1024, 3, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal')(pool4)

     conv5 = Conv2D(1024, 3, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal')(conv5)

     drop5 = Dropout(0.5)(conv5)

     up6 = Conv2D(512, 2, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal')(UpSampling2D(size = (2,2))(drop5))#上采样之后再进行卷积，相当于转置卷积操作！

     merge6 = concatenate([drop4,up6],axis=3)

     conv6 = Conv2D(512, 3, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal')(merge6)

     conv6 = Conv2D(512, 3, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal')(conv6)

     up7 = Conv2D(256, 2, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal')(UpSampling2D(size = (2,2))(conv6))

     merge7 = concatenate([conv3,up7],axis = 3)

     conv7 = Conv2D(256, 3, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal')(merge7)

     conv7 = Conv2D(256, 3, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal')(conv7)

     up8 = Conv2D(128, 2, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal')(UpSampling2D(size = (2,2))(conv7))

     merge8 = concatenate([conv2,up8],axis = 3)

     conv8 = Conv2D(128, 3, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal')(merge8)

     conv8 = Conv2D(128, 3, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal')(conv8)

     up9 = Conv2D(64, 2, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal')(UpSampling2D(size = (2,2))(conv8))

     merge9 = concatenate([conv1,up9],axis = 3)

     conv9 = Conv2D(64, 3, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal')(merge9)

     conv9 = Conv2D(64, 3, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal')(conv9)

     conv9 = Conv2D(2, 3, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal')(conv9)

     conv10 = Conv2D(1, 1, activation = 'sigmoid')(conv9)#我怀疑这个sigmoid激活函数是多余的，因为在后面的loss中用到的就是二进制交叉熵，包含了sigmoid

     model = Model(input = inputs, output = conv10)

     model.compile(optimizer = Adam(lr = 1e-4), loss = 'binary_crossentropy', metrics = ['accuracy'])#模型执行之前必须要编译https://keras-cn.readthedocs.io/en/latest/getting_started/sequential_model/

     #利用二进制交叉熵，也就是sigmoid交叉熵，metrics一般选用准确率，它会使准确率往高处发展

     #model.summary()

     if(pretrained_weights):

      model.load_weights(pretrained_weights)

     return model

U-net网络实现医学图像分割以及遥感图像分割源代码的更多相关文章

Python 3网络爬虫开发实战》中文PDF+源代码+书籍软件包
Python 3网络爬虫开发实战>中文PDF+源代码+书籍软件包下载:正在上传请稍后... 本书书籍软件包为本人原创,在这个时间就是金钱的时代,有些软件下起来是很麻烦的,真的可以为你们节省很多 ...
paper 61：计算机视觉领域的一些牛人博客，超有实力的研究机构等的网站链接
转载出处:blog.csdn.net/carson2005 以下链接是本人整理的关于计算机视觉(ComputerVision, CV)相关领域的网站链接,其中有CV牛人的主页,CV研究小组的主页,CV ...
关于国内外CV领域牛人的博客链接 .
此文为转载文章,尊重知识产权http://blog.csdn.net/carson2005/article/details/6601109此为原文链接,感谢作者! 以下链接是关于计算机视觉(Compu ...
深度学习图像分割——U-net网络
写在前面: 一直没有整理的习惯,导致很多东西会有所遗忘,遗漏.借着这个机会,养成一个习惯. 对现有东西做一个整理.记录,对新事物去探索.分享. 因此博客主要内容为我做过的,所学的整理记录以及新的算法. ...
【Network telemetry】谈谈网络遥感技术，从主动探测与被动探测再到Netflow与INT
[前言] [本篇为原创]网络遥感,Network telemetry,为什么叫“telemetry”呢?我个人的理解是将网络中的数据进行一种“采集”,也就是实际上是一种网络数据的采集手段.由于工作需要 ...
【Keras】基于SegNet和U-Net的遥感图像语义分割
上两个月参加了个比赛,做的是对遥感高清图像做语义分割,美其名曰"天空之眼".这两周数据挖掘课期末project我们组选的课题也是遥感图像的语义分割,所以刚好又把前段时间做的成果重新 ...
图像分割必备知识点 | Unet++超详解+注解
文章来自周纵苇大佬的知乎,是Unet++模型的一作大佬,其在2019年底详细剖析了Unet++模型,讲解的非常好.所以在此做一个搬运+个人的理解. 文中加粗部分为个人做的注解.需要讨论交流的朋友可以加 ...
[搜片神器]直接从DHT网络下载BT种子的方法
DHT抓取程序开源地址:https://github.com/h31h31/H31DHTDEMO 数据处理程序开源地址:https://github.com/h31h31/H31DHTMgr DHT系 ...
unix网络编程环境搭建
unix网络编程环境搭建网络编程环境 1.点击下载源代码可以通过下列官网中的源代码目录下载最新代码: http://www.unpbook.com/src.html 2.解压文件 tar -xz ...

随机推荐

CentOS7部署Django,nginx,uwsgi,redis
前期准备把所有的软件都传到这个tools文件夹 cd - mkdir tools cd tools/ mkdir /application 安装nginx yum install pcre pcre ...
Matlab将多项式的系数设为0
符号运算时有些多项式的系数值接近于0,像这样 fun = 3.5753839759325595498222646101085e-49*x + 1.836709923159824231201150839 ...
CodeForces 528D Fuzzy Search 多项式 FFT
原文链接http://www.cnblogs.com/zhouzhendong/p/8782849.html 题目传送门 - CodeForces 528D 题意给你两个串$A,B(|A|\geq| ...
配置ubuntu的超管账号密码
1 在搭建ubuntu 之后只有自己的账号 2 root 用户是没有配置好的需要重新配置 3 passwd root 4 输入新密码即可
一天带你入门到放弃vue.js(三)
自定义指令在上面学习了自定义组件接下来看一下自定义指令自己新建的标签赋予特殊功能的是组件,而指定是在标签上使用类似于属性,以v-name开头,v-on,v-if...是系统指令! v-是表示这是v ...
Zlib:error can't decompress data; zlib not available
查看:yum list |grep zlib* 看到的是全部都安装好的: 版本为1.2.3,现在要升级为1.2.11 卸载 [root@biluos1 zlib-1.2.11]# rpm –nodep ...
Python中何时使用断言
这个问题是如何在一些场景下使用断言表达式,通常会有人误用它,所以我决定写一篇文章来说明何时使用断言,什么时候不用. 为那些还不清楚它的人,Python的assert是用来检查一个条件,如果它为真,就不 ...
我的 FPGA 学习历程（04）—— 练习 verilog 硬件描述语言
这篇讲的是使用 verilog 硬件描述语言编写一个 3 - 8 译码器. 3 - 8 译码器是一个简单的组合逻辑,用于实现并转串,其输入输出关系如下: | 输入 | 输出 | -------- ...
新浪云SAE 关于部分函数不能使用的做法
例如:file_put_contents("test.txt","Hello World. Testing!"); 可以这样写: file_put_conten ...
Jmeter初步
Jmeter 3. 去掉没有必要的结果记录对于一些不必要的日志信息可以暂时不要记录. 例如:结果树. 当然可以勾选记录那些失败的日志. 聚合报告中,点击 configure,根据需求设置自己想要保 ...

U-net网络实现医学图像分割以及遥感图像分割源代码

U-net网络实现医学图像分割以及遥感图像分割源代码的更多相关文章

随机推荐

热门专题