关键字 MMdnn,keras,mxnet,resnet50

需求:想测试一下keras下model转到MXNet框架下对于同一张图片各中间层输出结果有什么差异。

一. 前期准备

1. 依赖库的选择

由于各个库之间的依赖关系是存在限制关系的,最新的版本未必是最合适的,因此通过比较,最终确定的各个依赖库版本如下:

Python 3.5

Anaconda 4.2.0

Tensorflow 1.13.1

Mxnet 1.4.0

Mmdnn 0.2.4

Numpy 1.16.2

但是 mxnet 1.4.0.post0 要求numpy的版本<1.15.0,>=1.8.2,理论上来说是会出问题的,但是使用的时候没有报错。

2. 预训练模型的下载

使用resnet50为测试模型,按照MMdnn文档的指示,下载resnet50的预训练模型只需要如下命令:

mmdownload -f keras -n resnet50

二. 正式开始

将keras模型转化为Mxnet模型,官方提供了两种方法,为了对比keras和Mxnet便于调试,使用Step by Step方式,其步骤如下。

Step 1

mmtoir -f keras -w imagenet_resnet50.h5 -o converted

IR network structure is saved as [converted.json].

IR network structure is saved as [converted.pb].

IR weights are saved as [converted.npy].

Then you got the intermediate representation files converted.json for visualization, converted.pb and converted.npy for next steps.

Step 2

mmtocode -f mxnet -d converted_resnet50_mxnet.py -n converted.pb -w converted.npy -dw mxnet_converted-0000.param

And you will get a file named converted_resnet50_mxnet.py, which contains the mxnet codes to build the resnet50 network, the file named mxnet_converted-0000.param contains the parameters to build the network.

通过上述两个步骤即可得到keras到mxnet的resnet50的转换代码。

三. 框架对比

为了输出两种框架的中间结果,需要对代码进行处理(以最后一层为例)。

1. Keras

layer_model = Model(inputs=model.input, outputs=model.layers[-1].output)

其中-1表示的是resnet50最后一层输出的结果

features_keras =layer_model.predict(x_keras)

features_keras最后的数据就是最后的结果

2. Mxnet

fc1000_activation = mx.sym.SoftmaxOutput(data = fc1000, name = 'softmax')

group = mx.symbol.Group([fc1000_activation])

model = mx.mod.Module(symbol = group, context = mx.cpu(), data_names = ['input_1'])

model.forward(Batch([mx.nd.array(img)]))

features_mxnet = model.get_outputs()[0]

features_mxnet = features_mxnet.asnumpy()

features_keras最后的数据就是最后的结果

四. 结论

在预处理相同操作的情况下,比较了很多层基本上都是相同的,以最后一层为例,其误差量级是e-13左右,差值的方差是e-17左右。

参考:

[1]. https://github.com/Microsoft/MMdnn

[2]. https://github.com/Microsoft/MMdnn/blob/master/docs/keras2cntk.md

[3]. https://blog.csdn.net/u010414386/article/details/55668880

利用MMdnn对比keras和mxnet的更多相关文章

  1. 常用深度学习框——Caffe/ TensorFlow / Keras/ PyTorch/MXNet

    常用深度学习框--Caffe/ TensorFlow / Keras/ PyTorch/MXNet 一.概述 近几年来,深度学习的研究和应用的热潮持续高涨,各种开源深度学习框架层出不穷,包括Tenso ...

  2. MxNet+R︱用R语言实现深度学习(单CPU/API接口,一)

    MxNet有了亚马逊站台之后,声势大涨,加之接口多样化,又支持R语言所以一定要学一下.而且作为R语言的fans,为啥咱们R语言就不能上深度学习嘞~ -------------------------- ...

  3. Tensorflow1.4 高级接口使用(estimator, data, keras, layers)

    TensorFlow 高级接口使用简介(estimator, keras, data, experiment) TensorFlow 1.4正式添加了keras和data作为其核心代码(从contri ...

  4. Keras:

    https://keras.io/zh/layers/core/ keras使用稀疏输入进行训练 2018.06.14 12:55:46字数 902阅读 760 稀疏矩阵 稀疏矩阵是指矩阵中数值为0的 ...

  5. ML平台_微博深度学习平台架构和实践

    ( 转载至: http://www.36dsj.com/archives/98977)  随着人工神经网络算法的成熟.GPU计算能力的提升,深度学习在众多领域都取得了重大突破.本文介绍了微博引入深度学 ...

  6. 深度学习常用数据集 API(包括 Fashion MNIST)

    基准数据集 深度学习中经常会使用一些基准数据集进行一些测试.其中 MNIST, Cifar 10, cifar100, Fashion-MNIST 数据集常常被人们拿来当作练手的数据集.为了方便,诸如 ...

  7. Speech Enhancement via Deep Spectrum Image Translation Network

    文中提出了一种深度网络来解决单通道语音增强问题. 链接:https://arxiv.org/abs/1911.01902 简介 因为背景噪声和混响的存在,录音通常会被扭曲,会对后端的语音识别等技术产生 ...

  8. Tensorflow 介绍和安装

    欢迎大家关注我们的网站和系列教程:http://www.tensorflownews.com/,学习更多的机器学习.深度学习的知识! 作者:AI小昕 本系列教程将手把手带您从零开始学习Tensorfl ...

  9. Deep Learning部署TVM Golang运行时Runtime

    Deep Learning部署TVM Golang运行时Runtime 介绍 TVM是一个开放式深度学习编译器堆栈,用于编译从不同框架到CPU,GPU或专用加速器的各种深度学习模型.TVM支持来自Te ...

随机推荐

  1. 【dp】导弹拦截

    题目链接 https://www.luogu.org/problemnew/show/P1020 题目描述 某国为了防御敌国的导弹袭击,发展出一种导弹拦截系统.但是这种导弹拦截系统有一个缺陷:虽然它的 ...

  2. LuoguP4233 射命丸文的笔记

    题目描述 求所有\(n\)个点带标号强连通竞赛图中哈密顿回路数量的平均值. 题解 因为要求平均数,所以我们可以把分母和分子单开来算. \(n\)个点的所有竞赛图的所有哈密顿回路个数是可以求出来的,就是 ...

  3. Http input plugin

    logstash作为一个数据输入端.提供http服务,接收客户端的http请求,获取发送的内容. 在config目录下新建文件: vim config/http-input.yml input { h ...

  4. java异常和错误相关

    1.挺常见的一个问题,是个error java.lang.NoClassDefFoundError: 当目前执行的类已经编译,但是找不到它的定义时 也就是说你如果编译了一个类B,在类A中调用,编译完成 ...

  5. java 判断语句和循环语句

    一.判断语句:if和switch if(关系表达式1) { 语句体1; }else if (关系表达式2) { 语句体2; }…else { 语句体n+; } switch(表达式) { case 值 ...

  6. 神经网络1_neuron network原理_python sklearn建模乳腺癌细胞分类器(推荐AAA)

    sklearn实战-乳腺癌细胞数据挖掘(博客主亲自录制视频教程) https://study.163.com/course/introduction.htm?courseId=1005269003&a ...

  7. my live thinkcenter / ThinkCentre M920x Tiny / Thinkpad yoga 12 vPro

    s 025-58816312 联想3C服务中心:栖霞区学海路鸿运家园1栋6室 / 珠江路华海大厦8楼联想服务中心 营业时间:周一至周日,9:00∼18:00 ThinkPad Yoga 12 i7 v ...

  8. ActiveMQ 的安装与使用(单节点)

    环境:CentOS6.6.JDK8 1.下载:http://archive.apache.org/dist/activemq/5.11.1/apache-activemq-5.11.1-bin.tar ...

  9. Redis集群管理

    1.简介 Redis在生产环境中一般是通过集群的方式进行运行,Redis集群包括主从复制集群和数据分片集群两种类型. *主从复制集群提供高可用性,而数据分片集群提供负载均衡. *数据分片集群中能实现主 ...

  10. 072、一文搞懂各种Docker网络 (2019-04-17 周三)

    参考https://www.cnblogs.com/CloudMan6/p/7587532.html   前面各个小节我们学习了 Docker Overlay .Macvlan .Flannel.We ...