（原）torch模型转pytorch模型

转载请注明出处：

http://www.cnblogs.com/darkknightzh/p/7839263.html

目前使用的torch模型转pytorch模型的程序为：

https://github.com/clcarwin/convert_torch_to_pytorch

该程序中，常见的模型都可以转换，但是对于torch中为BatchNormalization的则会提示出错：

Not Implement BatchNormalization

torch中的SpatialBatchNormalization对应于输入为4d的特征（batchsize*featdim*featHeight*featWidth），对应于pytorch中的nn.BatchNorm2d。

而torch中的BatchNormalization对应于输入为2d的特征（batchsize*featdim），对应于pytorch中的nn.BatchNorm1d。

因而修改方法很简单：

1. 在convert_torch.py的行（elif name == 'ReLU':）之前添加：

elif name == 'BatchNormalization':

    n = nn.BatchNorm1d(m.running_mean.size(0), m.eps, m.momentum, m.affine)

    copy_param(m,n)

    add_submodule(seq,n)

2. 在convert_torch.py的（未修改前的）行（elif name == 'ReLU':）之前添加：

elif name == 'BatchNormalization':

    s += ['nn.BatchNorm1d({},{},{},{}),#BatchNorm1d'.format(m.running_mean.size(0), m.eps, m.momentum, m.affine)]

3. 在convert_torch.py的（未修改前的）行（s = map(lambda x: x.replace(',(0, 0),ceil_mode=False),#MaxPool2d',')'),s)）之前添加：

s = map(lambda x: x.replace(',1e-05,0.1,True),#BatchNorm1d',')'),s)

s = map(lambda x: x.replace('),#BatchNorm1d',')'),s)

经过上述修改后，torch模型中含有BatchNormalization，转换到pytorch后的模型性能和转换前的模型性能一致。

顺便说一下，2天前更新的该程序，添加了BatchNorm3d的支持，但是在243、244行之后，并没有增加BatchNorm3d的相关代码，不清楚是否会有问题。我这边没有用到BatchNorm3d，因而没有测试。

另一方面，上面的3步中，我是根据BatchNorm2d去修改，没有测试如果不修改某一步（如第3步），程序是否会有问题。反正都改了，模型没有问题。。。

（原）torch模型转pytorch模型的更多相关文章

生产与学术之Pytorch模型导出为安卓Apk尝试记录
生产与学术写于 2019-01-08 的旧文, 当时是针对一个比赛的探索. 觉得可能对其他人有用, 就放出来分享一下生产与学术, 真实的对立... 这是我这两天对pytorch深度学习->a ...
将Pytorch模型从CPU转换成GPU
1. 如何进行迁移对模型和相应的数据进行.cuda()处理.通过这种方式,我们就可以将内存中的数据复制到GPU的显存中去.从而可以通过GPU来进行运算了. 1.1 判定使用GPU 下载了对应的GPU ...
使用C++调用pytorch模型(Linux)
前言模型转换思路通常为: Pytorch -> ONNX -> TensorRT Pytorch -> ONNX -> TVM Pytorch -> 转换工具 -> ...
使用C++调用并部署pytorch模型
1.背景(Background) 上图显示了目前深度学习模型在生产环境中的方法,本文仅探讨如何部署pytorch模型! 至于为什么要用C++调用pytorch模型,其目的在于:使用C++及多线程可以加 ...
DEX-6-caffe模型转成pytorch模型办法
在python2.7环境下文件下载位置:https://data.vision.ee.ethz.ch/cvl/rrothe/imdb-wiki/ 1.可视化模型文件prototxt 1)在线可视化 ...
PyTorch模型加载与保存的最佳实践
一般来说PyTorch有两种保存和读取模型参数的方法.但这篇文章我记录了一种最佳实践,可以在加载模型时避免掉一些问题. 第一种方案是保存整个模型: 1 torch.save(model_object, ...
从零搭建Pytorch模型教程（三）搭建Transformer网络
前言本文介绍了Transformer的基本流程,分块的两种实现方式,Position Emebdding的几种实现方式,Encoder的实现方式,最后分类的两种方式,以及最重要的数据格式的介绍. ...
Pytorch模型量化
在深度学习中,量化指的是使用更少的bit来存储原本以浮点数存储的tensor,以及使用更少的bit来完成原本以浮点数完成的计算.这么做的好处主要有如下几点: 更少的模型体积,接近4倍的减少: 可以更快 ...
计算机网络原理和OSI模型与TCP模型
计算机网络原理和OSI模型与TCP模型一.计算机网络的概述 1.计算机网络的定义计算机网络是一组自治计算机的互连的集合 2.计算机网络的基本功能 a.资源共享 b.分布式处理与负载均衡 c.综合信 ...

随机推荐

CSS-background-position百分比
关于背景图片的位置其background-position设置背景图片的位置有两种方式,一种是是根据像素设置,第二种根据百分比设置,第一种根据像素的位置是很简单的,只是关于百分比这个设置理解特别容易出 ...
Context Application 使用总结 MD
Markdown版本笔记我的GitHub首页我的博客我的微信我的邮箱 MyAndroidBlogs baiqiantao baiqiantao bqt20094 baiqiantao@sina ...
卡尔曼滤波算法--核心公式推导导论 - ZZ
卡尔曼滤波算法--核心公式推导导论 10 个月前写在最前面:这是我第一篇专栏文章,感谢知乎提供这么一个平台,让自己能和大家分享知识.本人会不定期的开始更新文章,文章的内容应该集中在汽车动力学控制,整 ...
fastjson生成json时Null属性不显示（转）
http://blog.csdn.net/u010648555/article/details/51422340 null对应的key已经被过滤掉:这明显不是我们想要的结果,这时我们就需要用到fast ...
强制开启android webview debug模式使用Chrome inspect
强制开启android webview debug模式使用Chrome inspect https://blog.csdn.net/zhulin2609/article/details/5143782 ...
OPENGL: WHY IS YOUR CODE PRODUCING A BLACK WINDOW?
Introduction One of the most common problems for novice, and sometimes experienced, OpenGL program ...
[Functional Programming] Create Reusable Functions with Partial Application in JavaScript
This lesson teaches you how arguments passed to a curried function allow us to store data in closure ...
GPUImage简单滤镜使用（二）
GPUImage中,提供了许多简单的的常用的滤镜.在上一篇文章讲了如何调节图像的亮度这片文章讲一下如何通过GPUImage调节图像的对比度,饱和度,曝光度,和白平衡(美图秀秀中的色温). 原图像调整 ...
ECShop模板原理
模板的原理类似Smarty/ECShop这类模板的原理如下图所示. 1.首先是编译模板ECShop/Smart是利用PHP引擎,所以编译的结果是一个PHP文件,其编译过程就是将分隔符{}替换成PH ...
【转】Ant之build.xml详解
关键字: ant build.xml Ant的概念可能有些读者并不连接什么是Ant以及入可使用它,但只要使用通过Linux系统得读者,应该知道make这个命令.当编译Linux内核及一些软件的源程序 ...

（原）torch模型转pytorch模型

（原）torch模型转pytorch模型的更多相关文章

随机推荐

热门专题