技术背景

这篇文章来源于MindSpore仓库中的一个Issue,简单描述问题就是,如果你用MindSpore开发了一个python软件供别人使用,那么很有可能涉及到编译构建的问题。但是如果直接使用编译好的whl包去运行的话,就有可能出现一个跟Jit即时编译有关的报错,这里Jit在其他的一些模块中也会被使用到,比如Vmap函数和Grad函数等。

问题复现

我们通过一个简单的测试案例来复现一下这个RuntimeError。

软件环境

-- MindSpore version: 2.2.11

-- Python version: 3.9.16

-- OS platform and distribution: Linux Ubuntu 20.04

执行模式

GRAPH_MODE

复现代码结构

  1. debug/
  2. ├── debug
  3. ├── __init__.py
  4. └── test_vmap.py
  5. ├── example
  6. └── test.py
  7. └── setup.py

代码内容

setup.py

  1. from setuptools import setup, find_packages
  2. from pathlib import Path
  3. this_directory = Path(__file__).parent
  4. setup(
  5. name="debugs",
  6. version="1.0",
  7. description="Test Vmap",
  8. license="Apache 2.0 Licence",
  9. packages=find_packages(),
  10. platforms="any",
  11. scripts=[],
  12. include_package_data=True
  13. )

test_vmap.py

  1. from mindspore import ops
  2. func = lambda ts: ts
  3. batch_func = ops.vmap(func, in_axes=(0, ), out_axes=(0, ))

test.py

  1. # import sys
  2. # sys.path.insert(0, '../')
  3. from debug.test_vmap import batch_func
  4. from mindspore import Tensor
  5. a = Tensor([0, 1])
  6. batch_a = batch_func(a)
  7. print (batch_a)

复现步骤

  1. 按照目录树结构构建好本地测试复现环境;
  2. 取消test.py文件中的两行注释,运行python3 test.py;
  3. 通过setup.py构建安装python3 setup.py install,然后把test.py文件的头两行注释掉,再次运行python3 test.py。

预期结果

两次运行test.py都输出[0 1]

报错信息

第一次测试,为了方便代码阅读,使用了lambda函数,后来发现这个报错可能是即时编译跟lambda函数不兼容所导致的:

后来修改成了普通的函数,才复现了一个RuntimeError:

test_vmap.py

  1. from mindspore import ops, jit
  2. @jit
  3. def func(ts):
  4. return ts
  5. batch_func = ops.vmap(func, in_axes=(0, ), out_axes=(0, ))

得到的报错信息为:

  1. Traceback (most recent call last):
  2. File "test.py", line 8, in <module>
  3. batch_a = batch_func(a)
  4. File "/home/dechin/anaconda3/envs/mindspore-latest/lib/python3.7/site-packages/mindspore/common/api.py", line 718, in staging_specialize
  5. out = _MindsporeFunctionExecutor(func, hash_obj, input_signature, process_obj, jit_config)(*args, **kwargs)
  6. File "/home/dechin/anaconda3/envs/mindspore-latest/lib/python3.7/site-packages/mindspore/common/api.py", line 121, in wrapper
  7. results = fn(*arg, **kwargs)
  8. File "/home/dechin/anaconda3/envs/mindspore-latest/lib/python3.7/site-packages/mindspore/common/api.py", line 350, in __call__
  9. raise err
  10. File "/home/dechin/anaconda3/envs/mindspore-latest/lib/python3.7/site-packages/mindspore/common/api.py", line 344, in __call__
  11. phase = self.compile(self.fn.__name__, *args_list, **kwargs)
  12. File "/home/dechin/anaconda3/envs/mindspore-latest/lib/python3.7/site-packages/mindspore/common/api.py", line 435, in compile
  13. is_compile = self._graph_executor.compile(self.fn, compile_args, kwargs, phase, True)
  14. RuntimeError: 'VmapOperation' arg0 must be a 'Function' or 'Cell', but got AbstractScalar(Type: External, Value: PythonObject(type: <class 'function'>, value: <function func at 0x7f75c0375ef0>), Shape: NoShape).
  15. ----------------------------------------------------
  16. - C++ Call Stack: (For framework developers)
  17. ----------------------------------------------------
  18. mindspore/ccsrc/frontend/operator/composite/composite.cc:1420 CheckVmapFunc
  19. ----------------------------------------------------
  20. - The Traceback of Net Construct Code:
  21. ----------------------------------------------------
  22. # 0 In file /home/dechin/anaconda3/envs/mindspore-latest/lib/python3.7/site-packages/mindspore/ops/composite/base.py:686
  23. return vmap_(fn, in_axes, out_axes)(*args, **kwargs)
  24. ^
  25. (See file '/tmp/debug/example/rank_0/om/analyze_fail.ir' for more details. Get instructions about `analyze_fail.ir` at https://www.mindspore.cn/search?inputValue=analyze_fail.ir)

问题原因

按照开发人员的回复,这个问题是因为Vmap会使用到静态图模式。但是编译成whl包之后,静态图模式下会把whl包的内容识别为第三方仓库。从第三方仓库来的函数,有可能出现无法入图的问题:

解决的方法就是,把相应的仓库添加到环境变量中去:

  1. export MS_JIT_MODULES=debug

然后再次运行test.py,问题就解决了。

总结概要

在MindSpore编译计算图的过程中,会把从编译构建好的whl包中引入的模块视为第三方库,也就没有办法在即时编译的阶段入图。普通的math和numpy等第三方库不入图也不会影响计算。但如果是基于MindSpore本身开发的一些函数,如果用到了Jit、Grad和Vmap,那么有可能出现无法入图的问题,就会出现RuntimeError报错。解决方法就是设置一个跟即时编译有关的环境变量,把相关的第三方包引用修改为内部引用。

版权声明

本文首发链接为:https://www.cnblogs.com/dechinphy/p/ms_jit_module.html

作者ID:DechinPhy

更多原著文章:https://www.cnblogs.com/dechinphy/

请博主喝咖啡:https://www.cnblogs.com/dechinphy/gallery/image/379634.html

MindSpore编译构建后Vmap模块的RuntimeError问题的更多相关文章

  1. 纯干货!华为软件开发云编译构建之Maven

    一.Maven介绍 Maven是一个项目管理和整合的工具.Maven为开发者提供了一套完整的构建生命周期框架.开发团队基本不用花多少时间就能自动完成工程的基础构建配置,因为Maven使用了一个标准的目 ...

  2. Jenkins构建Maven多模块项目时,单独编译子模块,并且不触发构建其它模块

    一.Jenkins构建Maven多模块项目时,单独编译子模块 配置: 1.Root POM指向父pom.xml 2.Goals and options指定构建模块的参数:mvn -pl jsoft-w ...

  3. php自己编译安装后,再给这个编译安装的php版本添加拓展模块的处理办法。

    原文: https://www.cnblogs.com/zongyl/p/5924627.html 说明,给编译安装之后的php 添加pgsql 拓展成功. --------------------- ...

  4. 踩坑经验总结之go web开源库第一次编译构建

    前言:记录一个go新手第一次构建复杂开源库的经历.go虽然是新手,但是编程上还是有多年的经验,除了c/c++,用过IDEA能进行简单的java编程.甚至scala编程.所以最开始还是有点信心的.所以也 ...

  5. MindSpore尝鲜之Vmap功能

    技术背景 Vmap是一种在python里面经常提到的向量化运算的功能,比如之前大家常用的就是numba和jax中的向量化运算的接口.虽然numpy中也使用到了向量化的运算,比如计算两个numpy数组的 ...

  6. 构建seajs业务模块之grunt VS spm build

    在最开始,我并不知道grunt可以构建CMD模块.(以下spm指代spm build) 当时正困惑于如何用spm方便的构建业务模块,后来看到@twinstony (感谢@twinstony的分享)使用 ...

  7. Linux下编译安装Apache及模块

    Apache是时下最流行的Webserver软件之中的一个,支持多平台,可高速搭建web服务,并且稳定可靠.并可通过简单的API扩充.就能够集成PHP/Python等语言解释器. 文章这里解说怎样在l ...

  8. linux内核裁剪及编译可加载模块

    一:linux内核裁剪: 1:编译内核源码: 今天的重点内容是内核驱动的编写,在编写驱动之前首先的了解linux内核源码,linux主要是由五个子系统组成:进程调度,内存管理,文件系统,网络接口以及进 ...

  9. pbuilder编译构建工具分析

    1. 简介 pbuilder(personal Debian package builder)是ubuntu环境下维护debian包的专业工具,能够为每个deb包创建纯净的编译构建环境,自动解析和安装 ...

  10. Java秒杀系统实战系列~构建SpringBoot多模块项目

    摘要:本篇博文是“Java秒杀系统实战系列文章”的第二篇,主要分享介绍如何采用IDEA,基于SpringBoot+SpringMVC+Mybatis+分布式中间件构建一个多模块的项目,即“秒杀系统”! ...

随机推荐

  1. C++ auto与循环

    C++ auto与循环 C++ auto 的介绍 typeid(p).name();可以输出auto的类型 auto 是 C++11 引入的一个关键字,用于自动类型推导.编译器会根据初始化表达式的类型 ...

  2. 解决windows11远程连接阿里云Centos7

    本地连接CentOs7时报错   Permission denied (publickey,gssapi-keyex,gssapi-with-mic). 网上大部分说的是去修改 vim /etc/ss ...

  3. electron fiddle 下载 镜像 下载不下来 已解决 electron-api-demos 安装

    fiddle 官网 https://www.electronjs.org/fiddle 一共3步 1. npm config set registry https://registry.npm.tao ...

  4. 基于python源码的啸叫抑制算法解析

    一 原理解析 从下图一中可以看出,该算法的原理也是先检测出来啸叫,然后通过陷波器来进行啸叫抑制的,和笔者以前分析的所用方法基本耦合. ​   二 源码分析   函数PAPR:计算峰值功率和平均功率的比 ...

  5. 什么叫运行时的Java程序?

    Java程序的运行包含编写.编译和运行三个主要步骤. 1.在编写阶段: 开发人员在Java开发环境中输入程序代码,形成后缀名为.java的Java源文件. 2.在编译阶段: 使用Java编译器对源文件 ...

  6. github拉项目显示timeOut

    参考:https://blog.csdn.net/qq_37424778/article/details/132018804 自己尝试在github上拉项目,但是报错LibreSSL SSL_read ...

  7. hibernate之createQuery与createSQLQuery

    信息: java.lang.ClassCastException: [Ljava.lang.Object; cannot be cast to com.miracle.dm.doc.catalog.m ...

  8. 关于全景(360)图片拼接的方法(Opencv3.0 Stitcher)

    PS:要转载请注明出处,本人版权所有. PS: 这个只是基于<我自己>的理解, 如果和你的原则及想法相冲突,请谅解,勿喷. 前置说明   本文作为本人csdn blog的主站的备份.(Bl ...

  9. Spring Boot学习日记15

    使用thymeleaf <!DOCTYPE html> <html lang="en" xmlns:th="http://www.thymeleaf.o ...

  10. tomcat正常启动,但网页拒绝连接的解决方法

    当发生拒绝连接的时候 1.首先要排除端口的占用 上一篇文章已经详细介绍了,这里不再赘述tomcat端口配置 2.设置防火墙放行tomcat 3.配置环境变量 此电脑→属性→高级系统设置→环境变量 点击 ...