ONNX Runtime 源码阅读：Graph::SetGraphInputsOutputs() 函数

前言
正文
总结

前言

为了深入理解ONNX Runtime的底层机制，本文将对 Graph::SetGraphInputsOutputs() 的代码逐行分析。

正文

首先判断Graph是否从ONNX文件中加载所得：

if (is_loaded_from_model_file_) return Status::OK();

如果是，可直接返回；如果不是，则需要解析Graph中的节点，从而设置模型的输入和输出。

将Graph中的成员变量 value_info_、graph_inputs_excluding_initializers_、graph_inputs_including_initializers_ 以及 graph_outputs_ 全部清空：

value_info_.clear();

graph_inputs_excluding_initializers_.clear();

if (!graph_inputs_manually_set_) {

  graph_inputs_including_initializers_.clear();

} else {

  std::unordered_set<std::string> existing_names;

  for (auto arg : graph_inputs_including_initializers_) {

    const std::string& name = arg->Name();

    if (existing_names.count(name) == 0) {

      graph_inputs_excluding_initializers_.push_back(arg);

      existing_names.insert(name);

    }

  }

}

if (!graph_outputs_manually_set_) {

  graph_outputs_.clear();

}

设置一些局部变量，方便下面的使用分析：

std::unordered_map<std::string, size_t> output_name_to_node_arg_index;

std::vector<const NodeArg*> output_node_args_in_order;

std::unordered_set<std::string> added_input_names{outer_scope_node_arg_names_};

统计所有节点的输出，添加到以上局部变量（output_name_to_node_arg_index 和 output_node_args_in_order）中：

for (const auto& node : Nodes()) {

  for (const auto* output_def : node.OutputDefs()) {

    if (output_def->Exists()) {

      output_node_args_in_order.push_back(output_def);

      output_name_to_node_arg_index.insert({output_def->Name(), output_node_args_in_order.size() - 1});

    }

  }

}

auto graph_output_args = output_name_to_node_arg_index;  // 拷贝一份输出节点map

然后遍历图中每个节点以及每个节点的输入：

for (const auto& node : Nodes()) {

  // Go thru all node's inputs.

  for (const auto* input_arg : node.InputDefs()) {

    ...

  }

}

在输出节点name列表中查找当前输入name：

auto output_arg_iter = output_name_to_node_arg_index.find(input_arg->Name());

如果没有找到，说明这个节点的输入就是图的输入，接下来还需要判断这个输入是否已经放在局部变量added_input_names中：

if (output_name_to_node_arg_index.end() == output_arg_iter) {

  // This input arg is not the output of another node so must come from either a graph input or an initializer.

  const std::string& name = input_arg->Name();

  if (added_input_names.end() == added_input_names.find(name)) {

    ...

  }

}

如果已经放到局部变量added_input_names中，就可以判断节点的下一个输入或者下一个节点的输入。如果没有放到局部变量added_input_names中：

bool is_initializer = name_to_initial_tensor_.find(name) != name_to_initial_tensor_.end();  // 判断当前input_arg是否已初始化过的tensor，如果是就不可以再放置到 graph_inputs_excluding_initializers_ 中

if (!graph_inputs_manually_set_) {   // 如果未主动调用 SetInputs() 方法

  // if IR version < 4 all initializers must have a matching graph input

  // (even though the graph input is not allowed to override the initializer).

  // if IR version >= 4 initializers are not required to have a matching graph input.

  // any graph inputs that are to override initializers must be specified by calling SetInputs.

  if (!is_initializer || ir_version_ < 4) {

    graph_inputs_including_initializers_.push_back(input_arg);

  }

  if (!is_initializer) {

    // If input_arg is not of an initializer, we add it into graph_inputs_excluding_initializers_.

    graph_inputs_excluding_initializers_.push_back(input_arg);

  }

} else {  // 如果主动调用了 SetInputs() 方法

  // graph_inputs_including_initializers_ has been manually populated by SetInputs.

  // Validation: the <input_arg> must be in graph inputs or initializers when it's manually set.

  if (!is_initializer) {

    const auto& inputs = graph_inputs_including_initializers_;

    bool in_inputs = std::find(inputs.begin(), inputs.end(), input_arg) != inputs.end();

    if (!in_inputs) {

      return Status(ONNXRUNTIME, FAIL,

                    name + " must be either specified in graph inputs or graph initializers.");

    }

  } else {

    // If arg_input is of an initializer, we remove it from graph_inputs_excluding_initializers_

    // whose initial content has both initializers and non-initializers.

    auto input_pos = std::find(graph_inputs_excluding_initializers_.begin(),

                                graph_inputs_excluding_initializers_.end(),

                                input_arg);

    if (input_pos != graph_inputs_excluding_initializers_.end()) {

      graph_inputs_excluding_initializers_.erase(input_pos);

    }

  }

}

added_input_names.insert(name);

可以看到，这里会把当前的 input_arg 分别放到 graph_inputs_including_initializers_ 和 graph_inputs_excluding_initializers_ 中，并将name放在added_input_names中。

如果该输入的name已经在输出节点name列表中，说明这个节点是中间输出结果，而非整个图的输出，因此应该将其从图的输出（graph_output_args）中删除，并放在 value_info_ 中：

if (output_name_to_node_arg_index.end() == output_arg_iter) {

  ...

}else if(graph_output_args.erase(output_arg_iter->first) >= 1){

  value_info_.insert(input_arg);

}

以上我们对Graph的三个成员变量：graph_inputs_including_initializers_、graph_inputs_excluding_initializers_和value_info_分别进行了赋值，其中前两者存储输入，后者存储中间结果。我们还需要处理图的输出结果：｀graph_outputs_｀：

if (!graph_outputs_manually_set_) {

  // Set graph outputs in order.

  std::vector<size_t> graph_output_args_index;

  graph_output_args_index.reserve(graph_output_args.size());

  for (const auto& output_arg : graph_output_args) {          // graph_output_args原本存储了所有节点的输出，但是前面的代码已经把中间节点的输出给移除了，因此剩下的就是整个Graph的输出

    graph_output_args_index.push_back(output_arg.second);

  }

  std::sort(graph_output_args_index.begin(), graph_output_args_index.end());

  for (auto& output_arg_index : graph_output_args_index) {

    graph_outputs_.push_back(output_node_args_in_order[output_arg_index]);

  }

}

最后，还需要对 graph_overridable_initializers_ 进行处理：

ComputeOverridableInitializers();

进入这个函数内部：

void Graph::ComputeOverridableInitializers() {

  graph_overridable_initializers_.clear();

  if (CanOverrideInitializer()) {

    // graph_inputs_excluding_initializers_ and graph_inputs_including_initializers_

    // are inserted in the same order. So we walk and compute the difference.

    auto f_incl = graph_inputs_including_initializers_.cbegin();

    const auto l_incl = graph_inputs_including_initializers_.cend();

    auto f_excl = graph_inputs_excluding_initializers_.cbegin();

    const auto l_excl = graph_inputs_excluding_initializers_.cend();

    while (f_incl != l_incl) {

      // Equal means not an initializer

      if (f_excl != l_excl && *f_incl == *f_excl) {

        ++f_incl;

        ++f_excl;

        continue;

      }

      graph_overridable_initializers_.push_back(*f_incl);

      ++f_incl;

    }

  }

}

这是一个很简单的算法，通过比较 graph_inputs_including_initializers_ 和 graph_inputs_excluding_initializers_，提取出 initializer 并放置到 graph_overridable_initializers_ 中。

至此，我们完成了对 Graph::SetGraphInputsOutputs() 函数的解析。

总结

针对这个函数的解析不仅理解了如何从Graph的nodes中分析出graph的输入和输出，而且懂得了graph_overridable_initializers_以及value_info_的作用。

ONNX Runtime 源码阅读：Graph::SetGraphInputsOutputs() 函数的更多相关文章

linux源码阅读笔记 fork函数
在阅读源码的过程中,发现找不到fork函数的定义.后来在linux/init/main.c中找到了这样一条语句 static inline _syscall0(int,fork) 原来这里就是fork ...
［PHP源码阅读］number_format函数
上次讲到PHP是如何解析大整数的,一笔带过了number_format的处理,再详细阅读该函数的源码,以下是小分析. 函数原型 string number_format ( float $number ...
linux源码阅读笔记 asm函数
在linux源码中经常遇到__asm__函数.它其实是函数asm的宏定义 #define __asm__ asm,asm函数让系统执行汇编语句. __asm__常常与__volatile__一起出现. ...
Runtime 源码阅读
Runtime 属性说明 /** * 每一个 Java 应用程序都有一个关联的运行时对象 * * @author unascribed * @see java.lang.Runtime#getRunt ...
[PHP源码阅读]explode和implode函数
explode和implode函数主要用作字符串和数组间转换的操作,比如获取一段参数后根据某个字符分割字符串,或者将一个数组的结果使用一个字符合并成一个字符串输出.在PHP中经常会用到这两个函数,因此 ...
CI框架源码阅读笔记3 全局函数Common.php
从本篇开始,将深入CI框架的内部,一步步去探索这个框架的实现.结构和设计. Common.php文件定义了一系列的全局函数(一般来说,全局函数具有最高的加载优先权,因此大多数的框架中BootStrap ...
3 EventTime 事件时间类和TimeNow函数——Live555源码阅读(一)基本组件类
这是Live555源码阅读的第一部分,包括了时间类,延时队列类,处理程序描述类,哈希表类这四个大类. 这里是时间相关类的第三个部分,也是最后一个部分. EventTime 事件时间类这个类和Dela ...
PHP源码阅读笔记一（explode和implode函数分析）
PHP源码阅读笔记一一.explode和implode函数array explode ( string separator, string string [, int limit] )此函数返回由字符 ...
[PHP源码阅读]strtolower和strtoupper函数
字符串的操作函数中,字符串的大小写转换也算是比较常用的函数,其底层实现也比较简单,下面来一探究竟. 我在github上有对PHP源码更详细的注解.感兴趣的可以围观一下,给个star.PHP5.4源码注 ...

随机推荐

maven下载出现unknown文件夹
问题场景 maven下载配置完成后,发现如上图代码包下载失败,本地maven库中出现unknown文件夹,也就是说,maven无法定位下载到上面的代码包. 解决过程仔细观察发现,所有下载失败的代码包 ...
关于 OOP 和设计模式？
这部分包含 Java 面试过程中关于 SOLID 的设计原则,OOP 基础,如类,对象, 接口,继承,多态,封装,抽象以及更高级的一些概念,如组合.聚合及关联. 也包含了 GOF 设计模式的问题.
如何实现集群中的 session 共享存储？
Session 是运行在一台服务器上的,所有的访问都会到达我们的唯一服务器上,这样我们可以根据客户端传来的 sessionID,来获取 session,或在对应 Session 不存在的情况下(s ...
java-流式编程
流式编程流的一个核心好处是,它使得程序更加短小并且更易理解. public class Demo1 { public static void main(String[] args) { new Ra ...
Spring Bean生命周期回调
参阅官方文档:https://docs.spring.io/spring/docs/current/spring-framework-reference/core.html#beans-factory ...
学习openstack（三）
一.OpenStack初探 1.1 OpenStack简介 OpenStack是一整套开源软件项目的综合,它允许企业或服务提供者建立.运行自己的云计算和存储设施.Rackspace与NASA是最初 ...
学习GlusterFS（一）
一.概述 1.GlusterFS是集群式NAS存储系统,分布式文件系统(POSIX兼容),Tcp/Ip方式互联的一个并行的网络文件系统,通过原生 GlusterFS 协议访问数据,也可以通过 NFS/ ...
cpu指令如何读写硬盘
我们提到cpu的主要作用之一就是控制设备之间的数据交互.这其中自然也包括了硬盘.系统的所有数据基本都在硬盘中,所以知道怎么读写硬盘,对程序来说非常重要,所以我们先来探索下传说中的pio模式. cpu要 ...
Dockerize an ASP.NET Core application
原文:Dockerize an ASP.NET Core application 介绍本示例演示了如何对ASP.NET Core应用程序进行容器化. 为什么要构建ASP.NET Core? 开源在 ...
关于mui中一个页面有有多个页签进行切换的下拉刷新加搜索问题
此图是最近做的项目中的一页,用的是mui结合vue,用了mui后,觉得是真心难用啊,先不说其他的,就光这个下拉刷新就让人奔溃了,问题层出不穷,不过最后经过努力还是摆平了哈. 1.每次切换到新的标签,都 ...

ONNX Runtime 源码阅读：Graph::SetGraphInputsOutputs() 函数

前言

正文

总结

ONNX Runtime 源码阅读：Graph::SetGraphInputsOutputs() 函数的更多相关文章

随机推荐

热门专题