本文是 VMBC / D# 项目 的 系列文章,

有关 VMBC / D# , 见 《我发起并创立了一个 VMBC 的 子项目 D#》(以下简称 《D#》)  https://www.cnblogs.com/KSongKing/p/10348190.html   。

ILBC 运行时       架构图    如下:

为了便于讲解,   图中 一些位置 标注了 红色数字 。

ILBC 运行时  包含  3 个 部分:   调度程序 、 InnerC(Byte Code to Native Code) 、 GC  。

1 处,  调度程序 调用 入口程序集 的  ILBC_Main()  函数, 开始执行程序 。

如果 入口程序集 是 ILBC 程序集, 就会 调用  InnerC(Byte Code to Native Code) 编译  ILBC 程序集 为 本地程序集(2 处) 。

ILBC 程序集 就是  ILBC Byte Code 程序集,  本地程序集 就是 本地代码 程序集  。

如果 入口程序集 是 ILBC 程序集, 就直接调用  ILBC_Main()  函数, 开始执行程序 。

3 处 表示  A 程序集 引用了  B 程序集,  在 调度程序 加载 A 程序集 的 时候, 会调用 A 本地程序集 的  ILBC_GetAssembly()  函数,

ILBC_GetAssembly()  函数   之前没有提到, 现在补充上来 。

ILBC_GetAssembly()  函数   会返回 A 程序集 引用 的 程序集 列表,  包含了 这些 程序集 的 名字 。

程序集 列表 是一个 数组, 数组元素 是 一个 字符数组 的 首地址,  这个 字符数组 就是  程序集 的 名字 。

调度程序 会 根据 程序集列表 去 加载 列表 里的 程序集,

假设 A 程序集 引用了 B 程序集, 则 程序集 列表 里有 B,   调度程序 会先把 B 加载到内存, 如果 B 是 本地代码程序集, 则 直接加载到内存, 如果 B 是 ILBC 程序集, 则 先 JIT 编译 为 本地代码程序集, 再加载到内存 。

4 处 表示 ILBC 程序集 JIT 编译 为 本地程序集 后 投入使用 。

把 B 加载到 内存后, 调用 B 的  ILBC_GetMethodList()  函数,  返回 B 的 函数表 首地址, 另一方面, 调度程序 会 调用 A 的  ILBC_GetMethodListList()  函数, 返回  “函数表 列表”  的 首地址,   “函数表 列表”  是  一个数组, 数组元素 是 函数表 首地址,  所以是  “函数表 的 列表”  。

这样, 把 B 的 函数表 首地址 存到     函数表 列表 中  B  的 位置,   加载 A 和 “依赖项” B 的 过程 就完成了 。

如果 A 还引用了 其它 程序集,  或者 B 引用了 其它 程序集,  也是 按照 这个 过程 依次加载  。

上面这个 过程 说的有点啰嗦, 没事, 我们先来看一下   InnerC  的架构,  等下再把这个流程 总结一遍  。

InnerC  的 架构如下:

InnerC 分为  2 个 模块 :

1   InnerC  to  Byte Code

2   Byte Code  to  Native Code

InnerC  to  Byte Code   的 职责 是 语法分析 和 类型检查,  语法分析 包含了 语法检查 。

通过 语法分析, 把  C 代码 解析 为 表达式对象树,  然后 对 表达式对象树 进行 类型检查,

类型检查 通过后,  就可以 返回 表达式对象树 了,

表达式对象树 可以直接 传给   Byte Code  to  Native Code,

Byte Code  to  Native Code   负责 将 表达式 生成为 目标代码 和 链接(链接外部库), 最终 生成 本地库,

这就是 AOT 编译  。

表达式对象树 也可以 序列化, 序列化 得到的 byte 数组(byte [ ]) 就是 Byte Code, Byte Code 保存为 文件 就是  ILBC 程序集 。

ILBC 程序集 可以 读取为 byte 数组(byte [ ]),  byte 数组 反序列化 就是   表达式对象树,  表达式对象树  传给  Byte Code  to  Native Code  编译为 本地库,

这就是 JIT 编译  。

C 代码 是 第一级 中间代码,   Byte Code 是 第二级 中间代码  。

这就是  InnerC  的 架构,  以及  AOT 编译  和  JIT 编译 的 原理  。

我们可以把   C 中间代码 文件 的 扩展名 定义为  .ilc , 意思是 “ILBC C Code”,

把   ILBC 程序集 (Byte Code 文件) 的 扩展名 定义为  .ilb,  意思是 “ILBC Byte Code” 。

本地代码 程序集 的 扩展名 遵循 操作系统 的 规定, 比如 Windows 上 就是 动态链接库  .dll,  因为 本地程序集 就是 操作系统 定义的 动态链接库 。

我们 接下来 把     ILBC 运行时  加载 程序集 和 运行 应用程序 的 流程 总结一下 :

1   调度程序 加载 入口程序集, 如果 入口程序集 是 本地程序集, 就 直接加载到内存,

如果 入口程序集 是 ILBC 程序集, 则 先 JIT 编译, 把 入口程序集 编译为 本地程序集 再加载到内存 。

2   调度程序 调用 入口程序集 的   ILBC_GetAssemblyList() 函数 ,  ILBC_GetAssemblyList() 函数  返回   AssemblyList   首地址  。

AssemblyList  是一个 数组,  数组元素 是一个  char 数组(char [ ]) 的 首地址,  表示   Assembly 的 名字 (文件名, 不包含扩展名)  。

3   调度程序 用  Assembly 名字 查找 当前目录下 的 程序集, 先查找 本地程序集, 比如  “程序集名字.dll”,  如果找到,  直接加载到内存,

如果找不到 本地程序集, 就找  ILBC 程序集,  比如  “程序集名字.ilb”,   如果找到,   先 JIT 编译 为 本地程序集, 再把 本地程序集 加载到内存 。

如果  ILBC 程序集 也没有找到,  就 报错  “找不到 某某 程序集 。”  。

怎么把 本地程序集 加载到内存 ?    这 遵循 操作系统 提供的 方式,   比如   Windows  把  .dll 库 加载到 应用程序 里的 方式  。

总的来说,  加载程序集 的 流程 如上,  从 入口程序集 开始依次加载,  加载完成后,  调用 入口程序集 的  ILBC_Main()  开始 执行程序 。

另外, ILBC_GetMethodListList() 函数   应该是   ILBC_InitializeMethodListList() ,  具体 逻辑 不长, 但讲起来烦琐, 之后看 Demo 代码就清楚了 。

可以看到,  ILBC 运行时 加载 程序集 会 将 所有 引用到的 程序集 全部加载 完成,  才会开始 执行程序 。

这是 和   .Net / C#  不同的 ,    .Net / C#  应该是 用到 这个 程序集 的时候 才会 加载,  用到这个 程序集 是指 第一次 调用到 这个 程序集 里的 类 的时候  。

实际上,   .Net / C#   的 动态加载 的 粒度 可能 更细,  可能是  Class  这一级别 的,

我们在 调试 .Net / C# 程序 的 时候 可以 观察到,  只有 第一次 用到 某个 Class 的 时候,  这个 Class 的 静态构造函数 才会被 调用  。

从这一点上来看,   .Net / C#  的 动态性 比   ILBC   更强,  更加动态  。

进一步,   ILBC 加载 的 单位 是 整个 程序集,  而不是 类(Class),  如果是 本地程序集, 则将  整个 本地程序集 加载到内存,

如果 是  ILBC 程序集, 则 对 整个 ILBC 程序集 进行  JIT 编译,  编译为  本地程序集  后, 再把 整个 本地程序集  加载到内存  。

也因此,   D# / ILBC  不提供  类 的 静态构造函数,   而是 提供一个    ILBC_AssemblyLoad()  函数,    ILBC 运行时 会在 加载 程序集 完成时 调用   ILBC_AssemblyLoad()  函数,  整个程序集 所有 类 的 初始化 工作 可以在   ILBC_AssemblyLoad()   里 来 完成  。

.Net / C#  的  动态性 需要 更加 复杂 的 设计 和 实现,   这不是    ILBC    的   定位 。

我们可以 探讨 一下, 如果要实现 .Net / C#  的 动态性,  比如     第一次 new 类的对象   或者    第一次调用类的静态方法   时,  加载类(如果 Assembly 未加载 则 先加载 Assembly 再加载 Class) 并 调用 类的静态构造函数  这个 动态加载 怎么实现:

我们可以写一段 伪码:

简单起见,  我们假设 Assembly 已经加载了,  只要 判断 类 是否已加载, 若未加载 则 加载 类  。

编译器 会 把 new 类 的 对象, 以及 调用 类的 静态方法 的 代码 处理成 一段 临时代码, 我们称之为 “链接代码”,

假设 该 类 是  A Class,

伪码如下:

bool   ifAClassLoad   =   false;

if (  !   ifAClassLoad   )

{

lock (  ifAClassLoad  )

{

if (   !   ifAClassLoad    )

{

加载 A Class    ;

调用 类 的 静态构造函数    ;

ifAClassLoad    =    true  ;

}

}

}

new ()    或者    A.静态方法()       ;

按照这个 代码 的 逻辑,   第一次 new A()  或者  调用  A.静态方法()  时, 会 判断 A Class 是否已加载,  如果未加载, 会有一个 线程 通知 CLR 加载 A Class, 其它 线程 等待(如果 有 其它线程 也在 new A()  或者  调用  A.静态方法()  的话),   CLR  加载完成后,   就执行 真正的 new A() 或者 A.静态方法() ,

之后, 再  new A()   或者   调用 A.静态方法()    的时候,  在  链接代码  的 第一句,

if (  !   ifAClassLoad   )

就可以 判断 出来 A Class 已经加载,  于是就直接执行   new A()  或者  A.静态方法()   。

但 这样的 做法,  每次     new A()  或者  A.静态方法()     都要有 一个 判断,  虽然 只是一个 判断, 但从 微观 上来说, 也造成了 性能消耗  。

这样的 性能消耗, 应该是  “应该被优化掉的”  。

如果  .Net / C#  已经 把 这个 判断 优化掉了,  那么 应该用到了  “修改已经编译好的本地代码”  的 操作, 形象的讲, 就是给 “已经编译好的本地代码” 做了个 “微创手术”  。

具体就是 在 第一次 加载 成功后,  .Net CLR  会 把 这段  “链接代码”  替换掉,  替换为  new A()  和   A.静态函数()   的 代码,

在 新的    new A()   和   A.静态函数()    代码中,   A()  构造函数   和    A.静态方法()    已经替换为   A Class  加载后的 实际的 函数地址 。

这样,  替换后的 代码 和 访问 同一个 程序集 中的 类 的  代码 是 一样的 。

性能 也和  访问 同一个 程序集 中的 类 一样 。

顺便加一句,  本来 链接代码 中  new A()  和  A.静态函数()   的 部分 还有一个 类似 调用 虚函数 的 查函数表 的 操作,  也被这个 替换 优化掉了 。

这个 技术 很底层,  ILBC 不打算 涉及 这个 技术,

ILBC  仍然 把  C 语言 和  C 编译器(InnerC)  看作一个整体,  不会  介入  C 编译器 的 工作细节 。

不过,  从上面的讨论也可以知道,  如果   ILBC  想实现 和   .Net / C#   一样的  “动态特性”,  比如 用到  A Class  的时候 才 加载  A Class,  如果 A Class 所在的 程序集 未加载 则 先加载程序集 再 加载 A Class,

如果要做到 这样 的 动态特性 的话,  简单点 也可以用 上面的  “链接代码”  的 做法,  只是每次调用  new A() 构造函数 和 A.静态方法()  都要多一个

if (  !   ifAClassLoad   )

的 判断 了 。

还有 就是 查函数表 的 操作 也是要有的 。

当然, 即使不实现这个 “动态特性”,  查函数表 的 操作 也是有的 。

ILBC  的 动态链接 就 相当于 调用 虚函数  。

不过 即使用了 上面  “链接代码”  的 方式, 也只能 “用到某个 程序集 的 时候 才加载 程序集”, 还不能达到 Class 的 粒度,

因为 上文 也说了,    ILBC  是 把 整个  ILBC 程序集 编译成  本地程序集 的,

这是因为   ILBC 程序集 是  C 语言 写的,  C 语言 只能 整个项目(程序集) 一起编译, 不能把 里面的  .c 文件 一个一个 拿出来编译 。

就算能把   若干   .c 文件 任意 的 拿出来 编译,  根据 ILBC 规范,  这些 单独 拿出来的  .c 文件 编译成的 程序集 里 必须要 提供    ILBC_GetAssemblyList(), ILBC_InitializeMethodList(),   ILBC_Link()   函数,  这就乱套了 。  因为 原本的程序集 已经 为 原本的整个项目 生成了 一份 这些 函数 。

假设 A 引用 B,  A 里 编译好的 逻辑 是 引用 B,  现在 把 B 拆成了 若干个 小程序集, 你让 A 怎么引用 ?

ILBC 运行时 (ILBC Runtime) 架构的更多相关文章

  1. java 常用类库:操作系统System类,运行时环境Runtime

    System类: System 类代表Java程序的运行平台,程序不能创建System类的对象, System类提供了一些类变量和类方法,允许直接通过 System 类来调用这些类变量和类方法. Sy ...

  2. iOS运行时编程(Runtime Programming)和Java的反射机制对比

    运行时进行编程,类似Java的反射.运行时编程和Java反射的对比如下:   1.相同点   都可以实现的功能:获取类信息.属性设置获取.类的动态加载(NSClassFromString(@“clas ...

  3. iOS-浅谈runtime运行时机制-runtime简单使用(转)

    转自http://www.cnblogs.com/guoxiao/p/3583432.html 由于OC是运行时语言,只有在程序运行时,才会去确定对象的类型,并调用类与对象相应的方法.利用runtim ...

  4. LoadRunner 学习笔记(2)VuGen运行时设置Run-Time Setting

    定义:在Vugen中Run-Time Setting是用来设置脚本运行时所需要的相关选项

  5. .net core 运行时事件(Runtime Events)

    .Net Core 2.2.0 .Net Core 2.2.0已经发布有一段时间了,很多新鲜功能已经有博主介绍了,今天给大家介绍一下运行时事件并附上demo. 运行时事件 通常需要监视运行时服务(如当 ...

  6. ArcMap运行时出现Runtime Error错误的解决方案

    运行ArcMap时弹出错误提示:“Microsoft Visual C++ Runtime Library. Runtime 1.开始->运行->regsvr32 "C:\Pro ...

  7. Spark运行时的内核架构以及架构思考

    一: Spark内核架构 1,Drive是运行程序的时候有main方法,并且会创建SparkContext对象,是程序运行调度的中心,向Master注册程序,然后Master分配资源. 应用程序: A ...

  8. [转]Loadrunner11之VuGen运行时设置Run-Time Setting

    转自:http://www.51testing.com/html/92/450992-248065.html General 1.Run Logic运行逻辑 脚本如何运行的,每个action和acti ...

  9. iOS开发——高级特性&Runtime运行时特性详解

    Runtime运行时特性详解 本文详细整理了 Cocoa 的 Runtime 系统的知识,它使得 Objective-C 如虎添翼,具备了灵活的动态特性,使这门古老的语言焕发生机.主要内容如下: 引言 ...

随机推荐

  1. 【BZOJ】 4813: [Cqoi2017]小Q的棋盘

    题目链接:http://www.lydsy.com/JudgeOnline/problem.php?id=4813 暴力转移就好,考虑以某一个点为根的子树分为是否走回来两种情况 ${f_{i,j}}$ ...

  2. ActiveMQ组件使用方法

    由于组件使用了spring,故需要相关的spring包及配置 首先,需要加载对应的jar包 然后,编写调用类 package com.demo.testSpring; import com.jfina ...

  3. Bean的Scope

    Bean的scope: 1.Singleton(单例): 一个Spring容器只有以这个Bean实例. 2.prototype(多例): 每次调用新建一个Bean的实例. 3.request:一个ht ...

  4. 监听图片src发生改变时的事件

    $img.on('load', function() { $img.attr("src", getBase64Image($img.get(0))); $img.off('load ...

  5. CloudStack学习-1

    环境准备 实验使用的虚拟机配置 Vmware Workstation 虚拟机系统2个 系统版本:centos6.6 x86_64 内存:4GB 网络:两台机器都是nat 磁盘:装完系统后额外添加个50 ...

  6. 模糊测试(fuzzing)是什么

    一.说明 大学时两个涉及“模糊”的概念自己感觉很模糊.一个是学数据库出现的“模糊查询”,后来逐渐明白是指sql的like语句:另一个是学专业课时出现的“模糊测试”. 概念是懂的,不外乎是“模糊测试是一 ...

  7. 微服务架构演变过程-SpringCloud

  8. Python中文问题

    读取数据库中文是?? 解决如下 一.python2版本需要在 文件的开头要加上编码设置来说明文件的编码  python3版本以上不需要 #encoding=utf-8 二.在连接数据的连接参数里加上字 ...

  9. Excel遇到的坑lookup和vlookup的用法

    lookup (第一种)  lookup必选保证有序查询,学籍号是按顺序排的 如上表格,表格2的成绩输入到表格1成绩中 鼠标选择F3->公式->插入函数->搜索lookup 三个参数 ...

  10. 记一次前端css样式的三角形的应用

    1)面试题是这样的要求用css实现 <section> <div></div> <div></div> </section> & ...