阅读博客的朋友可以到我的网易云课堂中,通过视频的方式查看代码的调试和执行过程:

http://study.163.com/course/courseMain.htm?courseId=1002830012

在通常情况下,编译器会将目标语言转换成某种中间语言格式,而不是直接将源代码转换成二进制机器指令。不少C语言编译器,都会将代码编译成汇编语言,然后再通过汇编编译器将汇编代码转换成目标机器可执行的二进制代码,这么说来,汇编语言其实也是一种中间语言。

编译成中间语言有很多优势,一是可以优化,先把中间语言进行高度优化后,再将其转换成机器指令,那么程序的速度可以成倍的提高。其二是可以实现跨平台,针对同一种中间语言,不同平台的编译器可以将其转换成与该平台兼容的二进制指令,从而使得一种源程序代码可以运行到不同的硬件平台上。

还有一种好处,就是可以通过虚拟机来运行中间语言,从而突破硬件平台对语言的限制,例如java字节码显然就是一种中间语言,运行到java虚拟机上。我们本章或许会将C语言转义成某种字节码,然后开发一个虚拟机来运行生成的字节码。由此,接下来的重点,我们将聚焦到指令集的格式,以及虚拟机的架构设计上。

中间语言的格式:三元组,四元组,逆向波兰格式

中间语言的指令格式,一般如标题所提及的一样,对大多数汇编语言来说,采取的就是三元组形式,这种格式的指令一般包含三部分:操作符,数据源,结果目标。例如指令: 
ADD D0, D1 
意思是将D0寄存器的数值与D1相加,并把相加后的结果存放到寄存器D1中。其实C语言也有等价功能的代码表示: 
d += s; 
上面的语句用数学表示法如下: 
(+=, d, s)

三元组指令格式又可以称为两地址指令,因为大多数指令都由源地址,目标地址,以及操作符构成。

四元组一般由四部分组成,两个数据源地址,一个操作符,一个目标地址,例如: 
d = s1 + s2; 
数学化的表现形式如下: 
(+, d, s1, s2) 
有时候四元组指令并非都包含四部分,例如赋值语句: 
(=, d, s, -) 
第四部分的 -, 不是减号,而是横杆,表示这一部分为空。第一部分表示操作,不能为空,所以上面指令的意思是: 
d = s;

无论是三元组还是四元组,有时候目标地址无需明确的包含在指令中,例如下面两条三元组指令:

(LESS_THAN, a, b) 
(GOTO, target, -)

第一条指令比较两个数的大小,并且将比较结果存放在某个地方,第二条指令的执行将依赖第一条指令的结果,如果第一条指令结果为true, 那么第二条指令将使得程序流跳转到target指定的地址。

有时候,算术运算的指令也不会涉及到目标地址,例如下面两条三元组语句将执行A = B + C: 
(+, B, C) 
(=, A, .-1) 
第一条语句执行完加法运算后,把结果存储到一个内部寄存器叫”加法寄存器”

第二条三元组语句,第三部分的”.”, 表示当前语句所在的地址,那么 “.-1”, 表示的就是上一条语句的地址,因此,第二条语句的作用是把上一条语句的运算结果赋值给A.

三元组相对于四元组有一个优势,就是它与大多数汇编语言的格式很接近。我们本章将代码编译后,所形成的中间语言将采用三元组格式。但四元组也有三元组无法企及的好处,一是简练,例如(+, d, s1, s2), 就需要两条三元组来完成同等功能: 
(=, d, s1) 
(+=, d, s2)

此外,四元组相比于三元组,更容易进行优化,例如上面的两条三元组语句,在优化时,需要将他们当做一个整体对待,代码挪动时需要两条语句一起挪动,而四元组只要挪动一条语句就可以了。

第三种常用的中间语言格式是逆向波兰格式,PostScript, HP计算器,使用的中间代码就是这种格式。这种格式的语句比较容易解析,同时语句解析时不需要分配临时变量。例如表达式:

( 1 + 2 ) * (3 + 4) 
对应的逆向波兰格式为:

1 2 + 3 4 + *

逆向波兰表达式的解析需要一个堆栈, 例如上面语句的解析过程如下: 
stack input action 
empty 1 2 + 3 4 + * push 1 
1 2 + 3 4 + * push 2 
1 2 + 3 4 + * 将栈顶两元素出栈相加, 
然后将相加的结果压入 
堆栈 
3 3 4 + * push 3 
3 3 4 + * push 4 
3 3 4 + * 将栈顶两元素出栈相加然 
后将相加的结果压入堆栈

3 7 * 将栈顶两元素出栈相乘, 
然后将相加的结果压入堆栈 
21 栈顶元素就是计算结果

java开发编译器:中间语言格式的更多相关文章

  1. 阿里巴巴Java开发手册(格式规约篇)——查自己的漏-补自己的缺

    (三) 格式规约 1. [强制]大括号的使用约定.如果是大括号内为空,则简洁地写成{}即可,不需要换行:如果是非空代码块则: 1) 左大括号前不换行.行. 2) 左大括号后换行. 3) 右大括号前换行 ...

  2. 《阿里巴巴Java开发手册》代码格式部分应用——idea中checkstyle的使用教程

    <阿里巴巴Java开发手册>代码格式部分应用--idea中checkstyle的使用教程 1.<阿里巴巴Java开发手册> 这是阿里巴巴工程师送给各位软件工程师的宝典,就像开车 ...

  3. 我的Java开发学习之旅------>工具类:将播放器的进度值转换成相应的时间格式

    在我的博客<我的Java开发学习之旅------>Java 格式化类(java.util.Formatter)基本用法,地址:http://blog.csdn.net/ouyang_pen ...

  4. Java开发笔记(一百四十三)FXML布局的基本格式

    前面介绍了JavaFX的常见控件用法,虽然JavaFX控件比起AWT与Swing要好用些,但是一样通过代码编写控件界面,并没有提高什么开发效率.要想浏览界面的展示效果,都必须运行测试程序才能观看,即使 ...

  5. 阿里巴巴 Java 开发手册(三): 代码格式

    1. [强制]大括号的使用约定.如果是大括号内为空,则简洁地写成{}即可,不需要换行:如果 是非空代码块则: 1) 左大括号前不换行. 2) 左大括号后换行. 3) 右大括号前换行. 4) 右大括号后 ...

  6. Java开发笔记(一百零七)URL地址的组成格式

    URL的全称是Uniform Resource Locator,意思是统一资源定位符,俗称网络地址或网址.网络上的每个文件及接口,都有对应的URL网址,它规定了其他设备如何通过一系列的路径找到自己,犹 ...

  7. 【搬砖】安卓入门(1)- Java开发入门

    01.01_计算机基础知识(计算机概述)(了解) A:什么是计算机?计算机在生活中的应用举例 计算机(Computer)全称:电子计算机,俗称电脑.是一种能够按照程序运行,自动.高速处理海量数据的现代 ...

  8. 打造Linux三流娱乐环境,二流办公环境,一流Java开发环境

    写这篇文章的目的首先是为让自己以后再装linux环境时候,不用再通宵google+百度,做个备忘录,其次,给新入Linux环境的同学分享一点个人经验,再高尚点的动机也算是想做为开源技术的传播布道者.我 ...

  9. Unit01: JAVA开发环境案例

    Top JAVA Fundamental DAY01 JDK及Eclipse目录结构操作 JDK的安装及配置 控制台版的JAVA HelloWorld 使用Eclipse开发Java应用程序 1 JD ...

随机推荐

  1. 酒店订房系统:如何使用mysql来确定一个时间段内的房间都是可订的

    需要解决的问题: 假设一个用户选择了日期范围来进行订房,例如:2014-04-25至2014-04-30 ,那么现在问题就出现,你必须要确认在这个时间段内某个房间是否都是有房间的,如果没有那么当然不能 ...

  2. C++虚函数表(vtbl)

    C++的虚函数的作用就是为了实现多态的机制,利用内存的指针偏移来实现将基类型的指针指向的内存空间用子类对象来初始化.这样经过内部虚表的运作,实现可以通过基类指针来调用子类所定义的方法. 这种技术,其实 ...

  3. L-BFGS

    L-BFGS算法比较适合在大规模的数值计算中,具备牛顿法收敛速度快的特点,但不需要牛顿法那样存储Hesse矩阵,因此节省了大量的空间以及计算资源.本文主要通过对于无约束最优化问题的一些常用算法总结,一 ...

  4. 为MAC配置终端环境iTerm2+Zsh+oh-my-zsh

    首先展示下我的终端吧. 这就是我们为什么要配置iTerm2+Zsh+oh-my-zsh环境的原因: 我们使用zsh解释器,当然等你使用 zsh时就会知道zsh与bash对比的强大之处了. 至于我们的g ...

  5. ASP.NET关于Session_End触发与否的问题

    项目背景: 要求开发一个篆文识别网站,由于之前做好了WinForm的,把系统直接移植到WebForm上就好.工作比较简单,但确实遇到不少问题. 核心问题是: 篆文识别涉及到用户对原始图片的预处理(例如 ...

  6. C#多线程编程系列(三)- 线程同步

    目录 1.1 简介 1.2 执行基本原子操作 1.3 使用Mutex类 1.4 使用SemaphoreSlim类 1.5 使用AutoResetEvent类 1.6 使用ManualResetEven ...

  7. CF特征码遍历

    HOOK_游戏代码 8B 00 8B 08 8B 91 A8 00 00 00 地址-15 4E5E954E5EA 44E5E95DIRECT 从733E00开始搜 6B 00 94 51 6C 地址 ...

  8. VC API常用函数简单例子大全(1-89)

    第一个:FindWindow根据窗口类名或窗口标题名来获得窗口的句柄,该函数返回窗口的句柄 函数的定义:HWND WINAPI FindWindow(LPCSTR lpClassName ,LPCST ...

  9. 算法逆向6——RSA识别

    本文原创作者:i春秋作家——icq5f7a075d 1. 算法介绍 RSA算法是一种用数论构造的.基于大合数因子分解困难性的公开密钥密码.由于RSA密码既可用于加密,又可用于数字签名,安全.易懂,因此 ...

  10. C# 证书打印《六》

    整理思路,从新出发. 加载模版 public void loadtemplate(Label lable) { string p_tempateFile = @"fomate.xml&quo ...