自制Java虚拟机(四)-对象、new、invokespecial
自制Java虚拟机(四)-对象、new、invokespecial
一、对象的表示
刚开始学Java的时候,图书馆各种教程,书名往往都是“Java面向对象高级编程”,通常作者都会与C++做个比较,列出的优点往往都有纯面向对象、自动垃圾收集(不用管理内存)、跨平台(Write once, run everywhere 是宣传的重点,前提是需要在每个平台上安装jvm)、没有指针(后来证明是有的)、安全等。本篇文章就来实现面向对象(简单版,暂不考虑继承),涉及的指令主要有:
new 创建一个对象
getfield 获取对象的一个实例属性(field),push到操作数栈
putfield通过对象的引用和指向常量池CONSTANT_Fieldref_info类型的索引,给对象的属性赋值
invokespecial调用构造函数、实例化方法
存储对象主要是存储它的实例属性和类型信息,可用如下结构体表示一个对象:
typedef struct _Object {
Class* pclass;
int length;
char* fields;
} Object;
typedef Object* Reference;
其中,pclass字段为创建该对象使用的类,length为该对象的属性个数,fields为字段数组指针,指向实例属性数组的起始地址。
创建对象的代码可以如下:
Object* newObject(OPENV *env, Class* pclass) {
Object *obj;
int total_size;
total_size = (pclass->fields_size+1)<<2;
obj = (Object*)malloc(sizeof(Object) + total_size);
obj->fields = (char*)(obj+1);
obj->pclass = pclass;
obj->length = total_size;
这里写图片描述
new指令的实现:
Opreturn do_new(OPENV *env)
{
Class* pclass;
PRINTSD(TO_SHORT(env->pc));
short index = TO_SHORT(env->pc);
Object *obj;
if (env->current_class->this_class == index) {
pclass = env->current_class;
} else {
// TODO: create object of non-current-class
}
obj = newObject(env, pclass);
PUSH_STACKR(env->current_stack, obj, Reference);
INC2_PC(env->pc);
由于getfield和putfield指令是通过对象的引用和常量池索引来操作的,我们若操作对象的属性,需要唯一定位每个属性,当前方法是通过给每个对象的实例字段分配一个唯一的索引来实现的。假设我们已经知道每个属性的索引:
#define GET_FIELD_OFFSET(index) ((index) << 2)
#define GET_FIELD(obj, findex, ftype) *((ftype*)(obj->fields + GET_FIELD_OFFSET(findex)))
#define PUT_FIELD(obj, findex, fvalue, ftype) *((ftype*)(obj->fields + GET_FIELD_OFFSET(findex)))=fvalue
通过对象的引用(obj)、属性的索引(findex)、属性的类型(ftype),我们就可以存取一个对象的属性了(保存的时候需要知道值 fvalue)。
实际上getfield、putfield指令涉及到操作数栈:
#define OP_GET_FIELDI(obj, findex, ftype www.yigouyule2.cn/ ) PUSH_STACK(env->current_stack, GET_FIELD(obj, findex, ftype), int)
#define OP_GET_FIELDF(obj, findex, ftype www.22yigouyule.cn/PUSH_STACK(env->current_stack, GET_FIELD(obj, findex, ftype), float)
#define OP_GET_FIELDL(obj, findex, ftype) PUSH_STACKL(env->current_stack, GET_FIELD(obj, findex, ftype), ftype)
#define OP_PUT_FIELDI(obj, findex, www.huazongyule.com ) obj=PICK_STACKL(env->current_stack, Reference);\
SP_DOWNL(env->current_stack);\
PUT_FIELD(obj, findex, PICK_STACKU(env->current_stack, ftype), int)
#define OP_PUT_FIELDF(obj, findex, ftype) obj=PICK_STACKL(env->current_stack, Reference);\
SP_DOWNL(env->current_stack);\
PUT_FIELD(obj, findex, PICK_STACKU(env->current_stack, ftype), float)
#define OP_PUT_FIELDL(obj, findex, ftype www.wansenpingtai22.cn )www.huaren88cai.cn obj=PICK_STACKIL(www.mianyangbaojie.cn env->current_stack, Reference);\
SP_DOWNIL(env->current_stack);\
以上宏可用在getfield、putfield的实现函数中放心使用。
PICK_STACKU、PICK_STACKL、PICK_STACKIL的定义如下:
#define PICK_STACKU(stack, vtype) (*(vtype*)(stack->sp+SP_STEP)) // 往上4个字节
#define PICK_STACKL(stack, vtype) (*(vtype*)(stack->sp-SP_STEP_LONG)) // 往下8个字节
#define PICK_STACKIL(stack, vtype www.liyigou99.cn) (*(vtype*)(stack->sp-SP_STEP_ILONG)) // 往下12个字节
二、解析实例属性
考虑以下程序:
Point.java
package test;
public class Point{
private double x;
private double y;
public Point(double x, double y)
{
this.x = x;
this.y = y;
}
private double distance(Point p)
{
double dx = p.x - this.x;
double dy = p.y - this.y;
return dx*dx + dy *dy;
}
public static void main(String[] args)
{
Point p1 = new Point(0,0);
Point p2 = new Point(3.0, 4.0);
double dist = p1.distance(p2);
构造函数Point(double,double)的字节码为:
0: aload_0
1: invokespecial #1
4: aload_0
5: dload_1
6: putfield #2
9: aload_0
10: dload_3
11: putfield #3
14: return
1
其中putfield #2,2为常量池的索引,内容为一个CONSTANT_Fieldref_info类型的结构:
常量池#2、#3的内容:
#2 Fieldref #4.#26 // test/Point.x:D
#3 Fieldref #4.#27 // test/Point.y:D
1
2
1
2
我们需要通过常量池的索引解析到具体的field_info,从而唯一确定每个字段(属性)在对象中的索引,它们在常量池中的引用关系如下:
这里写图片描述
由上图可见,Fieldref对应的NameAndType的name_index字段、descriptor_index字段与field_info对应的字段相等,我们就从Class的fields数组中找到了实际的字段。
解析实例属性的代码大致如下:
void resolveClassInstanceField(Class* caller_class, CONSTANT_Fieldref_info **pfield_ref)
{
Class* callee_class;
cp_info callee_cp, caller_cp;
CONSTANT_Fieldref_info* field_ref = *pfield_ref;
CONSTANT_NameAndType_info* field_nt_info;
CONSTANT_Utf8_info* field_name_utf8, *tmp_field_name_utf8;
CONSTANT_Class_info *field_ref_class_info;
field_info *field;
int i, found =0, fields_count;
caller_cp = caller_class->constant_pool;
field_ref_class_info = (CONSTANT_Class_info*)(caller_cp[field_ref->class_index]);
callee_class = field_ref_class_info->pclass;
if (NULL == callee_class) {
printf("NULL class");exit(1);
}
field_nt_info = (CONSTANT_NameAndType_info*)(caller_cp[field_ref->name_and_type_index]);
callee_cp = callee_class->constant_pool;
fields_count = callee_class->fields_count;
for (i = 0; i < fields_count; i++) {
field = (field_info*)(callee_class->fields[i]);
if (NOT_ACC_STATIC(field->access_flags) &&
field_nt_info->name_index == field->name_index &&
field_nt_info->descriptor_index == field->descriptor_index) {
field_ref->ftype = field->ftype; // 实例属性的类型
field_ref->findex = field->findex; // 实例属性在对象中的索引
found = 1;
break;
}
}
if (!found) {
field_name_utf8 = (CONSTANT_Utf8_info*)(caller_cp[field_nt_info->name_index]);
printf("Error! cannot resolve field: %s.%s", field_name_utf8->bytes);
exit(1);
}
这里我们只考虑这个类本身定义的实例属性(暂不考虑继承过来的属性),实例属性的类型以及在对象中的索引是在解析class文件的fields中确定的:
void parseFields(FILE *fp, Class *pclass)
{
...
ftype = *(char*)(get_utf8(pclass->constant_pool[tmp_field->descriptor_index]));
tmp_field->ftype = ftype;
if (NOT_ACC_STATIC(tmp_field->access_flags)) { // 过滤掉静态属性
tmp_field->findex = last_index;
if (ftype == 'J' || ftype == 'D') {
last_index+=2; // long、double要占两个单元
} else {
last_index+=1; // 其它数据类型占一个单元
}
}
...
因此,getfield指令的实现可以这样子:
Opreturn do_getfield(OPENV *env)
{
CONSTANT_Fieldref_info *fieldref;
cp_info cp;
Object *obj;
short index = TO_SHORT(env->pc);
PRINTSD(TO_SHORT(env->pc));
cp = env->current_class->constant_pool;
fieldref = (CONSTANT_Fieldref_info*)(cp[index]);
GET_STACKR(env->current_stack, obj, Reference);
if (0 == fieldref->ftype) {
// TODO: resolve this field
resolveClassInstanceField(env->current_class, &fieldref);
}
switch (fieldref->ftype) {
...
case 'S': // short
OP_GET_FIELDI(obj, fieldref->findex, short);
break;
case 'I': // integer
OP_GET_FIELDI(obj, fieldref->findex, int);
break;
case 'D': // double
OP_GET_FIELDL(obj, fieldref->findex, double);
break;
default:
printf("Error: getfield, ftype=%d\n", fieldref->ftype);
exit(1);
break;
}
INC2_PC(env->pc);
putfield指令也可以类似实现。
三、解析实例方法
还是上面的Point.java,main函数的字节码为:
0: new #4 // class test/Point
3: dup
4: dconst_0
5: dconst_0
6: invokespecial #5 // Method "<init>":(DD)V
9: astore_1
10: new #4 // class test/Point
13: dup
14: ldc2_w #6 // double 3.0d
17: ldc2_w #8 // double 4.0d
20: invokespecial #5 // Method "<init>":(DD)V
23: astore_2
24: aload_1
25: aload_2
26: invokespecial #10 // Method distance:(Ltest/Point;)D
29: dstore_3
30: return
其中的invokespecial #10就是调用Point的distance方法,#10是常量池中的索引,对应的是一个CONSTANT_Methodref_info类型的结构,在常量池中的关系图如下:
这里写图片描述
这个与Fieldref的可以说是一模一样,通过Methodref的name_and_type_index字段,找到对应的NameAndType结构,然后遍历methods数组,method_info的name_index字段、descriptor_index字段与NameAndType相应字段相等,就说明解析到了对象的实例方法。(该方法也适用于构造函数<init>的解析)
所以,invokespecial指令的实例可以如下:
Opreturn do_invokespecial(OPENV *env)
{
PRINTSD(TO_SHORT(env->pc));
short mindex = TO_SHORT(env->pc);
INC2_PC(env->pc);
callClassSpecialMethod(env, mindex);
callClassSpecialMethod大致如下:
void callClassSpecialMethod(OPENV* current_env, int mindex)
{
Class* current_class = current_env->current_class;
CONSTANT_Methodref_info* method_ref = (CONSTANT_Methodref_info*)(current_class->constant_pool[mindex]);
if (method_ref->class_index != current_env->current_class->this_class) {
printf("skip other method"); // 跳过其它类的实例方法
return;
}
if (NULL == method_ref->ref_addr) {
// 这个与resolveClassInstanceField类似
resolveClassSpecialMethod(current_class, &method_ref);
}
// 调用该方法 [见下一节]
callResolvedClassSpecialMethod(current_env, method_ref);
四、调用方法
上面一节,我们解析出了实例方法,接下来就要调用它。
一个方法/函数(称为被调用方法)调用,需要做以下几件事情:
新建一个帧/栈帧
从方法调用者(invoker)的操作数栈中复制参数到新的帧的局部变量数组中(如果有参数的话)
保存方法调用者(invoker)的执行上下文(指令指针位置、当前类等)
设置被调用方法的执行上下文,把指令指针指向被调用方法的第一条指令
方法调用完成后,需要:
把返回参数复制到方法调用者的操作数栈上,如果有的话
恢复调用前的执行上下文
销毁调用该方法时创建的帧
上节中callResolvedClassSpecialMethod可以实现为如下:
void callResolvedClassSpecialMethod(OPENV* current_env, CONSTANT_Methodref_info* method_ref)
{
StackFrame* stf, *last_stack;
CONSTANT_Class_info* class_info;
method_info* method;
Code_attribute* code_attr;
int real_args_len =0;
last_stack= current_env->current_stack;
// 1. create new stack frame
method = (method_info*)(method_ref->ref_addr);
code_attr = (Code_attribute*)(method->code_attribute_addr);
stf = newStackFrame(last_stack, code_attr);
// 2. copy args
real_args_len = method->args_len + SZ_REF;
last_stack->sp -= real_args_len;
memcpy(stf->localvars, last_stack->sp, real_args_len);
// 3. save current environment
stf->last_pc = current_env->pc;
stf->last_pc_end = current_env->pc_end;
stf->last_pc_start = current_env->pc_start;
stf->last_class = current_env->current_class;
// 4. set new environment
class_info = (CONSTANT_Class_info*)(current_env->current_class->constant_pool[method_ref->class_index]);
current_env->pc = current_env->pc_start = code_attr->code;
current_env->pc_end = code_attr->code + code_attr->code_length;
current_env->current_class = class_info->pclass;
current_env->current_stack = stf;
复制参数的时候,要注意,实例方法有个隐含参数,为调用该方法的对象引用,该参数是作为第一个参数传给方法的,需要放在新建帧的局部变量数组的第一个位置。
这里写图片描述
调用结束后(即遇到return系列指令),这里定义成一个宏,给return系列指令调用:
#define FUNC_RETURN(env) StackFrame* stf = env->current_stack;\
env->current_stack = stf->prev;\
env->pc = stf->last_pc;\
env->pc_end = stf->last_pc_end;\
env->pc_start = stf->last_pc_start;\
env->current_class = stf->last_class;\
free(stf);\
if (env->current_stack == NULL) {\
exit(0);\
}
五、测试
把Point.java编译成的Point.class文件,测试,java源代码以及输出的调试结果如下:
这里写图片描述
心算一下,对比调试输出,可知结果正确。(距离计算故意没有开平方)
六、总结
总结一下,本章,我们:
能够表示以及创建一个对象,实现了new指令
实现了对象属性操作指令getfield、putfield
能够解析实例属性
能够解析实例方法
实现了invokespecial指令
在测试例子中,用带参数构造函数创建了两个Point对象,用其中一个对象调用实例方法distance,另一个对象作为参数,计算距离的平方,运行正确。
自制Java虚拟机(四)-对象、new、invokespecial的更多相关文章
- 深入Java虚拟机--判断对象存活状态
程序计数器,虚拟机栈和本地方法栈 首先我们先来看下垃圾回收中不会管理到的内存区域,在Java虚拟机的运行时数据区我们可以看到,程序计数器,虚拟机栈,本地方法栈这三个地方是比较特别的.这个三个部分的特点 ...
- Java虚拟机构建对象过程小记
Java对象的内存分布 Java对象的构建 Java程序中,新建对象,除了常见的new语句之外,还可以通过反射机制.Object.clone方法.反序列化以及Unsafe.allocateInstan ...
- Java 虚拟机的对象创建
堆中存储的内容:在程序运行时,动态创建的对象. 创建对象的四种方式:new,clone(浅复制),反射,反序列化. 浅复制:只能复制当前对象本身,如果当前对象(A)引用了另外的对象(B),则引用对象( ...
- Java虚拟机四:垃圾回收算法与垃圾收集器
在Java运行时的几个数据区域中,程序计数器,虚拟机栈,本地方法栈3个区域随着线程而生,随线程而灭,因此这几个区域的内存分配和回收具有确定性,不需要过多考虑垃圾回收问题,因为方法结束或者线程结束时,内 ...
- Java虚拟机(二)-对象创建
这一篇大致说明一下,对象在Java堆中对象分配.内存布局以及访问定位 1.对象的创建 虚拟机在遇到一条new指令时,首先将去检查这个指令的参数是否能在常量池中定位到一个类的符号引用,并且检查这个符号引 ...
- Java虚拟机学习 - 对象访问
对象访问会涉及到Java栈.Java堆.方法区这三个内存区域. 如下面这句代码: Object objectRef = new Object(); 假设这句代码出现在方法体中,"Object ...
- JAVA虚拟机之对象探秘
上一章主要写到了JVM中运行时数据区域各个部分的功能及其作用.上一章说到了对象是分配在堆上面的,所以接下来我们写到对象在堆内存中是如何创建.如何布局.如何访问.1. 对象的创建 在java程序中对象的 ...
- Java虚拟机判定对象存活算法
1.引用计数算法 描述:给对象中添加一个引用计数器,每当有一个地方引用它时,计数器值就加1:当引用失效时,计数器值就减1:任何时刻计数器值为0的对象就是不可能再被使用的. 特点:实现简单,判定效率高. ...
- Java虚拟机四 常用Java虚拟机参数
主要涉及的知识点: 1.跟踪Java虚拟机的垃圾回收和类加载等信息: 2.配置Java虚拟机的堆空间: 3.配置永久区和Java栈. 4.学习虚拟机的服务器和客户端模式. 1.1 跟踪垃圾回收 Jav ...
随机推荐
- Linux-NoSQL之MongoDB
1.mongodb介绍 什么是MongoDB ? MongoDB 是由C++语言编写的,是一个基于分布式文件存储的开源数据库系统. 在高负载的情况下,添加更多的节点,可以保证服务器性能. MongoD ...
- hsv空间
hsv在不同的软件中,有不同的阈值, 在描述阈值之前,看一下它的定义,按照标准的定义,hsv应该是从0°到360°的一个环,加上一个表示亮度的轴,重点就是那个环. 这个环如图一,0°一般为红色120° ...
- [转]sscanf函数具体用法
大学生程序代写 sscanf 名称: sscanf() - 从一个字符串中读进与指定格式相符的数据. 函数原型: Int sscanf( string str, string fmt, mixed v ...
- 2017-2018-1 20179203 《Linux内核原理与分析》第六周作业
攥写人:李鹏举 学号:20179203 ( 原创作品转载请注明出处) ( 学习课程:<Linux内核分析>MOOC课程http://mooc.study.163.com/course/US ...
- Java面试题10(如何取到set集合的第一个元素)
1.如何取到set集合的第一个元素. public static void main(String[] args) { Set set = new HashSet(); set.add("x ...
- 交互式 shell 玩转 Python
Python 编程语言已经成为 IT 中使用的最流行的语言之一.成功的一个原因是它可以用来解决各种问题.从网站开发到数据科学.机器学习到任务自动化,Python 生态系统有丰富的框架和库.本文将介绍 ...
- 对存在JavaScript隐式类型转换的四种情况的总结
一般存在四种情况,JavaScript会对变量的数据类型进行转换. 目录 * if中的条件会被自动转为Boolean类型 * 会被转为false的数据 * 会被转为true的数据 * 参与+运算都会被 ...
- javascript:function 函数声明和函数表达式 详解
函数声明(缩写为FD)是这样一种函数: 有一个特定的名称 在源码中的位置:要么处于程序级(Program level),要么处于其它函数的主体(FunctionBody)中 在进入上下文阶段创建 影响 ...
- 动态webService
using System; using System.Net; using System.IO; using System.CodeDom; using Microsoft.CSharp; using ...
- 办公软件-Excel:Excel百科
ylbtech-办公软件-Excel:Excel百科 Microsoft Excel是Microsoft为使用Windows和Apple Macintosh操作系统的电脑编写的一款电子表格软件.直观的 ...