Reference


字节码 核心概念

Class文件是8位字节流,按字节对齐。之所以称为字节码,是由于每条指令都仅仅占领一个字节。全部的操作码和操作数都是按字节对齐的。

数据结构

Java虚拟机规范中规定。Class文件格式採用一种相似C语言结构体的伪结构来存储,它仅仅有两种数据类型

无符号数(基本数据类型)

主要用于描写叙述数字、索引引用、数量值、或UTF-8编码构成的字符串;

u1 – 1个字节

u2 – 2个字节

u4 – 4个字节

u8 – 8个字节

表(复合数据类型)

用于描写叙述有层次关系的复合结构的数据。

习惯性以“_info”结尾

Class文件格式

数据类型 名称 数量
u4 magic 1
u2 minor_version 1
u2 major_version 1
u2 constant_pool_count 1
cp_info constant_pool constant_pool_count + 1
u2 access_flags 1
u2 this_class 1
u2 super_class 1
u2 interfaces_count 1
u2 interfaces interfaces_count
u2 fields_count 1
field_info fields fields_count
u2 methods_count 1
method_info methods methods_count
u2 attributes_count 1
attribute_info attributes attributes_count

class说明

  • magic: Class文件的头4个字节,它的唯一作用是用于确认该文件是否是能被JVM接受的Class文件
  • minor_version :第5和第6字节是次版本号号
  • major_version:第7和第8字节是主版本号号

  • constant_pool_count: 常量池大小

  • cp_info : 复合数据结构,是一组常量数据结构,有11种常量数据结构

  • access_flags :訪问标志,access_flags的计算公式为:access_flags = flagA | flagB | flagB …

  • field_info :字段表(field_info)用于描写叙述类或接口中声明的变量,它包括类变量、实例变量,但不包括方法内的局部变量和块变量。和cp_info部分不一样。cp_info由于常量类型的不一样其数据结构有11种,但field_info的结构仅仅有一种。

    (数据结构例如以下)



    字段訪问标志。和类的訪问标志,由于修饰符不同稍有不同,具体见下图。

  • method_info:方法表集合(method_info)和字段表集合的结构是一致的,仅仅是訪问标志不同。

  • attribute_info:用于在Class文件、字段表、方法表中携带自己的属性表集合,以用于描写叙述某些场景的专有信息。



    Java程序方法体里面的代码经过javac编译器处理过后将终于字节码存储在Code属性内。抽象类或接口中的方法不存在Code属性。

  • SourceFile:SourceFile属性主要记录生成这个Class文件的源码名称,也属于可选属性,能够使用javac的-g:none或-g:source选项来关闭或要求生成这些信息。

  • LocalVariableTable:LocalVariableTable属性用于描写叙述栈帧中局部变量表中的变量与Java源码定义的变量之间的关系,可是这样的关系并不是执行时必须,默认也不会生成到Class文件里,能够通过javac中使用-g:none或-g:vars选项取消或者生成这项信息。

  • LineNumberTable:LineNumberTable属性用于描写叙述Java源码行号和字节码行号(字节码的偏移量)之间的相应关系,它不是执行时必须属性。但默认会生成到Class文件里。

    也能够在javac中使用-g:none或-g:lines选项来取消或显示生成这一部分信息。

具体參见 Java字节码.class文件案例分析


jvm执行浅谈

Java虚拟机(JVM)是基于栈结构的。对于最初的main方法产生的全部的方法调用,都会在栈中产生一个帧。这些帧各自包括一组局部变量,这组局部变量就是这种方法在执行过程中所需的全部变量,包括一个指向this的引用、该方法的全部參数以及其它局部定义的变量。对于类方法(即static方法),其參数列表从0開始算起。而对于实例方法。位置0是用来存储this引用。

class执行就是jvm顺序执行一条条保存在Code中的指令,例如以下所看到的:

动态过程,例如以下:

public class Demo {
public static void foo() {
int a = 1;
int b = 2;
int c = (a + b) * 5;
}
}

具体參见

- 深入理解java字节码

- 从Java代码到字节码


javap 反汇编

javap是JDK自带的反汇编器。能够查看java编译器为我们生成的字节码。通过它,我们能够对比源码和字节码。从而了解非常多编译器内部的工作。

语法:

  javap [ 命令选项 ] class…

  javap 命令用于解析类文件。其输出取决于所用的选项。

若没有使用选项。javap 将输出传递给它的类的 public 域及方法。javap 将其输出到标准输出设备上。

命令选项

  -help 输出 javap 的帮助信息。

  -l 输出行及局部变量表。

  -public 仅仅显示 public 类及成员。

  -protected 仅仅显示 protected 和 public 类及成员。

  -package 仅仅显示包、protected 和 public 类及成员。这是缺省设置。

  -private 显示全部类和成员。

  -s 输出内部类型签名。

  -c 输出类中各方法的未解析的代码。即构成 Java 字节码的指令。

  -verbose 输出堆栈大小、各方法的 locals 及 args 数,以及class文件的编译版本号

  -classpath[路径] 指定 javap 用来查找类的路径。假设设置了该选项,则它将覆盖缺省值或 CLASSPATH 环境变量。文件夹用冒号分隔。

  -bootclasspath[路径] 指定载入自举类所用的路径。

缺省情况下,自举类是实现核心 Java 平台的类。位于 jrelib以下。

  -extdirs[dirs] 覆盖搜索安装方式扩展的位置。

扩展的缺省位置是 jrelibext。

Java字节码 小结的更多相关文章

  1. 从零写一个编译器(十一):代码生成之Java字节码基础

    项目的完整代码在 C2j-Compiler 前言 第十一篇,终于要进入代码生成部分了,但是但是在此之前,因为我们要做的是C语言到字节码的编译,所以自然要了解一些字节码,但是由于C语言比较简单,所以只需 ...

  2. 在Eclipse里查看Java字节码

    要理解 Java 字节码,比较推荐的方法是自己尝试编写源码对照字节码学习.其中阅读 Java 字节码的工具必不可少.虽然javap可以以可读的形式展示出.class 文件中字节码,但每次改动源码都需调 ...

  3. JAVA字节码解析

    Java字节码指令 Java 字节码指令及javap 使用说明 ### java字节码指令列表 字节码 助记符 指令含义 0x00 nop 什么都不做 0x01 aconst_null 将null推送 ...

  4. 【转】在Eclipse里查看Java字节码

    要理解 Java 字节码,比较推荐的方法是自己尝试编写源码对照字节码学习.其中阅读 Java 字节码的工具必不可少.虽然javap可以以可读的形式展示出.class 文件中字节码,但每次改动源码都需调 ...

  5. Java字节码(.class文件)格式详解(一)

    原文链接:http://www.blogjava.net/DLevin/archive/2011/09/05/358033.html 小介:去年在读<深入解析JVM>的时候写的,记得当时还 ...

  6. 通过Java字节码发现有趣的内幕之String篇(上)(转)

    原文出处: jaffa 很多时候我们在编写Java代码时,判断和猜测代码问题时主要是通过运行结果来得到答案,本博文主要是想通过Java字节码的方式来进一步求证我们已知的东西.这里没有对Java字节码知 ...

  7. 掌握Java字节码(转)

    Java是一门设计为运行于虚拟机之上的编程语言,因此它需要一次编译,处处运行(当然也是一次编写,处处测试).因此,安装到你系统上的JVM是原生的程序,而运行在它之上的代码是平台无关的.Java字节码就 ...

  8. Java字节码操纵框架ASM小试

    本文主要内容: ASM是什么 JVM指令 Java字节码文件 ASM编程模型 ASM示例 参考资料汇总 JVM详细指令 ASM是什么 ASM是一个Java字节码操纵框架,它能被用来动态生成类或者增强既 ...

  9. Java:从面试题“i++和++i哪个效率高?"开始学习java字节码

    今天看到一道面试题,i++和++i的效率谁高谁低. 面试题的答案是++i要高一点. 我在网上搜了一圈儿,发现很多回答也都是同一个结论. 如果早个几年,我也会认同这个看法,但现在我负责任的说,这个结论是 ...

随机推荐

  1. kafka删除topic数据

    一.概述 生产环境中,有一个topic的数据量非常大.这些数据不是非常重要,需要定期清理. 要求:默认保持24小时,某些topic 需要保留2小时或者6小时 二.清除方式 主要有3个: 1. 基于时间 ...

  2. 步步为营-66-Socket通信

    1.0 版本 1.1 服务器端 using System; using System.Collections.Generic; using System.Linq; using System.Net; ...

  3. 在Centos中安装aria2c

    # 安装aria2c 1 安装epel源 rpm -ivh http://dl.fedoraproject.org/pub/epel/epel-release-latest-6.noarch.rpm ...

  4. django 如何动态使用Q查询函数

    这个Q和F用得少, 需要时,总是独立的存在于那时,显得有些突兀, 这次想将filter,order,Q集合在一起, 查询了很多资料,还是有一些困难, 但即可以将Q查询比较优雅的动态生成. 比如: # ...

  5. 浅谈Spring MVC知识

    关于MVC框架,我相信大家都不陌生,都会说也就是模型-视图-控制器这三层的框架结构,如果你参加面试的时候考官会问:“MVC框架是什么?你说一说.”其实我们都知道这个问题还需要问的,只要你是一个开发人员 ...

  6. [转] Optimizely:在线网站A/B测试平台

    Optimizely:在线网站A/B测试平台是一家提供 A/B 测试服务的公司.A/B 测试能够对比不同版本的设计,选取更吸引用户眼球的那一款,从而带来更为优化的个人体验.让网站所有者易于对不同版本的 ...

  7. 解决Delphi7的自带的UTF-8编码转换函数BUG

    Delphi7及其以下版本的 VCL 只支持 Ansi, 所以... WideString 与 UTF8String (定义与 AnsiString 相同) 并没有办法正确的在 VCL 中显示 Del ...

  8. python套接字编程基础

    python套接字编程 目录 socket是什么 套接字的工作流程 基于tcp的套接字 基于udp的套接字 socket是什么 客户端/服务器架构(C/S架构) 服务端:提供服务的一端 客户端:请求服 ...

  9. 函数 y=x^x的分析

    关于函数 y=xx的分析: 由图像得,y在负无穷大到0图像处处不连续,故y的定义域为(0,正无穷大): 故该函数不就是y=e^(lnxx)吗? 1.定义域:我们变形一下,y=e^(xlnx),显然是0 ...

  10. 多线程出现 java.lang.NumberFormatException: multiple points

    多线程下导入数据,发现同一个文件每次导入成功的数据量都不一致,经检查,某些数据偶尔会报错  java.lang.NumberFormatException: multiple points 原因是导入 ...