坪钗 发表于 2026-3-13 10:00:03

类字节码:揭开Java虚拟机运行机制的神秘面纱

概述

计算机是不能直接运行java代码的,必须要先运行java虚拟机,再由java虚拟机运行编译后的java代码。
因为在cpu层面看来计算机中所有的操作都是一个个指令的运行汇集而成的,java是高级语言,只有人类才能理解其逻辑,计算机是无法识别的,所以java代码必须要先编译成字节码文件,jvm才能正确识别代码转换后的指令并将其运行。
Java代码间接翻译成字节码,储存字节码的文件再交由运行于不同平台上的JVM虚拟机去读取执行,从而实现一次编写,到处运行的目的。
Java字节码文件

class文件本质上是一个以8位字节为基础单位的二进制流,各个数据项目严格按照顺序紧凑的排列在class文件中。jvm根据其特定的规则解析该二进制数据,从而得到相关信息。
Class文件的结构属性


反编译字节码文件

javac 生成字节码文件,javap 反编译字节码文件
javap用法

javap
-help--help-?      输出此用法消息
-version               版本信息
-v-verbose             输出附加信息
-l                     输出行号和本地变量表
-public                  仅显示公共类和成员
-protected               显示受保护的/公共类和成员
-package               显示程序包/受保护的/公共类
                           和成员 (默认)
-p-private             显示所有类和成员
-c                     对代码进行反汇编
-s                     输出内部类型签名
-sysinfo               显示正在处理的类的
                           系统信息 (路径, 大小, 日期, MD5 散列)
-constants               显示最终常量
-classpath <path>      指定查找用户类文件的位置
-cp <path>               指定查找用户类文件的位置
-bootclasspath <path>    覆盖引导类文件的位置反编译

//Main.java
public class Main {
   
    private int m;
   
    public int inc() {
      return m + 1;
    }
}对以上例子输入命令javap -verbose -p Main.class查看输出内容:
Classfile /E:/JavaCode/TestProj/out/production/TestProj/com/rhythm7/Main.class
Last modified 2018-4-7; size 362 bytes
MD5 checksum 4aed8540b098992663b7ba08c65312de
Compiled from "Main.java"
public class com.rhythm7.Main
minor version: 0
major version: 52
flags: ACC_PUBLIC, ACC_SUPER
Constant pool:
   #1 = Methodref          #4.#18         // java/lang/Object."<init>":()V
   #2 = Fieldref         #3.#19         // com/rhythm7/Main.m:I
   #3 = Class            #20            // com/rhythm7/Main
   #4 = Class            #21            // java/lang/Object
   #5 = Utf8               m
   #6 = Utf8               I
   #7 = Utf8               <init>
   #8 = Utf8               ()V
   #9 = Utf8               Code
#10 = Utf8               LineNumberTable
#11 = Utf8               LocalVariableTable
#12 = Utf8               this
#13 = Utf8               Lcom/rhythm7/Main;
#14 = Utf8               inc
#15 = Utf8               ()I
#16 = Utf8               SourceFile
#17 = Utf8               Main.java
#18 = NameAndType      #7:#8          // "<init>":()V
#19 = NameAndType      #5:#6          // m:I
#20 = Utf8               com/rhythm7/Main
#21 = Utf8               java/lang/Object
{
private int m;
    descriptor: I
    flags: ACC_PRIVATE

public com.rhythm7.Main();
    descriptor: ()V
    flags: ACC_PUBLIC
    Code:
      stack=1, locals=1, args_size=1
         0: aload_0
         1: invokespecial #1                  // Method java/lang/Object."<init>":()V
         4: return
      LineNumberTable:
      line 3: 0
      LocalVariableTable:
      StartLengthSlotName   Signature
            0       5   0this   Lcom/rhythm7/Main;

public int inc();
    descriptor: ()I
    flags: ACC_PUBLIC
    Code:
      stack=2, locals=1, args_size=1
         0: aload_0
         1: getfield      #2                  // Field m:I
         4: iconst_1
         5: iadd
         6: ireturn
      LineNumberTable:
      line 8: 0
      LocalVariableTable:
      StartLengthSlotName   Signature
            0       7   0this   Lcom/rhythm7/Main;
}
SourceFile: "Main.java"字节码文件信息

开头的7行信息包括:Class文件当前所在位置,最后修改时间,文件大小,MD5值,编译自哪个文件,类的全限定名,jdk次版本号,主版本号。
然后紧接着的是该类的访问标志:ACC_PUBLIC, ACC_SUPER,访问标志的含义如下:

常量池

Constant pool意为常量池。
主要存放的是两大类常量:字面量(Literal)和符号引用(Symbolic References)。字面量类似于java中的常量概念,如文本字符串,final常量,而符号引用则属于编译原理方面的概念,包括以下三种:

[*]类和接口的全限定名(Fully Qualified Name)
[*]字段的名称和描述符号(Descriptor)
[*]方法的名称和描述符
常量池与运行时常量池:

[*]常量池:就是一张表(如上图中的constant pool),虚拟机指令根据这张常量表找到要执行的类名、方法名、参数类型、字面量信息
[*]运行时常量池:常量池是*.class文件中的,当该类被加载以后,JVM才进行的动态链接,也就是说在运行期转换后它的常量池信息就会放入运行时常量池,并把里面的符号地址变为真实地址
#1 = Methodref          #4.#18         // java/lang/Object."<init>":()V
#4 = Class            #21            // java/lang/Object
#7 = Utf8               <init>
#8 = Utf8               ()V
#18 = NameAndType      #7:#8          // "<init>":()V
#21 = Utf8               java/lang/Object第一个常量是一个方法定义,指向了第4和第18个常量。以此类推查看第4和第18个常量。最后可以拼接成第一个常量右侧的注释内容:
java/lang/Object."<init>":()V这段可以理解为该类的实例构造器的声明,由于Main类没有重写构造方法,所以调用的是父类的构造方法。此处也说明了Main类的直接父类是Object。 该方法默认返回值是V, 也就是void,无返回值。
第二个常量同理可得:
#2 = Fieldref         #3.#19         // com/rhythm7/Main.m:I
#3 = Class            #20            // com/rhythm7/Main
#5 = Utf8               m
#6 = Utf8               I
#19 = NameAndType      #5:#6          // m:I
#20 = Utf8               com/rhythm7/Main此处声明了一个字段m,类型为I, I即是int类型。关于字节码的类型对应如下:

对于数组类型,每一位使用一个前置的 [ 字符来描述,如定义一个java.lang.String[][] 类型的维数组,将被记录为 [[Ljava/lang/Strin
方法表集合

在常量池之后的是对类内部的方法描述,在字节码中以表的集合形式表现
private int m;
descriptor: I
flags: ACC_PRIVATE此处声明了一个私有变量m,类型为int,返回值为int
public com.rhythm7.Main();   descriptor: ()V   flags: ACC_PUBLIC   Code:   stack=1, locals=1, args_size=1      0: aload_0      1: invokespecial #1                  // Method java/lang/Object."<init>":()V      4: return   LineNumberTable:       line 3: 0   LocalVariableTable:       StartLengthSlotName   Signature         0       5   0this   Lcom/rhythm7/Main;这里是构造方法:Main(),返回值为void, 公开方法。
code内的主要属性为:
<ul>stack: 最大操作数栈,JVM运行时会根据这个值来分配栈帧(Frame)中的操作栈深度,此处为1
locals: 局部变量所需的存储空间,单位为Slot, Slot是虚拟机为局部变量分配内存时所使用的最小单位,为4个字节大小。方法参数(包括实例方法中的隐藏参数this),显示异常处理器的参数(try catch中的catch块所定义的异常),方法体中定义的局部变量都需要使用局部变量表来存放。值得一提的是,locals的大小并不一定等于所有局部变量所占的Slot之和,因为局部变量中的Slot是可以重用的。
args_size: 方法参数的个数,这里是1,因为每个实例方法都会有一个隐藏参数this

attribute_info: 方法体内容,0,1,4为字节码"行号",该段代码的意思是将第一个引用类型本地变量推送至栈顶,然后执行该类型的实例方法,也就是常量池存放的第一个变量,也就是注释里的java/lang/Object.""
来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
页: [1]
查看完整版本: 类字节码:揭开Java虚拟机运行机制的神秘面纱