概述
计算机是不能直接运行java代码的,必须要先运行java虚拟机,再由java虚拟机运行编译后的java代码。
因为在cpu层面看来计算机中所有的操作都是一个个指令的运行汇集而成的,java是高级语言,只有人类才能理解其逻辑,计算机是无法识别的,所以java代码必须要先编译成字节码文件,jvm才能正确识别代码转换后的指令并将其运行。
Java代码间接翻译成字节码,储存字节码的文件再交由运行于不同平台上的JVM虚拟机去读取执行,从而实现一次编写,到处运行的目的。
Java字节码文件
class文件本质上是一个以8位字节为基础单位的二进制流,各个数据项目严格按照顺序紧凑的排列在class文件中。jvm根据其特定的规则解析该二进制数据,从而得到相关信息。
Class文件的结构属性
反编译字节码文件
javac 生成字节码文件,javap 反编译字节码文件
javap用法
javap - -help --help -? 输出此用法消息
- -version 版本信息
- -v -verbose 输出附加信息
- -l 输出行号和本地变量表
- -public 仅显示公共类和成员
- -protected 显示受保护的/公共类和成员
- -package 显示程序包/受保护的/公共类
- 和成员 (默认)
- -p -private 显示所有类和成员
- -c 对代码进行反汇编
- -s 输出内部类型签名
- -sysinfo 显示正在处理的类的
- 系统信息 (路径, 大小, 日期, MD5 散列)
- -constants 显示最终常量
- -classpath <path> 指定查找用户类文件的位置
- -cp <path> 指定查找用户类文件的位置
- -bootclasspath <path> 覆盖引导类文件的位置
复制代码 反编译
- //Main.java
- public class Main {
-
- private int m;
-
- public int inc() {
- return m + 1;
- }
- }
复制代码 对以上例子输入命令javap -verbose -p Main.class查看输出内容:- Classfile /E:/JavaCode/TestProj/out/production/TestProj/com/rhythm7/Main.class
- Last modified 2018-4-7; size 362 bytes
- MD5 checksum 4aed8540b098992663b7ba08c65312de
- Compiled from "Main.java"
- public class com.rhythm7.Main
- minor version: 0
- major version: 52
- flags: ACC_PUBLIC, ACC_SUPER
- Constant pool:
- #1 = Methodref #4.#18 // java/lang/Object."<init>":()V
- #2 = Fieldref #3.#19 // com/rhythm7/Main.m:I
- #3 = Class #20 // com/rhythm7/Main
- #4 = Class #21 // java/lang/Object
- #5 = Utf8 m
- #6 = Utf8 I
- #7 = Utf8 <init>
- #8 = Utf8 ()V
- #9 = Utf8 Code
- #10 = Utf8 LineNumberTable
- #11 = Utf8 LocalVariableTable
- #12 = Utf8 this
- #13 = Utf8 Lcom/rhythm7/Main;
- #14 = Utf8 inc
- #15 = Utf8 ()I
- #16 = Utf8 SourceFile
- #17 = Utf8 Main.java
- #18 = NameAndType #7:#8 // "<init>":()V
- #19 = NameAndType #5:#6 // m:I
- #20 = Utf8 com/rhythm7/Main
- #21 = Utf8 java/lang/Object
- {
- private int m;
- descriptor: I
- flags: ACC_PRIVATE
- public com.rhythm7.Main();
- descriptor: ()V
- flags: ACC_PUBLIC
- Code:
- stack=1, locals=1, args_size=1
- 0: aload_0
- 1: invokespecial #1 // Method java/lang/Object."<init>":()V
- 4: return
- LineNumberTable:
- line 3: 0
- LocalVariableTable:
- Start Length Slot Name Signature
- 0 5 0 this Lcom/rhythm7/Main;
- public int inc();
- descriptor: ()I
- flags: ACC_PUBLIC
- Code:
- stack=2, locals=1, args_size=1
- 0: aload_0
- 1: getfield #2 // Field m:I
- 4: iconst_1
- 5: iadd
- 6: ireturn
- LineNumberTable:
- line 8: 0
- LocalVariableTable:
- Start Length Slot Name Signature
- 0 7 0 this Lcom/rhythm7/Main;
- }
- SourceFile: "Main.java"
复制代码 字节码文件信息
开头的7行信息包括:Class文件当前所在位置,最后修改时间,文件大小,MD5值,编译自哪个文件,类的全限定名,jdk次版本号,主版本号。
然后紧接着的是该类的访问标志:ACC_PUBLIC, ACC_SUPER,访问标志的含义如下:
常量池
Constant pool意为常量池。
主要存放的是两大类常量:字面量(Literal)和符号引用(Symbolic References)。字面量类似于java中的常量概念,如文本字符串,final常量,而符号引用则属于编译原理方面的概念,包括以下三种:
- 类和接口的全限定名(Fully Qualified Name)
- 字段的名称和描述符号(Descriptor)
- 方法的名称和描述符
常量池与运行时常量池:
- 常量池:就是一张表(如上图中的constant pool),虚拟机指令根据这张常量表找到要执行的类名、方法名、参数类型、字面量信息
- 运行时常量池:常量池是*.class文件中的,当该类被加载以后,JVM才进行的动态链接,也就是说在运行期转换后它的常量池信息就会放入运行时常量池,并把里面的符号地址变为真实地址
- #1 = Methodref #4.#18 // java/lang/Object."<init>":()V
- #4 = Class #21 // java/lang/Object
- #7 = Utf8 <init>
- #8 = Utf8 ()V
- #18 = NameAndType #7:#8 // "<init>":()V
- #21 = Utf8 java/lang/Object
复制代码 第一个常量是一个方法定义,指向了第4和第18个常量。以此类推查看第4和第18个常量。最后可以拼接成第一个常量右侧的注释内容:- java/lang/Object."<init>":()V
复制代码 这段可以理解为该类的实例构造器的声明,由于Main类没有重写构造方法,所以调用的是父类的构造方法。此处也说明了Main类的直接父类是Object。 该方法默认返回值是V, 也就是void,无返回值。
第二个常量同理可得:- #2 = Fieldref #3.#19 // com/rhythm7/Main.m:I
- #3 = Class #20 // com/rhythm7/Main
- #5 = Utf8 m
- #6 = Utf8 I
- #19 = NameAndType #5:#6 // m:I
- #20 = Utf8 com/rhythm7/Main
复制代码 此处声明了一个字段m,类型为I, I即是int类型。关于字节码的类型对应如下:
对于数组类型,每一位使用一个前置的 [ 字符来描述,如定义一个java.lang.String[][] 类型的维数组,将被记录为 [[Ljava/lang/Strin
方法表集合
在常量池之后的是对类内部的方法描述,在字节码中以表的集合形式表现- private int m;
- descriptor: I
- flags: ACC_PRIVATE
复制代码 此处声明了一个私有变量m,类型为int,返回值为int- public com.rhythm7.Main(); descriptor: ()V flags: ACC_PUBLIC Code: stack=1, locals=1, args_size=1 0: aload_0 1: invokespecial #1 // Method java/lang/Object."<init>":()V 4: return LineNumberTable: line 3: 0 LocalVariableTable: Start Length Slot Name Signature 0 5 0 this Lcom/rhythm7/Main;
复制代码 这里是构造方法:Main(),返回值为void, 公开方法。
code内的主要属性为:
<ul>stack: 最大操作数栈,JVM运行时会根据这个值来分配栈帧(Frame)中的操作栈深度,此处为1
locals: 局部变量所需的存储空间,单位为Slot, Slot是虚拟机为局部变量分配内存时所使用的最小单位,为4个字节大小。方法参数(包括实例方法中的隐藏参数this),显示异常处理器的参数(try catch中的catch块所定义的异常),方法体中定义的局部变量都需要使用局部变量表来存放。值得一提的是,locals的大小并不一定等于所有局部变量所占的Slot之和,因为局部变量中的Slot是可以重用的。
args_size: 方法参数的个数,这里是1,因为每个实例方法都会有一个隐藏参数this
attribute_info: 方法体内容,0,1,4为字节码"行号",该段代码的意思是将第一个引用类型本地变量推送至栈顶,然后执行该类型的实例方法,也就是常量池存放的第一个变量,也就是注释里的java/lang/Object.""
来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作! |