java Class文件结构解析常量池字节码

目录
  • Class文件结构
    • 整体结构
    • 文件头
    • 常量池
    • 属性表
      • Code_attribute结构
    • 函数表/字段表
    • 字节码解析

Class文件结构

整体结构

ClassFile {
    u4             magic;
    u2             minor_version;
    u2             major_version;
    u2             constant_pool_count;
    cp_info        constant_pool[constant_pool_count-1];
    u2             access_flags;
    u2             this_class;
    u2             super_class;
    u2             interfaces_count;
    u2             interfaces[interfaces_count];
    u2             fields_count;
    field_info     fields[fields_count];
    u2             methods_count;
    method_info    methods[methods_count];
    u2             attributes_count;
    attribute_info attributes[attributes_count];
}

从结构上看可以分为几大块 文件头、常量池、接口、字段、函数、属性

文件头

u4             magic;  //固定值 0xCAFEBABE
 u2             minor_version;
 u2             major_version;
 u2             access_flags;  //访问修饰
 u2             this_class; //类名 常量池下标
 u2             super_class; //父类名 常量池下标  如果是0 就是java/lang/Object;

我把这几个描述了类基本信息的字段称为文件头

major_version.minor_version表示该class文件的版本号,由编译器版本决定,然而不同版本的虚拟机只会支持一定版本范围内的class文件,如果不在则会拒绝解析。

例如 openJDK中的实现

// Check version numbers - we check this even with verifier off
  if (!is_supported_version(major_version, minor_version)) {
    if (name == NULL) {
      Exceptions::fthrow(
        THREAD_AND_LOCATION,
        vmSymbols::java_lang_UnsupportedClassVersionError(),
        "Unsupported major.minor version %u.%u",
        major_version,
        minor_version);
    } 

常量池

常量池包含了class文件中使用到的例如 函数标识/类型信息/字符串等等,运行时加载到内存中形成运行时常量池

常量项中文件中使用变长结构描述

cp_info {
    u1 tag;  //表示常量的类型
    u1 info[];  //具体常量的内容结构 不同类型常量有不同的结构
}

/*常量类型*/
Constant Type    Value
CONSTANT_Class    7
CONSTANT_Fieldref    9
CONSTANT_Methodref    10
CONSTANT_InterfaceMethodref    11
CONSTANT_String    8
CONSTANT_Integer    3
CONSTANT_Float    4
CONSTANT_Long    5
CONSTANT_Double    6
CONSTANT_NameAndType    12
CONSTANT_Utf8    1
CONSTANT_MethodHandle    15
CONSTANT_MethodType    16
CONSTANT_InvokeDynamic    18

例如:Utf8_info常量,更多的可以查看规范

CONSTANT_Utf8_info {
    u1 tag;
    u2 length;  //字符串长度
    u1 bytes[length]; //字符串数据(utf-8编码)
}

解析常量池的时候要注意:常量池长度为 constant_pool_count -1 但是 下标从1开始

属性表

attribute_info {
    u2 attribute_name_index;
    u4 attribute_length;
    u1 info[attribute_length];
}

属性项可以包含在class、method、field、code中,作为具体信息项

在class中可以描述文件信息,在method中可以描述字节码内容,函数栈信息,在code中可以描述行号等 所以attribute_info同样是具备不同类型的变长结构。但是attribute_info并没有tag这样的专门标记去标识类型,而是使用名字attribute_name。

//一部分Attribute Name
Attribute    Section    class file    Java SE
ConstantValue    §4.7.2    45.3    1.0.2
Code    §4.7.3    45.3    1.0.2
StackMapTable    §4.7.4    50.0    6
Exceptions    §4.7.5    45.3    1.0.2
InnerClasses    §4.7.6    45.3    1.1
//.......

Code_attribute结构

Code_attribute {
    u2 attribute_name_index;
    u4 attribute_length;
    u2 max_stack;  //最大栈深度
    u2 max_locals;  //局部变量数量
    u4 code_length; //字节码内容长度
    u1 code[code_length];  //字节码内容
    u2 exception_table_length;  //异常处理表 由try,catch/finaly 产生
    {   u2 start_pc;
        u2 end_pc;
        u2 handler_pc;
        u2 catch_type;
    } exception_table[exception_table_length];
    u2 attributes_count;
    attribute_info attributes[attributes_count];
}

函数表/字段表

method_info {
    u2             access_flags;
    u2             name_index;
    u2             descriptor_index;
    u2             attributes_count;
//一定会包含一个code属性项
    attribute_info attributes[attributes_count];
}

field_info {
    u2             access_flags;
    u2             name_index;
    u2             descriptor_index;
    u2             attributes_count;
    attribute_info attributes[attributes_count];
}

可以看到函数/字段中的内容具体有属性来描述

字节码解析

对于class文件解析,我们最关心的可能就两个 常量池和字节码

一条字节码由操作码,操作数组成,不同的字节码操作数的长度/表示意义可能不一样,对着规范翻译就好

例如invokevirtual字节码就是 0xb6 u2 2字节的操作数在运行时指向的是一个instance method ref

参考文档

本文代码 ClassParserDemo

以上就是java Class文件结构解析常量池字节码的详细内容,更多关于java Class 文件解析的资料请关注我们其它相关文章!

(0)

相关推荐

  • IDEA神器一键查看Java字节码及其他类信息插件

    开始推荐 IDEA 字节码查看神器之前,先来回顾一下 Java 字节码是啥. 何为 Java 字节码? Java 虚拟机(JVM)是运行 Java 字节码的虚拟机.JVM 有针对不同系统的特定实现(Windows,Linux,macOS),目的是使用相同的字节码,它们都会给出相同的结果. 什么是字节码?采用字节码的好处是什么? 在 Java 中,JVM 可以理解的代码就叫做字节码的文件),它不面向任何特定的处理器,只面向虚拟机.Java 语言通过字节码的方式,在一定程度上解决了传统解释型语言执行

  • java如何反编译jar包并修改class文件重新打包

    目录 反编译jar包并修改class文件重新打包 解决思路 jar包反编译后修改源码再编译 1.场景 2.详细步骤 反编译jar包并修改class文件重新打包 这两天碰到一个需求:需要修改一个jar包中的逻辑代码,并且重新打包 本来是很简单的问题,但是因为这个jar包不是可执行的jar包(没有main方法入口),jar反编译之后又是不能通过idea重新打包,因为jar是混乱的 所以费了点时间,在此记录下 解决思路 反编译jar包 首先用一些反编译工具类似 jad-gui 之类的 ,将项目反编译成

  • Java常量池详解

    目录 (1)class常量池 (2)运行时常量池 (3)基本类型包装类常量池 (4)字符串常量池 总结 java中有几种不同的常量池,以下的内容是对java中几种常量池的介绍,其中最常见的就是字符串常量池. (1)class常量池 在Java中,Java类被编译后就会形成一份class文件:class文件中除了包含类的版本.字段.方法.接口等描述信息外,还有一项信息就是常量池,用于存放编译器生成的各种字面量和符号引用,每个class文件都有一个class常量池. 其中字面量包括:1.文本字符串

  • 如何使用IDEA查看java文件编译后的字节码内容

    目录 首先编写一个java类StringDemo1.java 经过编译后,生成StringDemo1.class文件 使用jclasslib反编译工具 JDK版本映射 首先编写一个java类 StringDemo1.java public class StringDemo1 {    public static void main(String[] args) {        String str1 = "aaa" + "bbb";        System.o

  • 探究Java常量本质及三种常量池(小结)

    之前从他人的博文,还有一些书籍中了解到 常量是放在常量池 中,细节的内容无从得知,总觉得面前的东西是一个几乎完全的黑盒,总是觉得不舒服,于是就翻阅<深入理解Java虚拟机>,这本书中对常量的介绍更多地偏重于字节码文件的结构,还有在自动内存管理机制中也介绍了运行时常量池, 查阅资料后脑海中有了一定的认识. Java中的常量池分为三种形态:静态常量池,字符串常量池以及运行时常量池. 静态常量池 所谓静态常量池,即*.class文件中的常量池,class文件中的常量池不仅仅包含字符串(数字)字面量,

  • 解析Java Class 文件过程

    前言: 身为一个java程序员,怎么能不了解JVM呢,倘若想学习JVM,那就又必须要了解Class文件,Class之于虚拟机,就如鱼之于水,虚拟机因为Class而有了生命.<深入理解java虚拟机>中花了一整个章节来讲解Class文件,可是看完后,一直都还是迷迷糊糊,似懂非懂.正好前段时间看见一本书很不错:<自己动手写Java虚拟机>,作者利用go语言实现了一个简单的JVM,虽然没有完整实现JVM的所有功能,但是对于一些对JVM稍感兴趣的人来说,可读性还是很高的.作者讲解的很详细,

  • java虚拟机原理:Class字节码二进制文件分析

    目录 一.字节码文件 与 JVM 二.字节码文件示例 三.字节码文件二进制结构分析 1.魔数 2.次版本号 3.主版本号 4.常量池个数 总结 一.字节码文件 与 JVM Java 源码编译成 Class 字节码 ; Java 虚拟机 可以被认为是一个 解释器 , 解释编译后的 Class 字节码文件 , 最后在不同的操作系统中运行 ; Android 虚拟机 不是 Java 规范的 虚拟机 , 有一些根据嵌入式设备进行的定制的实现 ; Class 字节码 本质上就是 二进制数据 , 运行时 ,

  • java Class文件结构解析常量池字节码

    目录 Class文件结构 整体结构 文件头 常量池 属性表 Code_attribute结构 函数表/字段表 字节码解析 Class文件结构 整体结构 ClassFile { u4 magic; u2 minor_version; u2 major_version; u2 constant_pool_count; cp_info constant_pool[constant_pool_count-1]; u2 access_flags; u2 this_class; u2 super_class

  • Java 中的字符串常量池详解

    Java中的字符串常量池 Java中字符串对象创建有两种形式,一种为字面量形式,如String str = "droid";,另一种就是使用new这种标准的构造对象的方法,如String str = new String("droid");,这两种方式我们在代码编写时都经常使用,尤其是字面量的方式.然而这两种实现其实存在着一些性能和内存占用的差别.这一切都是源于JVM为了减少字符串对象的重复创建,其维护了一个特殊的内存,这段内存被成为字符串常量池或者字符串字面量池.

  • Java class文件格式之常量池_动力节点Java学院整理

    常量池中各数据项类型详解 常量池中的数据项是通过索引来引用的, 常量池中的各个数据项之间也会相互引用.在这11中常量池数据项类型中, 有两种比较基础, 之所以说它们基础, 是因为这两种类型的数据项会被其他类型的数据项引用. 这两种数据类型就是CONSTANT_Utf8 和 CONSTANT_NameAndType , 其中CONSTANT_NameAndType类型的数据项(CONSTANT_NameAndType_info)也会引用CONSTANT_Utf8类型的数据项(CONSTANT_Ut

  • Java中的字符串常量池详细介绍

    Java中字符串对象创建有两种形式,一种为字面量形式,如String str = "droid";,另一种就是使用new这种标准的构造对象的方法,如String str = new String("droid");,这两种方式我们在代码编写时都经常使用,尤其是字面量的方式.然而这两种实现其实存在着一些性能和内存占用的差别.这一切都是源于JVM为了减少字符串对象的重复创建,其维护了一个特殊的内存,这段内存被成为字符串常量池或者字符串字面量池. 工作原理 当代码中出现字

  • Java调用pyzbar解析base64二维码过程解析

    一.环境配置 所有OS,建议使用python3.6:python2.7也可以,但在安装过程中可能遇到升级pip等问题:请参考pyzbar官网https://pypi.org/project/pyzbar/ 1.Ubuntu16.4 apt-get install libzbar0 pip install pyzbar pip install Pillow 2.Centos7 yum install python-devel yum install zbar-devel yum install z

  • 浅谈javap命令拆解字节码文件

    目的拆解分析反编译字节码 解析成人能够理解的结构 ,然后再对字节码文件进一步分析 源代码 public class test { private static int classV =2; public static void main(String[] args) { classV =200; int localV =4; localV =400; } } 二进制 idea bin_ed插件查看. 看不懂 那就使用人能看的懂的汇编语言查看类文件结构和代码指令. javap 指令和选项 0:无选

  • 深入解析JVM之内存结构及字符串常量池(推荐)

    前言 Java作为一种平台无关性的语言,其主要依靠于Java虚拟机--JVM,我们写好的代码会被编译成class文件,再由JVM进行加载.解析.执行,而JVM有统一的规范,所以我们不需要像C++那样需要程序员自己关注平台,大大方便了我们的开发.另外,能够运行在JVM上的并只有Java,只要能够编译生成合乎规范的class文件的语言都是可以跑在JVM上的.而作为一名Java开发,JVM是我们必须要学习了解的基础,也是通向高级及更高层次的必修课:但JVM的体系非常庞大,且术语非常多,所以初学者对此非

  • java高并发ThreadPoolExecutor类解析线程池执行流程

    目录 摘要 核心逻辑概述 execute(Runnable)方法 addWorker(Runnable, boolean)方法 addWorkerFailed(Worker)方法 拒绝策略 摘要 ThreadPoolExecutor是Java线程池中最核心的类之一,它能够保证线程池按照正常的业务逻辑执行任务,并通过原子方式更新线程池每个阶段的状态. 今天,我们通过ThreadPoolExecutor类的源码深度解析线程池执行任务的核心流程,小伙伴们最好是打开IDEA,按照冰河说的步骤,调试下Th

  • java String源码和String常量池的全面解析

    1. String 介绍,常用方法源码分析 2. String 常量池分析 常用方法 equals trim replace concat split startsWith 和 endsWith substring toUpperCase() 和 toLowerCase() compareTo String 介绍 String类被final所修饰,也就是说String对象是不可变量,并发程序最喜欢不可变量了.String类实现了Serializable, Comparable, CharSequ

随机推荐