Android AndFix热修复原理详情

2025-02-04 00:24:32

前言

当我们写了一个方法，那么这个方法是如何被执行的呢？

public int add(){
    int a = 10;
    int b = 20;
    return a + b;
}

其实方法的本质就是arm指令，在Android当中，dalvik或者art虚拟机的执行引擎会执行arm指令

add方法是java代码，java代码编译成class文件，还需要一步转换为dex文件，才能被Android虚拟机执行，dex文件包含了app的所有代码，因此方法也是存在dex文件中，那么通过dx命令，可以查看方法被编译成的字节码指令

1 arm指令集

dx --dex --verbose --dump-to=dex_method.txt --dump-method=Method.add --verbose-dump Method.class

Android中可以通过dx命令将class文件转换为dex文件，dx.bat位于Android SDK中的build-tools文件夹下，那么可以通过dx命令将class文件翻译成arm指令集

可以看一下，打印输出的arm指令集，ART执行某个方法的时候，执行的就是这个指令集，当apk安装的时候，dex文件会被dex2oat工具翻译成本地机器码（arm指令集）保存在oat文件中，当apk运行的时候oat会被加载到内存中，存在虚拟机的方法区中

执行的时候，会构建一个栈帧压入虚拟机栈中，然后每一个方法在ART中都对应一个ArtMethod（这个后边会说），ArtMethod中的invoke函数会找到当前方法对应的本地机器码执行，执行完成之后，栈帧出栈

关注点回到指令集上，在每一行指令前有一个数字，代表程序计数器记录的行号，精简之后的指令集（只保留每个行号的最后一个）

Method.add:()I:
regs: 0002; ins: 0001; outs: 0000

  0000: const/16 v0, #int 30 // #001e
  0002: return v0
  0003: code-address
  debug info
    line_start: 4
    parameters_size: 0000
    0000: prologue end
    0000: line 4
    0000: line 6
    end sequence
  source file: "Method.java"

另外还有一种方式获取字节码，是通过javap获取，这种跟arm指令有啥区别呢？其实都是字节码，但是javap获取的字节码是JVM执行的字节码，Android虚拟机是Dalvik或者Art虚拟机，执行的是arm指令集

public int add();
    descriptor: ()I
    flags: ACC_PUBLIC
    Code:
      stack=2, locals=3, args_size=1
         0: bipush        10
         2: istore_1
         3: bipush        20
         5: istore_2
         6: iload_2
         7: iload_1
         8: iadd
         9: ireturn
      LineNumberTable:
        line 4: 0
        line 5: 3
        line 6: 6

这两者有什么区别呢？我们看同是执行 10 + 20 ，JVM是先创建一个10变量，然后再创建20 ，最后将两个相加然后返回；但是从ART机器指令中可以看到是直接计算好了，然后创建v0 = 30，直接返回，所以：Android编译器在编译的过程中会做优化，提高执行的效率(这个可以自己去试一下，javac并没有做优化处理)

当一个class类加载进来之后，class类中有方法、成员变量等，这些类的信息加载的时候是放在方法区，当Java层调用某个方法时，ART虚拟机找到该方法对应的本地机器码指令，在虚拟机栈中，该方法栈帧入栈，CPU去读取每行指令，程序计数器＋1，等到方法执行完毕，栈帧出栈。

2 AndFix热修复原理

之前我们介绍过阿里的AndFix或者Sophix是通过hook native层替换已经加载的类的方法，接下来我们着重看一下，AndFix热修复是怎么实现的

Method.add:()I:
regs: 0002; ins: 0001; outs: 0000

  0000: const/16 v0, #int 30 // #001e
  0002: return v0
  0003: code-address
  debug info
    line_start: 4
    parameters_size: 0000
    0000: prologue end
    0000: line 4
    0000: line 6
    end sequence
  source file: "Method.java"

public class Method {

    public int add(){
        int a = 10;
        int b = 20;
        return a + b;
    }
}
//调用
Method method = new Method();
method.add();

我们看下这个方法，通过Method对象去调用，method是在堆内存中，通过对象可以拿到类信息在方法区中。

当执行这个方法时，ART执行引擎从方法区中找到方法的本地机器指令，通过CPU执行得到结果，如果add方法中抛出异常导致app崩溃，那么如何修复?

2.1 ArtMethod

既然要做到方法替换，首先必须要了解方法在虚拟机中的形态；其实前面有提到，方法在虚拟机中对应的结构体就是ArtMethod，每个方法在ART中对应一个ArtMethod。

# Android 10.0/art/runtime/art_method.h
protected:

  GcRoot<mirror::Class> declaring_class_;

  std::atomic<std::uint32_t> access_flags_;

  uint32_t dex_code_item_offset_;

  uint32_t dex_method_index_;
  uint16_t method_index_;

  union {
    uint16_t hotness_count_;
    uint16_t imt_index_;
  };

  // Fake padding field gets inserted here.

  // Must be the last fields in the method.
  struct PtrSizedFields {
    // Depending on the method type, the data is
    //   - native method: pointer to the JNI function registered to this method
    //                    or a function to resolve the JNI function,
    //   - conflict method: ImtConflictTable,
    //   - abstract/interface method: the single-implementation if any,
    //   - proxy method: the original interface method or constructor,
    //   - other methods: the profiling data.
    void* data_;

    // Method dispatch from quick compiled code invokes this pointer which may cause bridging into
    // the interpreter.
    void* entry_point_from_quick_compiled_code_;
  } ptr_sized_fields_;

在ArtMethod中，有一个结构体PtrSizedFields，其中一个成员变量为entry_point_from_quick_compiled_code_，这个指针指向的就是在方法区中该方法本地机器码的内存地址，也就是说，如果想要实现热修复，那么就将entry_point_from_quick_compiled_code_指向正确的方法机器码指令地址即可。

除此之外，看下其他成员变量的含义：

declaring_class_：用来标记当前方法属于哪个类
access_flags_：当前方法的访问修饰符
hotness_count_：记录当前方法被调用的次数，如果超过某个限制，那么该方法就被标记为是热方法，这个与ART的编译模式相关

对于hotness_count_，这里需要说一下ART的编译模式，Dalvik的就先不介绍了

2.2 ART编译模式

在Android 5.0之后，Android编译器由ART代替了Dalvik，采用了全新的编译模式AOT，代替JIT；

什么是AOT？就是全量编译，在APK安装的时候，会将所有的dex文件编译成本地机器码，然后在执行方法时会直接拿到相应的机器码执行，速度非常快，但是这也带来一些问题：

（1）安装时间长

因为在安装的过程中做全量的编译，耗时非常严重；早先的Android手机我们在安装的时候，进度条一直在转但就是装不上，这种是非常差的用户体验

（2）存储空间

因为全量编译的时候，dex被编译成机器码之后，保存在.oat文件中，10M的dex翻译成的机器码内存激增4-5倍，大量的文件保存在手机中会占据内存空间

所以在Android N之后，采用了混合编译模式，AOP + 解释 + JIT

全新的混编模式不再在APK安装的时候进行全量编译，而是会解释字节码，因此安装的速度很快；此外新增了一个JIT编译器，会在App运行的时候分析代码，把结果保存在Profile中，并且在空闲时间分析并编译这些代码；

接着上面的hotness_count_，其实用来记录这个方法被调用的次数，当超过某个阈值之后，这个方法会被标记为热代码，这些热方法在设备空闲的时候做编译，并保存在名为app_image的base.art文件中，这个art文件会在类加载之前加载到内存中，意味着当调用这个方法的时候，不再需要编译为机器码，而是直接执行拿到结果。

2.3 AndFix框架实现

首先创建一个C++的模块，然后C++版本可选择个人熟悉的，我对C++ 11的一些特性比较熟悉

其实AndFix实现的关键，就是找到ArtMethod，在JNI层是能够实现的，通过JNIEnv的FromReflectedMethod函数

public class AndFixManager {
    //native热修复方法
    public static native void fix(Method wrong, Method right);
}

//fix对应的JNI接口
extern "C"
JNIEXPORT void JNICALL
Java_com_tal_andfix_AndFixManager_fix(
        JNIEnv *env,
        jclass clazz,
        jobject wrong,
        jobject right) {

    //获取ArtMethod
    env->FromReflectedMethod(wrong);

}

其实在Java层调用的时候，是需要反射获取某个方法，也就是说，在Java层反射拿到的方法其实就是ArtMethod，只不过再底层的我们看不到，那现在就能看到了！

try {
    Class<?> clazz = Class.forName("com.tal.demo02.FixDemo");
    Method run = clazz.getDeclaredMethod("run");
    AndFixManager.fix(run,run);
} catch (Exception e) {
    e.printStackTrace();
}

2.3.1 获取ArtMethod

之前我们看源码的时候，可以看到ArtMethod.h中存在很多系统的头文件，全部导入工程中不现实

因为我们需要的是ArtMethod的一个结构体的成员变量，所以我们只需要针对性地导入即可，art_method.h如下;

#ifndef DEMO02_ART_METHOD_H
#define DEMO02_ART_METHOD_H
#endif //DEMO02_ART_METHOD_H
#include "stdint.h"
namespace art{
    namespace mirror{
        class ArtMethod final {
        public:
            uint32_t declaring_class_;
            std::atomic<std::uint32_t> access_flags_;
            uint32_t dex_code_item_offset_;
            uint32_t dex_method_index_;
            uint16_t method_index_;
            union {
                uint16_t hotness_count_;
                uint16_t imt_index_;
            };
            struct PtrSizedFields {
                void* data_;

                void* entry_point_from_quick_compiled_code_;
            } ptr_sized_fields_;

        };

    }
}

最终在Java层调用JNI方法，执行到JNI层，获取到ArtMethod

extern "C"
JNIEXPORT void JNICALL
Java_com_tal_andfix_AndFixManager_fix(
        JNIEnv *env,
        jclass clazz,
        jobject wrong,
        jobject right) {

    //获取ArtMethod
    ArtMethod *artMethod = reinterpret_cast<ArtMethod *>(env->FromReflectedMethod(wrong));
}

这里通过断点可以看到，ArtMethod已经拿到了，而且关键信息entry_point_from_quick_compiled_code_，也就是arm指令集的内存地址拿到了！

2.3.2 方法替换

public class FixDemo {

    public void run(){
        throw new IllegalArgumentException();
    }
}

public class FixDemo {
    public void run(){
        Log.e("TAG","已经被修复了");
    }
}

现在有一个场景就是，当执行FixDemo的run方法时抛出异常导致崩溃，这种场景下，使用热修复技术怎么修复呢，就是方法替换，arm指令集替换

public class AndFixManager {

    public static void bugFix(){
        try {
            Class clazz = Class.forName("com.take.andfix.FixDemo");
            Method wrong = clazz.getDeclaredMethod("run");
            //正确的方法
            Class clazz1 = Class.forName("com.take.andfix.fox.FixDemo");
            Method right = clazz1.getDeclaredMethod("run");
            AndFixManager.fix(wrong, right);
        }catch (Exception e){

        }
    }
    public static native void fix(Method wrong, Method right);
}

抛出异常的类是andfix包下的，当线上需要修复时，下发patch包，然后加载fox包下的方法，调用native fix方法

extern "C"
JNIEXPORT void JNICALL
Java_com_tal_andfix_AndFixManager_fix(JNIEnv *env, jclass clazz, jobject wrong, jobject right) {

    //获取ArtMethod
    ArtMethod *wrongMethod = reinterpret_cast<ArtMethod *>(env->FromReflectedMethod(wrong));
    ArtMethod *rightMethod = reinterpret_cast<ArtMethod *>(env->FromReflectedMethod(right));

    //方法替换
    wrongMethod->declaring_class_ = rightMethod->declaring_class_;
    wrongMethod->access_flags_ = rightMethod->access_flags_;
    wrongMethod->dex_code_item_offset_ = rightMethod->dex_code_item_offset_;
    wrongMethod->dex_method_index_ = rightMethod->dex_method_index_;
    wrongMethod->method_index_ = rightMethod->method_index_;
    wrongMethod->ptr_sized_fields_.data_ = rightMethod->ptr_sized_fields_.data_;
    wrongMethod->ptr_sized_fields_.entry_point_from_quick_compiled_code_ = rightMethod->ptr_sized_fields_.entry_point_from_quick_compiled_code_;
}

然后再次执行run方法

binding.sampleText.setOnClickListener {
    AndFixManager.bugFix()
    val fixDemo = FixDemo()
    fixDemo.run()
}
打印出的结果：E/TAG: 已经被修复了

其实现在阿里的AndFix和Sophix已经不维护了，但是这种热修复的思想我们是需要了解的，尤其是通过hook native底层替换方法，能够帮助我们更好地了解JVM虚拟机和Android虚拟机。

2.4 AndFix动态化配置

在上面简单的demo中，我们是知道那个类的哪个方法发生异常，在代码中写死的，但真正的线上环境中，其实是不知道哪个类会报错，一般我们都会使用bugly，像crash跟anr都能够实时监控到

当app某个方法抛异常之后，通过bugly上报到后台，比如com.take.andfix.FixDemo这个类中的run方法抛出了异常，那么我们需要针对这个类的方法做修复，如果做到动态化，需要使用注解修饰这个修复类

/**
 * 修复类需要使用这个注解
 */
@Target(ElementType.METHOD)
@Retention(RetentionPolicy.RUNTIME)
public @interface andfix {
    String clazz();
    String method();
}

public class FixDemo {
    @andfix(clazz = "com.tal.andfix.FixDemo",method = "run")
    public void run(){
        Log.e("TAG","已经被修复了");
    }
}

这样在热修复时，能够知道这个修复类要修复线上环境中那个类的哪个方法

2.4.1 dex打包

在打包dex的时候，需要把整个包名路径下的class文件一起打包，通过命令行完成dex打包

dx --dex --output fix.dex /xxxx/Desktop/dx

将打包成功的dex修复包，放到sd卡中 :

2.4.2 dex文件加载

dex文件的加载，通过DexFile实现，如果不熟悉可以看下源码，art虚拟机会将dex转换为odex，因此加载dex文件的时候，需要传入一个odex文件的缓存路径。

将dex文件加载到内存之后，可以获取到dex文件中全部的类，通过DexFile.loadClass就可以将这个类通过类加载器加载。

/**
* dex文件加载，将dex文件加载到内存
* @param context
* @param dexFile
*/
private static void loadFixDex(Context context, File dexFile) {
   try {

       DexFile odex = DexFile.loadDex(
               dexFile.getAbsolutePath(),
               new File(context.getCacheDir(), "odex").getAbsolutePath(),
               Context.MODE_PRIVATE
       );
       Enumeration<String> entries = odex.entries();
       while (entries.hasMoreElements()){
           //全类名
           String clazzName = entries.nextElement();
           //加载类
           Class aClass = odex.loadClass(clazzName, context.getClassLoader());
           //处理类
           if(aClass != null){
               processClass(aClass);
           }
       }

   } catch (Exception e) {
       e.printStackTrace();
   }
}

这里会有一个问题，就是既然拿到了全类名，为什么不能通过方式1获取，而是需要通过方式2获取？原因就是，Class.forName是从当前apk中查找这个类，但是这个类是在dex文件中，是从服务端下发的，并没有放在apk中，因此通过Class.forName是找不到的，通过DexFile.loadClass才是真正加载类到了内存中

//方式1
Class.forName("xxxxxxxxxx")
//方式2
odex.loadClass(clazzName, context.getClassLoader())

2.4.3 动态替换方法

拿类之后，通过反射能够拿到修复类中的方法，当然不是每个方法都是需要被修复的，我们需要判断的是，上面是否有我们自定义的注解，如果有，那么就能够通过反射，拿到抛出异常的这个方法，因为注解上有我们传入的类名和方法名，最终调用JNI的接口实现动态替换方法

private static void processClass(Class aClass) {
    //获取方法上的注解
    Method[] methods = aClass.getMethods();
    for (Method method:methods){
        andfix annotation = method.getAnnotation(andfix.class);
        if(annotation != null){
            //如果存在这个注解，那么就执行方法替换
            String clazz = annotation.clazz();
            String method1 = annotation.method();
            //获取wrong方法
            try {
                Class<?> wrongMethodClass = Class.forName(clazz);
                //这里注意，修复类的方法，要和被修复的方法，参数一致！！！！！
                Method wrongMethod = wrongMethodClass.getDeclaredMethod(method1,method.getParameterTypes());
                //动态方法替换
                fix(wrongMethod,method);
            } catch (Exception e) {
                e.printStackTrace();
            }

        }
    }
}

2.4.4 文件访问问题

一切准备就绪之后，可以通过加载dex补丁包来修复

binding.sampleText.setOnClickListener {

//            AndFixManager.bugFix()
    AndFixManager.loadFixDex(
        this,
        File(System.getenv("EXTERNAL_STORAGE"), "fix.dex")
    )
    val fixDemo = FixDemo()
    fixDemo.run()
}

这里可能会碰到一些加载SD卡中文件报错的问题，比如：

No original dex files found for dex location /sdcard/fix.dex

这里需要添加文件的读写权限，才能够保证有效的热修复，除此之外，在Android 10以上的版本，需要在清单文件中添加android:requestLegacyExternalStorage属性

android:requestLegacyExternalStorage="true"

通过这种hook native底层的方式，最大的优势在于能够真正实现热修复，不需要重新启动app就能够修复，但是存在的弊端也是比较明显的，就是兼容性问题，每个Android的版本，native层都会有变化，比如art_method.h，其实每个版本都是不一样的，我这次使用的就是Android 10中的art_method头文件，有兴趣的可以看看之前Android版本的头文件，其实还是有差别的，所以在做兼容性问题的时候，需要根据版本来适配不同的头文件

到此这篇关于Android AndFix热修复原理详情的文章就介绍到这了,更多相关Android AndFix 内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们！

深入理解Android热修复技术原理之资源热修复技术

一.普遍的实现方式目前市面上的很多资源热修复方案基本上都是参考了 Instant Run的实现. 简要说来,Instant Run中的资源热修复分为两步: 1.构造一个新的 AssetManager,并通过反射调用 addAssetPath,把这个完整的新资源包加入到AssetManager中.这样就得到了一个含有所有新资源的 AssetManager. 2.找到所有之前引用到原有 AssetManager的地方,通过反射,把引用处替换为 AssetManager. 一个 Android
Android热修复及插件化原理示例详解

目录 1.前言 2.类加载机制 3.Android类加载 4.Tinker原理代码实现 5.插件化 5.1 Activity启动流程简单介绍 5.2 插件化原理 5.2.1 绕开验证 5.2.2还原插件Activity 5.3 加载插件资源 5.3.1 Resources&AssetManager 5.3.2 id冲突 1.前言热修复一直是这几年来很热门的话题,主流方案大致有两种,一种是微信Tinker的dex文件替换,另一种是阿里的Native层的方法替换.这里重点介绍Tinker的大致原
Android接入阿里云热修复介绍

1.AndroidManinifest.xml中加入权限 <uses-permission android:name="android.permission.INTERNET" /> <uses-permission android:name="android.permission.ACCESS_NETWORK_STATE" /> <uses-permission android:name="android.permissio
Android热修复Tinker接入及源码解读

一.概述热修复这项技术,基本上已经成为项目比较重要的模块了.主要因为项目在上线之后,都难免会有各种问题,而依靠发版去修复问题,成本太高了. 现在热修复的技术基本上有阿里的AndFix.QZone的方案.美团提出的思想方案以及腾讯的Tinker等. 其中AndFix可能接入是最简单的一个(和Tinker命令行接入方式差不多),不过兼容性还是是有一定的问题的:QZone方案对性能会有一定的影响,且在Art模式下出现内存错乱的问题(其实这个问题我之前并不清楚,主要是tinker在MDCC上指出的);
深入理解Android热修复技术原理之so库热修复技术

目录一.SO库加载原理二.SO库热部署实时生效可行性分析 2.1.动态注册 native 方法实时生效 2.2.静态注册 native 方法实时生效 2.3.SO实时生效方案总结三.SO库冷部署重启生效实现方案 3.1.接口调用替换方案 3.2.反射注入方案四.如何正确复制补丁 SO库五.本章小结一.SO库加载原理 Java Api 提供以下两个接口加载一个 so 库 System. loadLibrary (String libName):传进去的参数:so库名称, 表示的so 库
深入理解Android热修复技术原理之代码热修复技术

一.底层热替换原理 1.1.Andfix 回顾我们先来看一下,为何唯独 Andfix 能够做到即时生效呢? 原因是这样的,在 app运行到一半的时候,所有需要发生变更的分类已经被加载过了,在Android 上是无法对一个分类进行卸载的.而腾讯系的方案,都是让 Classloader去加载新的类.如果不重启,原来的类还在虚拟机中,就无法加载新类.因此,只有在下次重启的时候,在还没走到业务逻辑之前抢先加载补丁中的新类,这样后续访问这个类时,就会Resolve 为新的类.从而达到热修复的目的. An
Android AndFix热修复原理详情

目录前言 1 arm指令集 2 AndFix热修复原理 2.1 ArtMethod 2.2 ART编译模式 2.3 AndFix框架实现 2.3.1 获取ArtMethod 2.3.2 方法替换 2.4 AndFix动态化配置 2.4.1 dex打包 2.4.2 dex文件加载 2.4.3 动态替换方法 2.4.4 文件访问问题前言当我们写了一个方法,那么这个方法是如何被执行的呢? public int add(){ int a = 10; int b = 20; return a + b
Android进阶从字节码插桩技术了解美团热修复实例详解

目录引言 1 插件发布 2 Javassist 2.1 准备工作 2.2 Transform 2.3 transform函数注入代码 2.3.1 Jar包处理 2.3.2 字节码处理 2.4 Javassist织入代码 2.4.1 ClassPool 2.4.2 CtClass 引言热修复技术如今已经不是一个新颖的技术,很多公司都在用,而且像阿里.腾讯等互联网巨头都有自己的热修复框架,像阿里的AndFix采用的是hook native底层修改代码指令集的方式:腾讯的Tinker采用类加载的方
Android虚拟机与类加载机制详情

目录 JVM与Dalvik 基于栈的虚拟机字节码指令执行过程基于寄存器的虚拟机寄存器基于寄存器的虚拟机 ART与Dalvik dex2aot dexopt与dexaot Android N的运作方式 ClassLoader 介绍 ClassLoader加载流程与双亲委托机制类加载热修复 JVM与Dalvik Android应用程序运行在Dalvik/ART虚拟机,并且每一个应用程序对应有一个单独的Dalvik虚拟机实例.Dalvik虚拟机实则也算是一个Java虚拟机,只不过它执行的
Android中Lifecycle的原理详解

目录一.基本使用二.LifecycleObserver接口和LifecycleOwner接口三.getLifecycle() 四.绑定生命周期总结 Lifecycle是Android Architecture Components的成员,是一个生命周期感知组件,能够感知Activity.Fragment等组件的生命周期变化,并将变化通知到已注册的观察者.正确的使用有助于更好地组织代码,减少内存泄漏,增强稳定.下面分析他的实现原理,看看到底只怎么感知生命周期的. 一.基本使用 1.引入依赖