Android热修复原理（一）热修复框架对比和代码修复

　　在Android应用开发中，热修复技术被越来越多的开发者所使用，也出现了很多热修复框架，比如：AndFix、Tinker、Dexposed和Nuwa等等。如果只是会这些热修复框架的使用那意义并不大，我们还需要了解它们的原理，这样不管热修复框架如何变化，只要基本原理不变，我们就可以很快的掌握它们。这一个系列不会对某些热修复框架源码进行解析，而是讲解热修复框架的通用原理。
　　
　　1.热修复的产生概述
　　
　　在开发中我们会遇到如下的情况：
　　
　　1. 刚发布的版本出现了严重的bug，这就需要去解决bug、测试并打渠道包在各个应用市场上重新发布，这会耗费大量的人力物力，代价会比较大。
　　
　　2. 已经改正了此前发布版本的bug，如果下一个版本是一个大版本，那么两个版本的间隔时间会很长，这样要等到下个大版本发布再修复bug，这样此前版本的bug会长期的影响用户。
　　
　　3. 版本升级率不高，并且需要很长时间来完成版本覆盖，此前版本的bug就会一直影响不升级版本的用户。
　　
　　4. 有一个小而重要的功能，需要短时间内完成版本覆盖，比如节日活动。
　　
　　为了解决上面的问题，热修复框架就产生了。对于Bug的处理，开发人员不要过于依赖热修复框架，在开发的过程中还是要按照标准的流程做好自测、配合测试人员完成测试流程。
　　
　　2.热修复框架的对比
　　
　　热修复框架的种类繁多，按照公司团队划分主要有以下几种：
　　
　　类别成员
　　
　　阿里系 AndFix、Dexposed、阿里百川、Sophix
　　
　　腾讯系微信的Tinker、QQ空间的超级补丁、手机QQ的QFix
　　
　　知名公司美团的Robust、饿了么的Amigo、美丽说蘑菇街的Aceso
　　
　　其他 RocooFix、Nuwa、AnoleFix
　　
　　虽然热修复框架很多，但热修复框架的核心技术主要有三类，分别是代码修复、资源修复和动态链接库修复，其中每个核心技术又有很多不同的技术方案，每个技术方案又有不同的实现，另外这些热修复框架仍在不断的更新迭代中，可见热修复框架的技术实现是繁多可变的。作为开发需需要了解这些技术方案的基本原理，这样就可以以不变应万变。
　　
　　部分热修复框架的对比如下表所示。
　　
　　特性 AndFix Tinker/Amigo QQ空间 Robust/Aceso
　　
　　即时生效是否否是
　　
　　方法替换是是是是
　　
　　类替换否是是否
　　
　　类结构修改否是否否
　　
　　资源替换否是是否
　　
　　so替换否是否否
　　
　　支持gradle 否是否否
　　
　　支持ART 是是是是
　　
　　支持Android7.0 是是是是
　　
　　我们可以根据上表和具体业务来选择合适的热修复框架，当然上表的信息很难做到完全准确，因为部分的热修复框架还在不断更新迭代。
　　
　　从表中也可以发现Tinker和Amigo拥有的特性最多，是不是就选它们呢？也不尽然，拥有的特性多也意味着框架的代码量庞大，我们需要根据业务来选择最合适的，假设我们只是要用到方法替换，那么使用Tinker和Amigo显然是大材小用了。另外如果项目需要即时生效，那么使用Tinker和Amigo是无法满足需求的。对于即时生效，AndFix、Robust和Aceso都满足这一点，这是因为AndFix的代码修复采用了底层替换方案，而Robust和Aceso的代码修复借鉴了Instant Run原理，现在我们就来学习代码修复。
　　
　　3.代码修复
　　
　　代码修复主要有三个方案，分别是底层替换方案、类加载方案和Instant Run方案。
　　
　　3.1 类加载方案
　　
　　类加载方案基于Dex分包方案，什么是Dex分包方案呢？这个得先从65536限制和LinearAlloc限制说起。
　　
　　65536限制
　　
　　随着应用功能越来越复杂，代码量不断地增大，引入的库也越来越多，可能会在编译时提示如下异常：
　　
　　com.android.dex.DexIndexOverflowException: method ID not in [0, 0xffff]: 65536
　　
　　1
　　
　　这说明应用中引用的方法数超过了最大数65536个。产生这一问题的原因就是系统的65536限制，65536限制的主要原因是DVM Bytecode的限制，DVM指令集的方法调用指令invoke-kind索引为16bits，最多能引用 65535个方法。
　　
　　LinearAlloc限制
　　
　　在安装时可能会提示INSTALL_FAILED_DEXOPT。产生的原因就是LinearAlloc限制，DVM中的LinearAlloc是一个固定的缓存区，当方法数过多超出了缓存区的大小时会报错。
　　
　　为了解决65536限制和LinearAlloc限制，从而产生了Dex分包方案。Dex分包方案主要做的是在打包时将应用代码分成多个Dex，将应用启动时必须用到的类和这些类的直接引用类放到主Dex中，其他代码放到次Dex中。当应用启动时先加载主Dex，等到应用启动后再动态的加载次Dex，从而缓解了主Dex的65536限制和LinearAlloc限制。
　　
　　Dex分包方案主要有两种，分别是Google官方方案、Dex自动拆包和动态加载方案。因为Dex分包方案不是本章的重点，这里就不再过多的介绍，我们接着来学习类加载方案。
　　
　　在Android解析ClassLoader（二）Android中的ClassLoader中讲到了ClassLoader的加载过程，其中一个环节就是调用DexPathList的findClass的方法，如下所示。
　　
　　libcore/dalvik/src/main/java/dalvik/system/DexPathList.java
　　
　　public Class<?> findClass(String name, List<Throwable> suppressed) {
　　
　　for (Element element : dexElements) {www.tygj178.com //1
　　
　　Class<?> clazz = element.findClass(name, definingContext, suppressed);//2
　　
　　if (clazz != null) {
　　
　　return clazz;
　　
　　}
　　
　　}
　　
　　if (dexElementsSuppressedExceptions != null) {
　　
　　suppressed.addAll(Arrays.asList(dexElementsSuppressedExceptions));
　　
　　}
　　
　　Element内部封装了DexFile，DexFile用于加载dex文件，因此每个dex文件对应一个Element。
　　
　　多个Element组成了有序的Element数组dexElements。当要查找类时，会在注释1处遍历Element数组dexElements（相当于遍历dex文件数组），注释2处调用Element的findClass方法，其方法内部会调用DexFile的loadClassBinaryName方法查找类。如果在Element中（dex文件）找到了该类就返回，如果没有找到就接着在下一个Element中进行查找。
　　
　　根据上面的查找流程，我们将有bug的类Key.class进行修改，再将Key.class打包成包含dex的补丁包Patch.jar，放在Element数组dexElements的第一个元素，这样会首先找到Patch.dex中的Key.class去替换之前存在bug的Key.class，排在数组后面的dex文件中的存在bug的Key.class根据ClassLoader的双亲委托模式就不会被加载，这就是类加载方案，如下图所示。
　　
　　13.1.png
　　
　　类加载方案需要重启App后让ClassLoader重新加载新的类，为什么需要重启呢？这是因为类是无法被卸载的，因此要想重新加载新的类就需要重启App，因此采用类加载方案的热修复框架是不能即时生效的。
　　
　　虽然很多热修复框架采用了类加载方案，但具体的实现细节和步骤还是有一些区别的，比如QQ空间的超级补丁和Nuwa是按照上面说得将补丁包放在Element数组的第一个元素得到优先加载。微信Tinker将新旧apk做了diff，得到patch.dex，然后将patch.dex与手机中apk的classes.dex做合并，生成新的classes.dex，然后在运行时通过反射将classes.dex放在Element数组的第一个元素。饿了么的Amigo则是将补丁包中每个dex 对应的Element取出来，之后组成新的Element数组，在运行时通过反射用新的Element数组替换掉现有的Element 数组。
　　
　　采用类加载方案的主要是以腾讯系为主，包括微信的Tinker、QQ空间的超级补丁、手机QQ的QFix、饿了么的Amigo和Nuwa等等。
　　
　　3.2 底层替换方案
　　
　　与类加载方案不同的是，底层替换方案不会再次加载新类，而是直接在Native层修改原有类，由于是在原有类进行修改限制会比较多，不能够增减原有类的方法和字段，如果我们增加了方法数，那么方法索引数也会增加，这样访问方法时会无法通过索引找到正确的方法，同样的字段也是类似的情况。
　　
　　底层替换方案和反射的原理有些关联，就拿方法替换来说，方法反射我们可以调用java.lang.Class.getDeclaredMethod，假设我们要反射Key的show方法，会调用如下所示。
　　
　　Key.class.getDeclaredMethod("show").invoke(Key.class.newInstance());
　　
　　1
　　
　　Android 8.0的invoke方法，如下所示。
　　
　　libcore/ojluni/src/main/java/java/lang/reflect/Method.java
　　
　　@FastNative
　　
　　public native Object invoke(Object obj,www.shashuiyule.cn Object... args)
　　
　　invoke方法是个native方法，对应Jni层的代码为：
　　
　　art/runtime/native/java_lang_reflect_Method.cc
　　
　　static jobject Method_invoke(JNIEnv* env, jobject javaMethod, jobject javaReceiver,
　　
　　jobject javaArgs) {
　　
　　ScopedFastNativeObjectAccess soa(env);
　　
　　return InvokeMethod(soa, javaMethod, javaReceiver, javaArgs);
　　
　　Method_invoke函数中又调用了InvokeMethod函数：
　　
　　art/runtime/reflection.cc
　　
　　jobject InvokeMethod(const ScopedObjectAccessAlreadyRunnable& soa, jobject javaMethod,
　　
　　jobject javaReceiver, jobject javaArgs, size_t num_frames) {
　　
　　...
　　
　　ObjPtr<mirror::Executable> executable = soa.Decode<mirror::Executable>(javaMethod);
　　
　　const bool accessible = executable->IsAccessible();
　　
　　ArtMethod* m = executable->GetArtMethod();//1
　　
　　注释1处获取传入的javaMethod（Key的show方法）在ART虚拟机中对应的一个ArtMethod指针，ArtMethod结构体中包含了Java方法的所有信息，包括执行入口、访问权限、所属类和代码执行地址等等，ArtMethod结构如下所示。
　　
　　art/runtime/art_method.h
　　
　　class ArtMethod FINAL {
　　
　　...
　　
　　protected:
　　
　　GcRoot<mirror::Class> declaring_class_;
　　
　　std::atomic<std::uint32_t>www.dasheng178.com access_flags_;
　　
　　uint32_t dex_code_item_offset_;
　　
　　uint32_t dex_method_index_;
　　
　　uint16_t method_index_;
　　
　　uint16_t hotness_count_;
　　
　　struct PtrSizedFields {
　　
　　ArtMethod** dex_cache_resolved_methods_;//1
　　
　　void* data_;
　　
　　void* entry_point_from_quick_compiled_code_;//2
　　
　　} ptr_sized_fields_;
　
　　
　　ArtMethod结构中比较重要的字段是注释1处的dex_cache_resolved_methods_和注释2处的entry_point_from_quick_compiled_code_，它们是方法的执行入口，当我们调用某一个方法时（比如Key的show方法），就会取得show方法的执行入口，通过执行入口就可以跳过去执行show方法。
　　
　　替换ArtMethod结构体中的字段或者替换整个ArtMethod结构体，这就是底层替换方案。
　　
　　AndFix采用的是替换ArtMethod结构体中的字段，这样会有兼容问题，因为厂商可能会修改ArtMethod结构体，导致方法替换失败。Sophix采用的是替换整个ArtMethod结构体，这样不会存在兼容问题。
　　
　　底层替换方案直接替换了方法，可以立即生效不需要重启。采用底层替换方案主要是阿里系为主，包括AndFix、Dexposed、阿里百川、Sophix。
　　
　　3.3 Instant Run方案
　　
　　除了资源修复，代码修复同样也可以借鉴Instant Run的原理，可以说Instant Run的出现推动了热修复框架的发展。
　　
　　Instant Run在第一次构建apk时，使用ASM在每一个方法中注入了类似如下的代码：
　　
　　IncrementalChange localIncrementalChange = $change;//1
　　
　　if (localIncrementalChange != null) {//2
　　
　　localIncrementalChange.access$dispatch(
　　
　　"onCreate.(Landroid/os/Bundle;)V", new Object[www.dongfan178.com] { this,
　　
　　paramBundle });
　　
　　return;
　　
　　其中注释1处是一个成员变量localIncrementalChange ，它的值为$change，$change实现了IncrementalChange这个抽象接口。当我们点击InstantRun时，如果方法没有变化则$change为null，就调用return，不做任何处理。如果方法有变化，就生成替换类，这里我们假设MainActivity的onCreate方法做了修改，就会生成替换类MainActivity$override，这个类实现了IncrementalChange接口，同时也会生成一个AppPatchesLoaderImpl类，这个类的getPatchedClasses方法会返回被修改的类的列表（里面包含了MainActivity），根据列表会将MainActivity的$change设置为MainActivity$override，因此满足了注释2的条件，会执行MainActivity$override的access$dispatch方法，access$dispatch方法中会根据参数”onCreate.(Landroid/os/Bundle;)V”执行MainActivity$override的onCreate方法，从而实现了onCreate方法的修改。
　　
　　借鉴Instant Run的原理的热修复框架有Robust和Aceso。

Android热修复原理（一）热修复框架对比和代码修复的更多相关文章

Unity3D热更新之LuaFramework篇[08]--热更新原理及热更服务器搭建
前言前面铺垫了这么久,终于要开始写热更新了. Unity游戏热更新包含两个方面,一个是资源的更新,一个是脚本的更新. 资源更新是Unity本来就支持的,在各大平台也都能用.而脚本的热更新在iOS平台 ...
Android &Swift iOS开发：语言与框架对比
转载自:http://www.infoq.com/cn/articles/from-android-to-swift-ios?utm_campaign=rightbar_v2&utm_sour ...
HBase运维基础--元数据逆向修复原理
背景鉴于上次一篇文章——“云HBase小组成功抢救某公司自建HBase集群,挽救30+T数据”的读者反馈,对HBase的逆向工程比较感兴趣,并咨询如何使用相应工具进行运维等等.总的来说,就是想更深层 ...
Android 类加载原理和热修复——深入浅出原理与实现
一.简述热修复无疑是这2年较火的新技术,是作为安卓工程师必学的技能之一.在热修复出现之前,一个已经上线的app中如果出现了bug,即使是一个非常小的bug,不及时更新的话有可能存在风险,若要及时更新 ...
Andfix热修复原理
一.前言最近腾讯弄出一个Tinker热修复框架,那么本文先不介绍这个框架,先来介绍一下阿里的一个热修复框架AndFix,这个框架出来已经很长时间了,但是看网上没有太多非常详细的讲解,这里就来做一次分 ...
深入理解xLua热更新原理
热更新简介热更新是指在不需要重新编译打包游戏的情况下,在线更新游戏中的一些非核心代码和资源,比如活动运营和打补丁.热更新分为资源热更新和代码热更新两种,代码热更新实际上也是把代码当成资源的一种热更新 ...
深入理解xLua基于IL代码注入的热更新原理
目前大部分手游都会采用热更新来解决应用商店审核周期长,无法满足快节奏迭代的问题.另外热更新能够有效降低版本升级所需的资源大小,节省玩家的时间和流量,这也使其成为移动游戏的主流更新方式之一. 热更新可以 ...
python基于函数替换的热更新原理介绍
热更新即在不重启进程或者不离开Python interpreter的情况下使得被编辑之后的python源码能够直接生效并按照预期被执行新代码.平常开发中,热更能极大提高程序开发和调试的效率,在修复线上 ...
webpack与browser-sync热更新原理深度讲解
本文首发于CSDN网站,下面的版本又经过进一步的修订.原文:webpack与browser-sync热更新原理深度讲解本文包含如下内容: webpack-hot-middleware EventSou ...

随机推荐

百度地图在移动端下click无效的解决方案
这是由于百度地图在移动端屏蔽了click事件,在网上找到一种方法,利用touchClick方法来模拟click事件,代码如下(需要JQ插件): //给jquery添加touchClick方法 (fun ...
QRCode 二维码
一.生成二维码 1.二维码就是绘制成黑白相间的图片,所谓的黑白相间就是代表0和1 ,二维码大约可以容纳500多个中文,所以用途之广显而易见. 所需的jar包 http://pan.baidu.com ...
Tomcat ngxin 反向代理
tomcat nginx 反向代理安装nginx yum直接安装 yum install nginx –y 也可以编译安装这是用编译安装,新手可以用yum安装配置文件在 /etc/nginx/c ...
fs - 文件系统
fs 模块提供了一些 API,用于以一种类似标准 POSIX 函数的方式与文件系统进行交互. 用法如下: const fs = require('fs'); 所有的文件系统操作都有异步和同步两种形式. ...
python 原生态调用server服务————SimpleHTTPServer
python 原生态调用server服务,接收http传递的参数并且处理返回结果很多blog中都是抄了官网的,没有说明参数如何接收 1.代码中提供了post与get两种方式来发起请求,但是传递参数时 ...
-lPods-NewsPushClientSDK is not an object file (not allowed in a library)
今天在给客户定制SDK的过程中,出现了下面的一个问题,具有代表性,现在记录下来问题: Showing All Errors Only : /Applications/Xcode.app/Conten ...
《 Spring1之第二次站立会议（重发）》
< 第二次站立会议(重发)> 昨天,我把找到的代码和协议资料等相关资料在团队里做了相应的汇报: 今天,我对自己找到的代码进行了相关的了解后,把它们在编译环境中进行了编译以及接着对代码进行逐 ...
OSG学习：计算纹理坐标
在很多时候,直接指定纹理坐标是非常不方便的,如曲面纹理坐标,只有少数的曲面(如圆锥.圆柱等)可以在不产生扭曲的情况下映射到平面上,其他的曲面在映射到表面时都会产生一定程度的扭曲.一般而言,曲面表面的曲 ...
NET Core 部署到 Windows服务
https://www.cnblogs.com/linezero/p/5159927.html https://www.cnblogs.com/emrys5/p/nssm-netcore.html h ...
Beta版本测试第二天
一. 每日会议 1. 照片 2. 昨日完成工作登入界面的优化与注册界面的优化,之前的登入界面与注册界面没有设计好,使得登入界面与注册界面并不好看,这次对界面进行了优化.另外尝试了找回密码的功能. 3 ...

Android热修复原理（一）热修复框架对比和代码修复

Android热修复原理（一）热修复框架对比和代码修复的更多相关文章

随机推荐

热门专题