前言

    受《APP研发录》启发,里面讲到一名Android程序员,在工作一段时间后,会感觉到迷茫,想进阶的话接下去是看Android系统源码呢,还是每天继续做应用,毕竟每天都是画UI和利用MobileAPI处理Json还是蛮无聊的,做着重复的事情,没有技术的上提升空间的。所以,根据里面提到的Android应用开发人员所需要精通的20个技术点,写篇文章进行总结,一方面是梳理下基础知识和巩固知识,另一方面也是弥补自我不足之处。
    那么,今天就来讲讲ProGuard代码混淆的相关技术知识点。

内容目录

  • ProGuard简介
  • ProGuard工作原理
  • 如何编写一个ProGuard文件
  • 其他注意事项
  • 小结

ProGuard简介

因为Java代码是非常容易反编码的,况且Android开发的应用程序是用Java代码写的,为了很好的保护Java源代码,我们需要对编译好后的class文件进行混淆。
ProGuard是一个混淆代码的开源项目,它的主要作用是混淆代码,殊不知ProGuard还包括以下4个功能。
  1. 压缩(Shrink):检测并移除代码中无用的类、字段、方法和特性(Attribute)。
  2. 优化(Optimize):对字节码进行优化,移除无用的指令。
  3. 混淆(Obfuscate):使用a,b,c,d这样简短而无意义的名称,对类、字段和方法进行重命名。
  4. 预检(Preveirfy):在Java平台上对处理后的代码进行预检,确保加载的class文件是可执行的。
总而言之,根据官网的翻译:Proguard是一个Java类文件压缩器、优化器、混淆器、预校验器。压缩环节会检测以及移除没有用到的类、字段、方法以及属性。优化环节会分析以及优化方法的字节码。混淆环节会用无意义的短变量去重命名类、变量、方法。这些步骤让代码更精简,更高效,也更难被逆向(破解)。

 

ProGuard工作原理

ProGuar由shrink、optimize、obfuscate和preveirfy四个步骤组成,每个步骤都是可选的,我们可以通过配置脚本来决定执行其中的哪几个步骤。
 
混淆就是移除没有用到的代码,然后对代码里面的类、变量、方法重命名为人可读性很差的简短名字。
那么有一个问题,ProGuard怎么知道这个代码没有被用到呢?
这里引入一个Entry Point(入口点)概念,Entry Point是在ProGuard过程中不会被处理的类或方法。在压缩的步骤中,ProGuard会从上述的Entry Point开始递归遍历,搜索哪些类和类的成员在使用,对于没有被使用的类和类的成员,就会在压缩段丢弃,在接下来的优化过程中,那些非Entry Point的类、方法都会被设置为private、static或final,不使用的参数会被移除,此外,有些方法会被标记为内联的,在混淆的步骤中,ProGuard会对非Entry Point的类和方法进行重命名。
那么这个入口点怎么来呢?就是从ProGuard的配置文件来,只要这个配置了,那么就不会被移除。
 

如何编写一个ProGuard文件

有个三步走的过程:
  • 基本混淆
  • 针对APP的量身定制
  • 针对第三方jar包的解决方案
基本混淆
混淆文件的基本配置信息,任何APP都要使用,可以作为模板使用,具体如下。
1,基本指令
  1. # 代码混淆压缩比,在0和7之间,默认为5,一般不需要改
  2. -optimizationpasses 5
  3.  
  4. # 混淆时不使用大小写混合,混淆后的类名为小写
  5. -dontusemixedcaseclassnames
  6.  
  7. # 指定不去忽略非公共的库的类
  8. -dontskipnonpubliclibraryclasses
  9.  
  10. # 指定不去忽略非公共的库的类的成员
  11. -dontskipnonpubliclibraryclassmembers
  12.  
  13. # 不做预校验,preverify是proguard的4个步骤之一
  14. # Android不需要preverify,去掉这一步可加快混淆速度
  15. -dontpreverify
  16.  
  17. # 有了verbose这句话,混淆后就会生成映射文件
  18. # 包含有类名->混淆后类名的映射关系
  19. # 然后使用printmapping指定映射文件的名称
  20. -verbose
  21. -printmapping proguardMapping.txt
  22.  
  23. # 指定混淆时采用的算法,后面的参数是一个过滤器
  24. # 这个过滤器是谷歌推荐的算法,一般不改变
  25. -optimizations !code/simplification/arithmetic,!field/*,!class/merging/*
  26.  
  27. # 保护代码中的Annotation不被混淆,这在JSON实体映射时非常重要,比如fastJson
  28. -keepattributes *Annotation*
  29.  
  30. # 避免混淆泛型,这在JSON实体映射时非常重要,比如fastJson
  31. -keepattributes Signature
  32.  
  33. //抛出异常时保留代码行号,在异常分析中可以方便定位
  34. -keepattributes SourceFile,LineNumberTable
  35.  
  36. -dontskipnonpubliclibraryclasses用于告诉ProGuard,不要跳过对非公开类的处理。默认情况下是跳过的,因为程序中不会引用它们,有些情况下人们编写的代码与类库中的类在同一个包下,并且对包中内容加以引用,此时需要加入此条声明。
  37.  
  38. -dontusemixedcaseclassnames,这个是给Microsoft Windows用户的,因为ProGuard假定使用的操作系统是能区分两个只是大小写不同的文件名,但是Microsoft Windows不是这样的操作系统,所以必须为ProGuard指定-dontusemixedcaseclassnames选项

2,需要保留的东西

  1. # 保留所有的本地native方法不被混淆
  2. -keepclasseswithmembernames class * {
  3. native <methods>;
  4. }
  5.  
  6. # 保留了继承自Activity、Application这些类的子类
  7. # 因为这些子类,都有可能被外部调用
  8. # 比如说,第一行就保证了所有Activity的子类不要被混淆
  9. -keep public class * extends android.app.Activity
  10. -keep public class * extends android.app.Application
  11. -keep public class * extends android.app.Service
  12. -keep public class * extends android.content.BroadcastReceiver
  13. -keep public class * extends android.content.ContentProvider
  14. -keep public class * extends android.app.backup.BackupAgentHelper
  15. -keep public class * extends android.preference.Preference
  16. -keep public class * extends android.view.View
  17. -keep public class com.android.vending.licensing.ILicensingService
  18.  
  19. # 如果有引用android-support-v4.jar包,可以添加下面这行
  20. -keep public class com.xxxx.app.ui.fragment.** {*;}
  21.  
  22. # 保留在Activity中的方法参数是view的方法,
  23. # 从而我们在layout里面编写onClick就不会被影响
  24. -keepclassmembers class * extends android.app.Activity {
  25. public void *(android.view.View);
  26. }
  27.  
  28. # 枚举类不能被混淆
  29. -keepclassmembers enum * {
  30. public static **[] values();
  31. public static ** valueOf(java.lang.String);
  32. }
  33.  
  34. # 保留自定义控件(继承自View)不被混淆
  35. -keep public class * extends android.view.View {
  36. *** get*();
  37. void set*(***);
  38. public <init>(android.content.Context);
  39. public <init>(android.content.Context, android.util.AttributeSet);
  40. public <init>(android.content.Context, android.util.AttributeSet, int);
  41. }
  42.  
  43. # 保留Parcelable序列化的类不被混淆
  44. -keep class * implements android.os.Parcelable {
  45. public static final android.os.Parcelable$Creator *;
  46. }
  47.  
  48. # 保留Serializable序列化的类不被混淆
  49. -keepclassmembers class * implements java.io.Serializable {
  50. static final long serialVersionUID;
  51. private static final java.io.ObjectStreamField[] serialPersistentFields;
  52. private void writeObject(java.io.ObjectOutputStream);
  53. private void readObject(java.io.ObjectInputStream);
  54. java.lang.Object writeReplace();
  55. java.lang.Object readResolve();
  56. }
  57.  
  58. # 对于R(资源)下的所有类及其方法,都不能被混淆
  59. -keep class **.R$* {
  60. *;
  61. }
  62.  
  63. # 对于带有回调函数onXXEvent的,不能被混淆
  64. -keepclassmembers class * {
  65. void *(**On*Event);
  66. }
针对APP的量身定制
1,保留实体类和成员被混淆
对于实体,保留它们的set和get方法,对于boolean型get方法,有人喜欢命名isXXX的方式,所以不要遗漏。如下:
  1. # 保留实体类和成员不被混淆
  2. -keep public class com.xxxx.entity.** {
  3. public void set*(***);
  4. public *** get*();
  5. public *** is*();
  6. }

一种好的做法是把所有实体都放在一个包下进行管理,这样只写一次混淆就够了,避免以后在别的包中新增的实体而忘记保留,代码在混淆后因为找不到相应的实体类而崩溃。

2,内嵌类

内嵌类经常会被混淆,结果在调用的时候为空就崩溃了,最好的解决方法就是把这个内嵌类拿出来,单独成为一个类。如果一定要内置,那么这个类就必须在混淆的时候保留,比如如下:

  1. # 保留内嵌类不被混淆
  2. -keep class com.example.xxx.MainActivity$* { *; }

这个$符号就是用来分割内嵌类与其母体的标志。

3,对WebView的处理

  1. # 对WebView的处理
  2. -keepclassmembers class * extends android.webkit.webViewClient {
  3. public void *(android.webkit.WebView, java.lang.String, android.graphics.Bitmap);
  4. public boolean *(android.webkit.WebView, java.lang.String)
  5. }
  6. -keepclassmembers class * extends android.webkit.webViewClient {
  7. public void *(android.webkit.webView, java.lang.String)
  8. }

4,对JavaScript的处理

  1. # 保留JS方法不被混淆
  2. -keepclassmembers class com.example.xxx.MainActivity$JSInterface1 {
  3. <methods>;
  4. }

其中JSInterface是MainActivity的子类

5,处理反射

在程序中使用SomeClass.class.method这样的静态方法,在ProGuard中是在压缩过程中被保留的,那么对于Class.forName("SomeClass")呢,SomeClass不会被压缩过程中移除,它会检查程序中使用的Class.forName方法,对参数SomeClass法外开恩,不会被移除。但是在混淆过程中,无论是Class.forName("SomeClass"),还是SomeClass.class,都不能蒙混过关,SomeClass这个类名称会被混淆,因此,我们要在ProGuard.cfg文件中保留这个类名称。
  • Class.forName("SomeClass")
  • SomeClass.class
  • SomeClass.class.getField("someField")
  • SomeClass.class.getDeclaredField("someField")
  • SomeClass.class.getMethod("someMethod", new Class[] {})
  • SomeClass.class.getMethod("someMethod", new Class[] { A.class })
  • SomeClass.class.getMethod("someMethod", new Class[] { A.class, B.class })
  • SomeClass.class.getDeclaredMethod("someMethod", new Class[] {})
  • SomeClass.class.getDeclaredMethod("someMethod", new Class[] { A.class })
  • SomeClass.class.getDeclaredMethod("someMethod", new Class[] { A.class, B.class })
  • AtomicIntegerFieldUpdater.newUpdater(SomeClass.class, "someField")
  • AtomicLongFieldUpdater.newUpdater(SomeClass.class, "someField")
  • AtomicReferenceFieldUpdater.newUpdater(SomeClass.class, SomeType.class, "someField")

在混淆的时候,要在项目中搜索一下上述方法,将相应的类或者方法的名称进行保留而不被混淆。

6,对于自定义View的解决方案
但凡在Layout目录下的XML布局文件配置的自定义View,都不能进行混淆。为此要遍历Layout下的所有的XML布局文件,找到那些自定义View,然后确认其是否在ProGuard文件中保留。有一种思路是,在我们使用自定义View时,前面都必须加上我们的包名,比如com.a.b.customeview,我们可以遍历所有Layout下的XML布局文件,查找所有匹配com.a.b的标签即可。
 
针对第三方jar包的解决方案
我们在Android项目中不可避免要使用很多第三方提供的SDK,一般而言,这些SDK是经过ProGuard混淆的,而我们所需要做的就是避免这些SDK的类和方法在我们APP被混淆。
1,针对android-support-v4.jar的解决方案
  1. # 针对android-support-v4.jar的解决方案
  2. -libraryjars libs/android-support-v4.jar
  3. -dontwarn android.support.v4.**
  4. -keep class android.support.v4.** { *; }
  5. -keep interface android.support.v4.app.** { *; }
  6. -keep public class * extends android.support.v4.**
  7. -keep public class * extends android.app.Fragment

2,其他的第三方jar包的解决方案

这个就取决于第三方包的混淆策略了,一般都有在各自的SDK中有关于混淆的说明文字,比如支付宝如下:

  1. # 对alipay的混淆处理
  2. -libraryjars libs/alipaysdk.jar
  3. -dontwarn com.alipay.android.app.**
  4. -keep public class com.alipay.** { *; }

值得注意的是,不是每个第三方SDK都需要-dontwarn 指令,这取决于混淆时第三方SDK是否出现警告,需要的时候再加上。

其他注意事项

当然在使用ProGuard过程中,还有一些注意的事项,如下。
1,如何确保混淆不会对项目产生影响
  • 测试工作要基于混淆包进行,才能尽早发现问题
  • 每天开发团队的冒烟测试,也要基于混淆包
  • 发版前,重点的功能和模块要额外的测试,包括推送,分享,打赏
2,打包时忽略警告
当导出包的时候,发现很多could not reference class之类的warning信息,如果确认App在运行中和那些引用没有什么关系,可以添加-dontwarn 标签,就不会提示这些警告信息了
 
3,对于自定义类库的混淆处理
比如我们引用了一个叫做AndroidLib的类库,我们需要对Lib也进行混淆,然后在主项目的混淆文件中保留AndroidLib中的类和类的成员。
 
4,使用annotation避免混淆
另一种类或者属性被混淆的方式是,使用annotation,比如这样:
  1. @keep
  2. @keepPublicGetterSetters
  3. public class Bean{
  4. public boolean booleanProperty;
  5. public int intProperty;
  6. public String stringProperty;
  7. }
5,在项目中指定混淆文件
到最后,发现没有介绍如何在项目中指定混淆文件。在项目中有一个project.properties文件,在其中写这么一句话,就可以确保每次手动打包生成的apk是混淆过的。
proguard.config=proguard.cfg
其中,proguard.cfg是混淆文件的名称。

小结

总之ProGuard是一个比较枯燥的过程,但Android项目没有了ProGuard就真不行了,这样可以保证我们开发出的APK可以更健壮,毕竟很多核心代码质量也算是一个APK的核心竞争力吧。
 

阅读扩展

源于对掌握的Android开发基础点进行整理,罗列下已经总结的文章,从中可以看到技术积累的过程。

ProGuard代码混淆技术详解的更多相关文章

  1. Android ProGuard代码混淆技术详解

    前言     受<APP研发录>启发,里面讲到一名Android程序员,在工作一段时间后,会感觉到迷茫,想进阶的话接下去是看Android系统源码呢,还是每天继续做应用,毕竟每天都是画UI ...

  2. CDN学习笔记二(技术详解)

    一本好的入门书是带你进入陌生领域的明灯,<CDN技术详解>绝对是带你进入CDN行业的那盏最亮的明灯.因此,虽然只是纯粹的重点抄录,我也要把<CDN技术详解>的精华放上网.公诸同 ...

  3. CDN技术详解及实现原理

    CDN技术详解 一本好的入门书是带你进入陌生领域的明灯,<CDN技术详解>绝对是带你进入CDN行业的那盏最亮的明灯.因此,虽然只是纯粹的重点抄录,我也要把<CDN技术详解>的精 ...

  4. 腾讯技术分享:GIF动图技术详解及手机QQ动态表情压缩技术实践

    本文来自腾讯前端开发工程师“ wendygogogo”的技术分享,作者自评:“在Web前端摸爬滚打的码农一枚,对技术充满热情的菜鸟,致力为手Q的建设添砖加瓦.” 1.GIF格式的历史 GIF ( Gr ...

  5. 单元测试系列之四:Sonar平台中项目主要指标以及代码坏味道详解

    更多原创测试技术文章同步更新到微信公众号 :三国测,敬请扫码关注个人的微信号,感谢! 原文链接:http://www.cnblogs.com/zishi/p/6766994.html 众所周知Sona ...

  6. IPv6技术详解:基本概念、应用现状、技术实践(下篇)

    本文来自微信技术架构部的原创技术分享. 1.前言 在上篇<IPv6技术详解:基本概念.应用现状.技术实践(上篇)>,我们讲解了IPV6的基本概念. 本篇将继续从以下方面展开对IPV6的讲解 ...

  7. IPv6技术详解:基本概念、应用现状、技术实践(上篇)

    本文来自微信技术架构部的原创技术分享. 1.前言 普及IPV6喊了多少年了,连苹果的APP上架App Store也早已强制IPV6的支持,然并卵,因为历史遗留问题,即使在IPV4地址如果饥荒的情况下, ...

  8. Java基础-反射(reflect)技术详解

    Java基础-反射(reflect)技术详解 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.类加载器 1>.JVM 类加载机制  如下图所示,JVM类加载机制分为五个部分 ...

  9. 架构设计:远程调用服务架构设计及zookeeper技术详解(下篇)

    一.下篇开头的废话 终于开写下篇了,这也是我写远程调用框架的第三篇文章,前两篇都被博客园作为[编辑推荐]的文章,很兴奋哦,嘿嘿~~~~,本人是个很臭美的人,一定得要截图为证: 今天是2014年的第一天 ...

随机推荐

  1. ng2-timesheet, 一个timesheet.js的angular2复制版

    一个 timesheet.js (JavaScript library for HTML5 & CSS3 time sheets) 的 Angular 2 复制版 用法: npm instal ...

  2. mongoDB研究笔记:分片集群的工作机制

    上面的(http://www.cnblogs.com/guoyuanwei/p/3565088.html)介绍了部署了一个默认的分片集群,对mongoDB的分片集群有了大概的认识,到目前为止我们还没有 ...

  3. Blend 2015 教程 (二) 样式

    前一篇讲述了如何在新Blend中完成一个简单的带数据绑定的界面小例子,本篇将讲述一下,把View层和Style层分开,并搭建Style层框架的方法,并进行细节样式修改. 1. 在解决方案资源管理器面板 ...

  4. nginx(2、反向代理)

    反向代理是nginx最重要的特性之一,与正向代理相反,它代理的不是客户端,而是目标源,即我代理目标源满足客户端给出的请求. 在nginx中反向代理的简单配置如下: server { listen 80 ...

  5. js中各种跨域问题实战小结(一)

    什么是跨域?为什么要实现跨域呢? 这是因为JavaScript出于安全方面的考虑,不允许跨域调用其他页面的对象.也就是说只能访问同一个域中的资源.我觉得这就有必要了解下javascript中的同源策略 ...

  6. [nRF51822] 6、基于nRF51822平台的flash读写研究

    前言 本文重点介绍flash的数据存取特性.flash的内存划分.一个简单的存取图片的内存管理方式,以及对flash写前删的时间.删后读的时间.写后读的时间进行测量的一个小实验.目的在于更全面了解fl ...

  7. 为 Exchange 服务器编写自定义的反垃圾插件

    Exchange 2010 的 Edge Transport 包含了一些 Anti-spam 的 Feature,如图: 都开启了,但是呢,还是会有漏网之鱼,而且把这些邮件自己列为 Junk 也起不了 ...

  8. DDD~我们应该知道的Model,DomainModel和ViewModel

      回到目录 图在前 目前项目中可能出现的三种Model模式,对于我们现在开发的一个项目,我觉得使用DDD的思想来设计模型比较清晰,使用DDD的思想把模型model分成了如下三种: 下面是我微博中的截 ...

  9. WebApi系列~开放的CORS,跨域资源访问对所有人开放

    回到目录 之前有客户问我,如何AJAX跨域post,这个问题挺有意思,在我们看来,我是不被允许的,因为它是不安全的,但随着web api的火热,这个东西也被人们一步步的接受了,确实,有时,我们的接口希 ...

  10. 从双十一战报看传统大家电如何O2O转型?

    说到大家电电商,大家都会想起天猫.京东.苏宁易购.国美在线等各大电商平台,他们这一次的双十一又实现了较大规模的增长,而各大电商平台家电辉煌战绩的背后实际上是各大品牌家电的成功. 格力今年双十一当天创下 ...