Android中jsoup的混淆规则
版权声明:转载必须注明本文转自严振杰的博客:http://blog.yanzhenjie.com

说实话这篇文章的标题和内容我觉得很水,所以读者们要是也觉得这篇文章很水的话,你顺着网线来打我啊。哈哈,不开个玩笑这文章都没法继续往下写了。

这段时间每天工作到22点下班回家,到家后基本就23点了,周六周日也是一样的,所以Github上的项目有严重bug会在中午休息的时候抽时间修复,博客基本处于断更状态。不过庆幸的是昨晚已经把项目写完了,安排周一上线,今儿个是周日,终于可以休息了,也顺便把昨晚发现的一个关于jsoup的问题记录一下。

发现问题
项目中使用了jsoup来分析html文档,一切都很顺利,但是在代码混淆后在某些手机上却发生了异常导致App崩溃。于是赶紧搜索了jsoup的混淆规则,发现千篇一律的规则是:

-dontwarn org.jsoup.**
-keep class org.jsoup.**{*;}
1
2
这样的混淆规则不用试就知道肯定是可以解决问题的,但是把相当于把部分代码暴露了出去,于是我抓了下崩溃日志,最主要的地方如下:

Caused by: java.lang.ExceptionInInitializerError
at org.a.c.f$a.<init>(SourceFile:372)
at org.a.c.f.<init>(SourceFile:19)
at org.a.d.m.b(SourceFile:32)
at org.a.d.m.a(SourceFile:42)
at org.a.d.b.a(SourceFile:56)
at org.a.d.g.ay(SourceFile:100)
at org.a.a.hm(SourceFile:58)

Caused by: java.lang.IllegalStateException:
Could not read resource entities-xhtml.properties.
Make sure you copy resources for org.a.c.i
at org.a.c.i.a(SourceFile:301)
at org.a.c.i.b(SourceFile:25)
at org.a.c.i$b.<init>(SourceFile:53)
at org.a.c.i$b.<clinit>(SourceFile:34)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
通过下面这句话可以判断是jsoup抛出的异常没跑了:

Caused by: java.lang.ExceptionInInitializerError
at org.a.c.f$a.<init>(SourceFile:372)
1
2
然后目光迅速被吸引到这句话:

Could not read resource entities-xhtml.properties
1
哦这下明白了,原来是某个类中读取了entities-xhtml.properties资源文件,混淆之后读不出来了。凭经验来分析一下,假如有一个类叫A,那么java中读取资源文件我们一般是:

A.class.getResourceAsStream("fileName");
1
而class.getResourceAsStream(String)会指定要加载的资源路径与当前类所在包的路径一致。例如我们写了一个A类在包com.yanzhenjie.test下,那么A.class.getResourceAsStream("fileName") 会在com.yanzhenjie.test包下查找相应的资源。如果这个fileName是以/开头的,那么就会从classpath的根路径下开始查找。

注:此资源非彼资源文件,只涉猎Android开发的同学不要把这个资源文件和Android中/res下的资源文件混淆,不是同一个东西。

所以现在问题基本上已经浮出水面了,做了代码混淆之后,由于规则外的class文件和路径全部被混淆,而资源文件的路径不会被混淆,打包成apk后,class文件在apk/classes.dex中,classes.dex反编译成jar文件,jar文件再解压后class文件的路径会变成a.b.c.className,而资源文件在/apk/packageName下,它们的路径因为没有混淆还是com.yanzhenjie.test.fileName。因此class文件的路径是a.b.c.className,而资源文件的路径是com.yanzhenjie.test.fileName所以class.getResourceAsStream(String)会加载不到资源文件,剩下的就是看源码找出资源文件和class所在包并添加混淆规则了。

java包图:

根据上面的异常信息和包中的资源文件entities-xxx.properties判断下,大概加载资源文件的代码应该在Entities.class中吧,于是我们打开Entities.class文件,果然发现了报异常的代码:

再往下翻一点就可以看到一个枚举类,我们知道枚举相当于是常量。所以下图中类Entities被load的时候枚举EscapeMode的几个成员值就要初始化了,初始化即走自己的构造方法,在构造方法中又调用了上图中加载资源文件的代码:

因为我们发现问题是我们混淆了Entities.class所在包名导致的异常,所以我们只要保证这个包名不被混淆即可。

解决方案
最开始说的比较通用的混淆规则肯定是可以解决问题的:

-dontwarn org.jsoup.**
-keep class org.jsoup.**{*;}
1
2
但是这相当于没有混淆jsoup了,这里我们可以维持包名不混淆即可解决问题,我们只需要为jsoup添加如下混淆规则即可:

-keeppackagenames org.jsoup.nodes
1
我这样写可以解决我遇到的这个问题,如果其它人还遇到其它问题,可以在博客下方留言,我会给出解决方案。本文结束,一边带孩子一边写博客,写完了专心哄孩子去了,白白。
————————————————
版权声明:本文为CSDN博主「严振杰」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/yanzhenjie1003/article/details/78384725

Android中jsoup的混淆规则【转】的更多相关文章

  1. Android中使用proguardgui混淆jar包

    本文章的前提条件是,读者已经掌握了正确导出jar包的技能. 1.拷贝Android项目中"proguard.cfg"文件到你指定的位置,并改名为"proguard.pro ...

  2. Android中使用progurad混淆代码

    第一步,取消project.properties中关于progurad的注释,开启progurad,默认的配置文件会被加载进来. proguard.config=${sdk.dir}/tools/pr ...

  3. Android 代码混淆规则

    1. Proguard介绍 Android SDK自带了混淆工具Proguard.它位于SDK根目录toolsproguard下面.ProGuard是一个免费的Java类文件收缩,优化,混淆和预校验器 ...

  4. android中SELINUX规则分析和语法简介【转】

    本文转载自:https://blog.csdn.net/LoongEmbedded/article/details/62430039 1. SELINUX是可以理解为一种Android上面的安全机制, ...

  5. android中SELINUX规则分析和语法简介

    1. SELINUX是可以理解为一种android上面的安全机制,是有美国国家安全局和一些公司设计的一个针对linux的安全加强系统我们可以通过配置SELINUX的相关policy,来定制自己的手机的 ...

  6. Android中利用jsoup解析html页面

    学习jsoup :jsoup学习网站 Android 中使用: 添加依赖 implementation 'org.jsoup:jsoup:1.10.1' 直接上代码: package com.load ...

  7. Android Studio实现代码混淆

     1,在build.grandle添加,其中规则写在proguard-rules.pro中,也可以自定义一个文件,将其代替,比如eclipse常用的 proguard-project.txt: bui ...

  8. [转]Android Studio实现代码混淆

     1,在build.grandle添加,其中规则写在proguard-rules.pro中,也可以自定义一个文件,将其代替,比如eclipse常用的 proguard-project.txt: bui ...

  9. Android studio打包APK混淆配置

    要在打包APK时加入混淆需要在Module中的buid.gradle中加入如下信息 buildTypes { release { minifyEnabled true shrinkResources ...

随机推荐

  1. 2019-2020-1 20199301《Linux内核原理与分析》第五周作业

    第四章·系统调用的三层机制(上) 本章的重点在于用户态程序如何触发系统调用? 一.用户.内核.中断 IntelX86有四种不同的执行级别.Linux操作系统中只采用了其中的0和3两个特权级别,分别对应 ...

  2. js计算两个时间差

    时间格式 time:'2018-04-26 15:49:00'需要转换为time:'2018/04/26 15:49:00' 使用time.replace(/\-/g, "/") ...

  3. .net框架-队列(Queue)

    队列(Queue) 队列代表一个先进先出的集合 队列元素为Object类型 .net框架提供Queue<T>泛型队列类 入队(Enqueue)和出队(Dequeue)是对列的基本操作,入队 ...

  4. 序列:SEQUENCE

    一.序列介绍 Oracle的序列是一种数据库对象,主要作用是用来产生唯一值.序列被创建以后可以通过数据字典找到序列对象,因此序列可以被多个对象共享. 二.创建序列 序列使用CREATE SEQUENC ...

  5. python - alipay sdk 使用 及 注意点

    一. 在 点击跳转 这里拿到自己的 appid  和  支付宝公钥 ,    如果想要得到 支付宝的公钥 就需要获取 应用的公钥,具体获取方式 : 获取应用公钥和私钥 a. 应用私钥和支付宝公钥 获取 ...

  6. Zabbix 短信报警示例

    Zabbix 短信报警 示例: 注意zabbix 脚本文件默认放置目录是 alertscripts (zabbix 动作调用脚本目录) # 编辑 zabbix_server.conf # AlertS ...

  7. 数据库应用之--Redis+mysql实现大量数据的读写,以及高并发

    一.开发背景 在项目开发过程中中遇到了以下三个需求: 1. 多个用户同时上传数据: 2. 数据库需要支持同时读写: 3. 1分钟内存储上万条数据: 根据对Mysql的测试情况,遇到以下问题: 1. 最 ...

  8. 洛谷 P1842 奶牛玩杂技 题解

    P1842 奶牛玩杂技 题目背景 Farmer John 养了N(1<=N<=50,000)头牛,她们已经按1~N依次编上了号.FJ所不知道的是,他的所有牛都梦想着从农场逃走,去参加马戏团 ...

  9. UOJ310. 【UNR #2】黎明前的巧克力 [FWT]

    UOJ 思路 显然可以转化一下,变成统计异或起来等于0的集合个数,这样一个集合的贡献是\(2^{|S|}\). 考虑朴素的\(dp_{i,j}\)表示前\(i\)个数凑出了\(j\)的方案数,发现这其 ...

  10. Deepin-TIM或Deepin-QQ调整界面DPI字体大小的方法

    Deepin-TIM或Deepin-QQ调整界面DPI字体大小的方法 env WINEPREFIX="/home/landv/.deepinwine/Deepin-QQ" deep ...