1.DexHeader结构体占用0x70字节,源码位置 dalvik\libdex\DexFile.h文件中269/*

270 * Direct-mapped "header_item" struct.

271 */

272struct DexHeader {

273    u1  magic[8];           /* dex版本标示 */

274    u4  checksum;           /* adler32检验 */

275    u1  signature[kSHA1DigestLen]; /* SHA-1哈希值 */

276    u4  fileSize;           /* 整个文件的大小 */

277    u4  headerSize;         /* DexHeader结构大小 */

278    u4  endianTag;        /* 字节序标记 */

279    u4  linkSize;         /* 链接段大小 */

280    u4  linkOff;          /* 链接段偏移 */

281    u4  mapOff;            /* DexMapList文件偏移 */

282    u4  stringIdsSize;    /* DexStringId的个数 */

283    u4  stringIdsOff;     /* DesStringId的文件偏移 */

284    u4  typeIdsSize;      /* DexTypeId的个数 */

285    u4  typeIdsOff;               /* DexTypeId的文件偏移 */

286    u4  protoIdsSize;     /* DexProtoId的个数 */

287    u4  protoIdsOff;      /* DexProtoId的文件偏移 */

288    u4  fieldIdsSize;     /* DexFileldId的个数 */

289    u4  fieldIdsOff;      /* DexFileldId的文件偏移 */

290    u4  methodIdsSize;    /* DexMethodId的个数 */

291    u4  methodIdsOff;     /* DexMethodId的文件偏移 */

292    u4  classDefsSize;    /* DexClassDefs的个数 */

293    u4  classDefsOff;     /* DexClassDefs的文件偏移 */

294    u4  dataSize;         /* 数据段大小 */

295    u4  dataOff;          /* 数据段的文件偏移 */

296};

补充:

magic:目前固定值dex035 “64 65 78 0A 30 33 35 00”

checksum:dex文件校验和,判断dex文件的完整性和是否被修改

signature:识别最佳化之前的dex文件

fileSize:整个dex文件大小

headerSize:DexHeader结构体本身的大小,目前固定为0x70

endianTag:指定dex运行环境的CPU字节序,预设值ENDIAN_CONSTANT 0x12345678 默认采用Little-Endian字节序列

linkSize和linkOff:指定链接段的大小与文件偏移,大部分情况下默认值0

 
将实例文件Hello.dex使用010editor打开

查看源码
255struct DexMapList {
256    u4  size;               /* DexMapItem的个数 */
257    DexMapItem list[1];     /* DexMapItem结构 */
258};
 
根据mapOff指向DexMapList的数据结构:
245struct DexMapItem {
246    u2 type;              /* kDexType开头类型 */
247    u2 unused;           /* 未使用,用于字节对齐 */
248    u4 size;              /* 指定类型的个数 */
249    u4 offset;            /* 指定类型数据的文件偏移,起始位置 */
250};

跳转到DexMapList结构

在DexHeader部分

 
2.分析StringIdItem结构体中的字段
源码:
263struct DexStringId {
264    u4 stringDataOff;      /* 字符串数据偏移 */
265};
通过stringDataOff找到stringdata字符串的保存位置

Data区存放的字符串并非是ASCII字符串而是由MUTF-8编码表示的Modified UTF-8

特点:

1. MUTF-8使用1~3字节编码长度

2. 大于16位的Unicode编码U+10000~U+10ffff使用3字节编码

3. U+0000采用2字节编码

4. 以null作为字符串结尾

分析DexTypeIds结构体:

地址跳转Ctril+G B0

DexTypeId对应DexHeader中的typeIdsSzie与typeIdsOff
270struct DexTypeId {
271    u4  descriptorIdx;      /* 指向DexStringId列表索引 */
272};
 
3.分析DexTypeProtoIdItem

295struct DexProtoId {
296    u4  shortyIdx;          /* 指向DexStringId列表的索引 */
297    u4  returnTypeIdx;      /* 指向DexTypeId列表的索引 */
298    u4  parametersOff;      /* 指向DexTypeList的偏移 */
299};
补充:
shortyIdx是方法声明字符串
returnTypeIdx是方法返回类型字符串

DexTypeList存放了方法的参数列表

4.DexTypeList的偏移地址

DexTypeList结构声明:325struct DexTypeList {

326    u4  size;               /* DexTypeItem的个数 */
327    DexTypeItem list[1];    /* DexTypeItem结构 */
328};
 
318struct DexTypeItem {
319    u2  typeIdx;            /* 指向DexTypeId列表的索引 */
320};
方法声明由返回类型和参数列表组成,并且返回类型位于参数列表的前面
 
5.分析TypeFieldIdItem

根据偏移

277struct DexFieldId {
278    u2  classIdx;         /* 类的声明,指向DexTypeId列表索引 */
279    u2  typeIdx;          /* 声明类型,指向DexProtoId列表索引 */
280    u4  nameIdx;          /* 方法名,指向DexStringId列表索引 */
281};
DexFieldId结构中的数据全部是索引值,指明字段所在的类,字段的类型,字段名
 
6.分析DexTypeMethodIdItem

根据偏移

286struct DexMethodId {
287    u2  classIdx;         /* 类的声明,指向DexTypeId列表索引 */
288    u2  protoIdx;         /* 声明类型,指向DexProtoId列表索引 */
289    u4  nameIdx;          /* 方法名,指向DexStringId列表索引 */
290};
 
7.分析TypeClassDefItem

根据偏移

304struct DexClassDef {
305    u4  classIdx;         /*类的类型,指向DexTypeId列表的索引 */
306    u4  accessFlags;      /* 访问标示,以ACC_开头的一个枚举值*/
307    u4  superclassIdx;    /* 父类类型,指向DexTypeId列表的索引 */
308    u4  interfacesOff;    /* 接口,指向DexTypeList的偏移 */
309    u4  sourceFileIdx; /*源文件名,指向DexStringId列表的索引结构*/
310    u4  annotationsOff;   /* 注解,指向DexAnnotationDirectoryItem结构*/
311    u4  classDataOff;     /* 指向DexClassData结构的偏移 */
312    u4  staticValuesOff;  /* 指向DexEncodedArray结构的偏移 */
313};
根据classDataOff偏移

classDataOff指向的DexClassData结构声明 在DexClass.h文件中
51struct DexClassData {
52    DexClassDataHeader header; /* 指定字段与方法的个数 */
53    DexField*          staticFields; /* 静态字段,DexField结构 */
54    DexField*          instanceFields; /* 实例字段,DexField结构 */
55    DexMethod*         directMethods; /* 直接方法,DexMethod结构 */
56    DexMethod*         virtualMethods; /* 虚方法,DexMethond结构 */
57};

根据DexClassData分析DexClassDataHeader结构
28struct DexClassDataHeader {
29    u4 staticFieldsSize; /* 静态字段个数 */
30    u4 instanceFieldsSize; /* 实例字段个数 */
31    u4 directMethodsSize; /* 直接方法 */
32    u4 virtualMethodsSize; /* 虚方法 */
33};
DexField结构描述了字段的类型与访问标志
36struct DexField {
37    u4 fieldIdx;    /* 指向DexFieldId的索引 */
38    u4 accessFlags; /* 访问标志 */
39};
DexMethod描述方法的原型,名称,访问标志和代码数据块
42struct DexMethod {
43    u4 methodIdx;    /* 指向DexMethodId的索引 */
44    u4 accessFlags; /* 访问标志 */
45    u4 codeOff;      /* 指向DexCode结构的偏移 */
46};
 
根据codeOff偏移定位

DexCode在DexFile.h文件中
337struct DexCode {
338    u2  registersSize; /* 使用寄存器的数量 */
339    u2  insSize; /* 参数的个数 */
340    u2  outsSize; /* 调用其它方法时使用的寄存器个数 */
341    u2  triesSize; /* Try/Catch个数 */
342    u4  debugInfoOff;  /* 指向调试信息的偏移 */
343    u4  insnsSize;    /* 指令集个数,以2字节为单位 */
344    u2  insns[1]; /* 指令集 */
345    /* 2字节空间用于结构对齐 */
346    /* try_item[triesSize] DexTry结构 */
347    /* Try/Catch中handler的个数 */
348    /* catch_handler_item[handlersSize],DexCatchHandler结构 */
349};
 
至此Dex文件分析完毕
附录StringId表,DexTypeld表,DexProtoId表

DexStringId结构体

DexTypeId列表

DexProtoId列表

 
 

5.1 dex文件解析的更多相关文章

  1. DEX文件解析---1、dex文件头解析

    DEX文件解析---1.dex文件头解析 一.dex文件     dex文件是Android平台上可执行文件的一种文件类型.它的文件格式可以下面这张图概括:     dex文件头一般固定为0x70个字 ...

  2. class文件与dex文件解析

    关于Android的热修复与插件化技术在如今基本上已经成为了“时髦技术”的标配了,或者说用来进行“炫技”的一种方式,毕境如今Android已经发展得非常之成熟了,基本上APP用的到东东都差不多,除了业 ...

  3. DEX文件解析--7、类及其类数据解析(完结篇)

    一.前言    前置技能链接:       DEX文件解析---1.dex文件头解析       DEX文件解析---2.Dex文件checksum(校验和)解析       DEX文件解析--3.d ...

  4. DEX文件解析--3、dex文件字符串解析

    一.前言    前两篇文章链接:     1.DEX文件头解析     2.DEX文件校验和解析    PS:前几天检查文件夹的时候发现DEX文件解析还只写了开头,正好找点事情来做,就去接着解析DEX ...

  5. DEX文件解析--4、dex类的类型解析

    一.前言   前几篇系列文章链接:     DEX文件解析---1.dex文件头解析     DEX文件解析---2.Dex文件checksum(校验和)解析     DEX文件解析--3.dex文件 ...

  6. DEX文件解析--5、dex方法原型解析

    一.前言    前几篇文章链接:     DEX文件解析---1.dex文件头解析     DEX文件解析---2.Dex文件checksum(校验和)解析     DEX文件解析--3.dex文件字 ...

  7. DEX文件解析--6、dex文件字段和方法定义解析

    一.前言    前几篇文章链接:       DEX文件解析---1.dex文件头解析       DEX文件解析---2.Dex文件checksum(校验和)解析       DEX文件解析--3. ...

  8. DEX文件解析---2、Dex文件checksum(校验和)解析

    一.checksum介绍     checksum(校验和)是DEX位于文件头部的一个信息,用来判断DEX文件是否损坏或者被篡改,它位于头部的0x08偏移地址处,占用4个字节,采用小端序存储.     ...

  9. Android Dex文件格式解析

    Dex文件是Android虚拟机下的可执行文件,包含了应用程序所用到所有操作指令和运行时数据.在程序编译过程中,java源文件先被编译成class文件,然后通过dx工具将多个class文件整合为一个d ...

随机推荐

  1. java 构造方法+this+super

     构造方法的格式: 修饰符 构造方法名(参数列表) { }  构造方法的体现: 构造方法没有返回值类型.也不需要写返回值.因为它是为构建对象的,对象创建完,方法就执行结束. 构造方法名称必须和类名保持 ...

  2. django -- 实现ORM登录

    前戏 上篇文章写了一个简单的登录页面,那我们可不可以实现一个简单的登录功能呢?如果登录成功,给返回一个页面,失败给出错误的提示呢? 在之前学HTML的时候,我们知道,网页在往服务器提交数据的时候,都是 ...

  3. TCP/IP协议总结

    TCP/IP网络协议栈分为四层, 从下至上依次是: 链路层 其实在链路层下面还有物理层, 指的是电信号的传输方式, 比如常见的双绞线网线, 光纤, 以及早期的同轴电缆等, 物理层的设计决定了电信号传输 ...

  4. python3 mqtt 客户端以及服务端

    pip3 install paho-mqtt client #!/usr/bin/env python #coding=utf- import json import sys import os im ...

  5. 第08组 Beta冲刺(4/5)

    队名:955 组长博客:点这里! 作业博客:点这里! 组员情况 组员1(组长):庄锡荣 过去两天完成了哪些任务 文字/口头描述 ? 测试新功能中 展示GitHub当日代码/文档签入记录 接下来的计划 ...

  6. nginx1.16+php7.39配置笔记

    vim /etc/nginx/conf.d/default.conf 修改php相关配置如下: location ~ \.php$ {        root           /usr/share ...

  7. 使用CSS隐藏元素滚动条

    如何隐藏滚动条,同时仍然可以在任何元素上滚动? 首先,如果需要隐藏滚动条并在内容溢出时显示滚动条,只需要设置overflow:auto样式即可.想要完全隐藏滚动条只需设置overflow:hidden ...

  8. Nginx通过geo模式实现限速白名单和全局负载均衡 - 运维笔记

    Nginx的geo模块不仅可以有限速白名单的作用,还可以做全局负载均衡,可以要根据客户端ip访问到不同的server.比如,可以将电信的用户访问定向到电信服务器,网通的用户重 定向到网通服务器”,从而 ...

  9. Docker 常用命令速查手册

    记录一下docker的日常使用命令,本文主要针对linux + mac操作系统而言,window是否适用不太确定,谨慎使用 1. docker进程 docker进程启动.停止.重启,常见的三种case ...

  10. C/C++ 指针常量和常量指针

    为了区分是指向常量的指针还是const指针(表示指针本身是常量) 一个简便方法:从由往左读,遇到p就替换为“p is a”,遇到*就替换为“point to”,其余不变. const int * p ...