0 运行环境

  • 本机系统:Windows 10

  • 虚拟机软件:Oracle VM VirtualBox 6

  • 虚拟机系统:Ubuntu 18

1 引言 - 编译过程

我们知道在 CPU 上执行的是低级别的机器语言,从高级语言到低级别的机器语言是要经过 4 个编译过程,以 Linux 下 GCC 编译 C 语言程序的过程为例,

如下图所示:

  1. 预处理:编译器将 C 源代码中的包含的头文件如stdio.h编译进来,替换宏。

    gcc -E hello.c -o hello.i

  2. 编译:GCC 首先要检查代码的规范性、是否有语法错误等,以确定代码的实际要做的工作,在检查无误后,GCC 把代码翻译成汇编语言。

    gcc –S hello.i –o hello.s

  3. 汇编:把编译阶段生成的 ”.s” 文件转成二进制目标代码。

    gcc –c hello.s –o hello.o

  4. 链接:链接到库中,生成可执行文件。

    gcc hello.o –o hello

2 目标文件

目标代码(Object Code):指编译器和汇编器处理源代码后所生成的机器语言目标代码

目标文件(Object File):指包含目标代码的文件

2.1 三种目标文件形式

  1. 可重定位目标文件(.o 文件):包含二进制代码和数据,其形式可以和其他目标文件进行合并,创建一个可执行目标文件

  2. 可执行目标文件(如 vi,gdb):包含二进制代码和数据,可直接被加载器加载执行

  3. 共享目标文件(.so 文件):可被动态的加载和链接

3 ELF 文件

目标文件在不同的系统或平台上具有不同的命名格式。如下所示:

  • DOS 操作系统 :COM 格式,文件中仅包含代码和数据,且被加载到固定位置

– System V UNIX 早期版本:COFF 格式,文件中不仅包含代码和数据,还包含重定位信息、调试信息、符号表等其他信息,由一组严格定义的数据结构序列组成

– Windows:PE 格式(COFF的变种),称为可移植可执行(Portable Executable,简称PE)

– Linux 等类 UNIX:ELF 格式(COFF的变种),称为可执行可链接(Executable and Linkable Format,简称ELF)

ELF 文件即是 Linux 等类 UNIX 上的目标文件

3.1 ELF 文件结构

ELF 文件提供了两种不同的视角,在汇编器和链接器看来,ELF 文件是由 Section Header Table 描述的一系列 Section 的集合,而执行一个 ELF 文件时,在加载器(Loader)看来它是由 Program Header Table 描述的一系列 Segment 的集合。

两种不同的视角对应两种视图,如下所示:

  • 链接视图(被链接):可重定位目标文件

  • 执行视图(被执行):可执行目标文件

常见的 ELF 文件大致结构 如下:

3.1.1 ELF 头部 - ELF Header

ELF 头部(ELF Header):描述整个文件的组织结构。

3.1.2 程序头部表 - Program Header Table

程序头部表(Program Header Table):描述文件中的各种 segments,用来告诉系统如何创建进程映像的。

3.1.3 节区/段区 - Section/segments

节区/段区(Section/segments):segments 是从运行的角度来描述 ELF 文件,sections 是从链接的角度来描述 ELF文件,也就是说,在链接阶段,我们可以忽略 program header table 来处理此文件,在运行阶段可以忽略 section header table 来处理此程序。从图中我们也可以看出,segments 与 sections 是包含的关系,一个s egment 包含若干个 section。

3.1.4 节区头部表 - Section Header Table

节区头部表(Section Header Table):包含了文件各个 section 的属性信息。描述节区的表,每个节区占一个项。

4 查看 ELF 文件内容

4.1 readelf

4.1.1 格式

readelf <option(s)> elf-file(s)

4.1.2 功能

用于显示读取 ELF 文件中信息。它用来显示一个或者多个 elf 格式的目标文件的信息,可以通过它的选项来控制显示哪些信息。

这里的 elf-file(s) 就表示那些被检查的文件。可以支持 32 位,64 位的 elf 格式文件,也支持包含 elf 文件的文档

4.1.3 选项

-a :--all 显示全部信息,等价于 -h -l -S -s -r -d -V -A -I

-h :--file-header 显示elf文件开始的文件头信息. 

-l :--program-headers  ;--segments 显示程序头(段头)信息(如果有的话)。 

-S :--section-headers  ;--sections 显示节头信息(如果有的话)。 

-g :--section-groups 显示节组信息(如果有的话)。

-t :--section-details 显示节的详细信息(-S的)。 

-s :--syms  ;--symbols 显示符号表段中的项(如果有的话)。 

-e :--headers 显示全部头信息,等价于: -h -l -S 

-n :--notes 显示note段(内核注释)的信息。 

-r :--relocs 显示可重定位段的信息。 

-u :--unwind 显示unwind段信息。当前只支持IA64 ELF的unwind段信息。 

-d :--dynamic 显示动态段的信息。 

-V :--version-info 显示版本段的信息。 

-A :--arch-specific 显示CPU构架信息。 

-D :--use-dynamic 使用动态段中的符号表显示符号,而不是使用符号段。 

-x <number or name> :--hex-dump=<number or name> 以16进制方式显示指定段内内容。number指定段表中段的索引,或字符串指定文件中的段名。 

-w[liaprmfFsoR]或者

-debugdump[=line,=info,=abbrev,=pubnames,=aranges,
=macro,=frames,=frames-interp,=str,=loc,=Ranges] 显示调试段中指定的内容。 -I :--histogram 显示符号的时候,显示bucket list长度的柱状图。 -v :--version 显示readelf的版本信息。 -H :--help 显示readelf所支持的命令行选项。 -W :--wide 宽行输出。

4.2 objdump

https://man.linuxde.net/objdump

5 Shell 筛选符合条件的 ELF 文件 代码

#! /bin/bash

#	功能:检测当前目录下的所有 ELF 文件中是否有敏感字, 将符合条件的 ELF 文件路径存入 result(nm,cat,readelf,objdump)
# 前置条件:
# 当前目录下的 sensitive.txt : 敏感字字典
# 输出:
# ELF : 当前目录下所有 ELF 文件的路径
# result : 含有敏感字的 ELF 文件路径 # 筛选当前目录下所有 ELF 文件,并将文件路径存入 ELF
function findELF
{
now_dir=$(cd $(dirname $0) && pwd) find $now_dir -type f -exec file {} \; | grep "\<ELF\>" | awk -F ':' '{print $1 }' > ELF
} # 通过 cat 查找敏感字,将符合条件的 ELF 文件路径存入 result
function findSensitiveBy_cat
{
cat $1 | while read fileNameLine
do
cat sensitive.txt | while read sensitiveLine
do
if cat $fileNameLine | grep $sensitiveLine
then
printf "cat match sensitivefileName is %s\n" $fileNameLine >> sensitiveResult
#$fileNameLine >> result
fi
done
done
} # 通过 nm 查找敏感字,将符合条件的 ELF 文件路径存入 result
function findSensitiveBy_nm
{
cat $1 | while read fileNameLine
do
cat sensitive.txt | while read sensitiveLine
do
if nm $fileNameLine | grep $sensitiveLine
then printf "nm match sensitivefileName is %s\n" $fileNameLine >> sensitiveResult
# 错误代码 此处会打印出匹配到的字符串 为什么?
#$fileNameLine >> result
fi
done
done
} # 通过 readelf 查找敏感字,将符合条件的 ELF 文件路径存入 result
function findSensitiveBy_readelf
{
cat $1 | while read fileNameLine
do
cat sensitive.txt | while read sensitiveLine
do
if readelf -a $fileNameLine | grep $sensitiveLine
then
printf "readelf match sensitivefileName is %s\n" $fileNameLine >> sensitiveResult
#$fileNameLine > result
fi
done
done
} # 通过 objdump 查找敏感字,将符合条件的 ELF 文件路径存入 result
function findSensitiveBy_objdump
{
cat $1 | while read fileNameLine
do
cat sensitive.txt | while read sensitiveLine
do
if objdump -D $fileNameLine | grep $sensitiveLine
then
printf "objdump match sensitivefileName is %s\n" $fileNameLine >> sensitiveResult
#$fileNameLine > result
fi
done
done
} findELF findSensitiveBy_cat ELF
findSensitiveBy_nm ELF
findSensitiveBy_readelf ELF
findSensitiveBy_objdump ELF

Shell 筛选符合条件的 ELF 文件的更多相关文章

  1. 如何从List<T>中筛选符合条件的数据的集合或个数

    方法一:Linq ChannelList就是一个List类型的数据,IsOpen 是其元素的属性 channelCount = (from channel in DevicesManager.Inst ...

  2. linux查找符合条件的文件并删除

    找到根目录下所有的以test开头的文件并把查找结果当做参数传给rm -rf命令进行删除: 1.find / -name “test*” |xargs rm -rf 2.find / -name “te ...

  3. java删除目录下符合条件的文件

    自己做的一个小程序,目的是:删除某个目录下所有的文件大小为0的文件.同理其他的条件也可以,只需修改delFile()方法中的判断条件即可. 下面是代码,有需要的同学可以参考下,如有错误请指出,不胜感激 ...

  4. Shell面试题8:筛选符合长度的单词案例

    企业Shell面试题8:筛选符合长度的单词案例 利用bash for循环打印下面这句话中字母数不大于6的单词(某企业面试真题). I am oldboy teacher welcome to oldb ...

  5. 批量屏蔽符合条件的IP地址,支持添加白名单,IP段,增量,大于指定次数的IP

    批量屏蔽符合条件的IP地址,支持添加白名单,IP段,增量 大概的思路是利用sh,从日志中提取出来对应的IP地址,然后再交由python进行对比,判断,最终将需要添加至iptables列表中的IP写入到 ...

  6. Shell脚本——make命令和Makefile文件【转】

    https://blog.csdn.net/twc829/article/details/72729799 make命令是一个常用的编译命令,尤其在C/C++开发中,make命令通过makefile文 ...

  7. ARM 之一 ELF文件、镜像(Image)文件、可执行文件、对象文件 详解

    [转]https://blog.csdn.net/ZCShouCSDN/article/details/100048461 ELF 文件规范   ELF(Executable and Linking ...

  8. 【DSP开发】DSP COFF 与 ELF文件

    本文介绍了C6000最新的v7.2或者之后的编译器如何支持ELF(EABI)和COFF-ABI格式,首先由ARM引入嵌入式(Embedded) EABI的介绍,之后比较了COFF-ABI和EABI的区 ...

  9. Shell脚本的条件控制和循环语句

    条件判断:if语句 语法格式: if [ expression ] then Statement(s) to be executed if expression is true fi 注意:expre ...

随机推荐

  1. 成理信安协会反序列化01-利用fastcoll实现md5碰撞

    虽然是反序列化的题目,但主要考点在利用fastcoll实现md5碰撞. 直接上源码 <?php show_source(__FILE__); class CDUTSEC { public $va ...

  2. Android开发还不会这些?如何面试拿高薪!

    我所接触的Android开发者,百分之九十五以上 都遇到了以下几点致命弱点! 如果这些问题也是阻止你升职加薪,跳槽大厂的阻碍. 那么我确信可以帮你突破瓶颈! 群内有许多来自一线的技术大牛,也有在小厂或 ...

  3. Flask之WTF

    Flask-WTF是什么? 是一个关于表单的扩展库,可以自动生成表单的HTML代码和验证提交的表单数据,并且提供跨站请求伪造(Cross-Site Request Forgery)保护的功能,使用非常 ...

  4. C语法-函数不定长参数

    目录 前言 语法 va_list va_start va_arg va_end 前言 基于头文件 stdarg.h 基于 STM32 基于 C 如果读者对指针和堆栈的知识点比较熟悉,本笔记就一眼飘过, ...

  5. DFS深度优先搜索算法

    Lake Counting(POJ No.2386) 有一个大小为N*M的园子,雨后积起了水.八连通的积水被认为是在一起的.请求出园子里共有多少个水洼?(八连通是指下图中相对w的*部分) * * * ...

  6. kafka+zookeeper快速启动

    vim zookeeper.sh   #!/bin/bash /usr/local/zookeeper/bin/zkServer.sh restart /usr/local/zookeeper/con ...

  7. 一文读懂Redis常见对象类型的底层数据结构

    Redis是一个基于内存中的数据结构存储系统,可以用作数据库.缓存和消息中间件.Redis支持五种常见对象类型:字符串(String).哈希(Hash).列表(List).集合(Set)以及有序集合( ...

  8. Spring源码解析之基础应用(三)

    组合Java配置 在XML中,我们可以使用<import/>标签,在一个XML文件中引入另一个XML文件,在Java类中,我们同样可以在一个配置类中用@Import引入另一个配置类,被引入 ...

  9. DateDiff() 方法语法 T-SQL语法

    表达式DateDiff(timeinterval,date1,date2 [, firstdayofweek [, firstweekofyear]]) 允许数据类型: timeinterval 表示 ...

  10. sql ROW_NUMBER() 排序函数

    1.使用row_number()函数进行编号:如 1 select email,customerID, ROW_NUMBER() over(order by psd) as rows from QT_ ...