linux下强大的文件分析工具 -- nm

什么是nm

nm命令是linux下自带的特定文件分析工具，一般用来检查分析二进制文件、库文件、可执行文件中的符号表，返回二进制文件中各段的信息。

目标文件、库文件、可执行文件

首先，提到这三种文件，我们不得不提的就是gcc的编译流程：预编译，编译，汇编，链接。

目标文件 :常说的目标文件是我们的程序文件(.c/.cpp,.h)经过预编译，编译，汇编过程生成的二进制文件,不经过链接过程，编译生成指令为：

gcc(g++) -c file.c(file.cpp)

将生成对应的file.o文件,file.o即为二进制文件
库文件：分为静态库和动态库，这里不做过多介绍，库文件是由多个二进制文件打包而成，生成的.a文件，示例：

ar -rsc liba.a test1.o test2.o test3.o

将test1.o test2.o test3.o三个文件打包成liba.a库文件
可执行文件：可执行文件是由多个二进制文件或者库文件(由上所得，库文件其实是二进制文件的集合)经过链接过程生成的一个可执行文件，对应windows下的.exe文件，可执行文件中有且仅有一个main()函数(用户程序入口，一般由bootloader指定，当然也可以改)，一般情况下，二进制文件和库文件中是不包含main()函数的，但是在linux下用户有绝对的自由，做一个包含main函数的库文件也是可以使用的,但这不属于常规操作，不作讨论。

上述三种文件的格式都是二进制文件。

为什么要用到nm

在上述提到的三种文件中，用编辑器是无法查看其内容的(乱码)，所以当我们有这个需求(例如debug，查看内存分布的时候)去查看一个二进制文件里包含了哪些内容时，这时候就将用到一些特殊工具，linux下的nm命令就可以完全胜任(同时还有objdump和readelf工具，这里暂不作讨论)。

怎么使用nm

如果你对linux下的各种概念还算了解的话，就该知道一般linux下的命令都会自带一些命令参数来满足各种应用需求，了解这些参数的使用是使用命令的开始。

man

那么，如何去了解一个命令呢，最好的方法就是linux下的man命令，linux是一个宝库，而man指令就相当于这个宝库的说明书。

用法：

man nm

这里面介绍了nm的各种参数以及详细用法，如果你有比较不错的英文水平和理解能力，可以直接参考man page中的内容。

nm的常用命令参数

-A 或-o或 --print-file-name：打印出每个符号属于的文件

-a或--debug-syms：打印出所有符号，包括debug符号

-B：BSD码显示

-C或--demangle[=style]：对低级符号名称进行解码，C++文件需要添加

--no-demangle：不对低级符号名称进行解码，默认参数

-D 或--dynamic：显示动态符号而不显示普通符号，一般用于动态库

-f format或--format=format：显示的形式，默认为bsd，可选为sysv和posix

-g或--extern-only：仅显示外部符号

-h或--help：国际惯例，显示命令的帮助信息

-n或-v或--numeric-sort：显示的符号以地址排序，而不是名称排序

-p或--no-sort：不对显示内容进行排序

-P或--portability：使用POSIX.2标准

-V或--version：国际管理，查看版本

--defined-only：仅显示定义的符号，这个从英文翻译过来可能会有偏差，故贴上原文：

Display only defined symbols for each object file

好了，上述就是常用的命令参数，光说不练假把式，下面将给出一个示例来进一步理解nm用法：

示例代码：

```

#include

#include

using namespace std;

const char *str="downey";

int g_uninit;

int g_val=10;

void func1()

{

    int *val=new int;

    static int val_static=1;

    cout<<"downey"<<endl;

}

void func1(char* str)

{

    cout<<str<<endl;

}

```

编译指令：

g++ -c test.cpp

在当前目录下生成test.o目标文件，然后使用nm命令解析：

nm -n -C test.o

由于是C++源文件，故添加-C 选项，为了方便查看，添加-n选项

输出信息：

```

                    U __cxa_atexit

                    U __dso_handle

                    U std::ostream::operator<<(std::ostream& (*)(std::ostream&))

                    U std::ios_base::Init::Init()

                    U std::ios_base::Init::~Init()

                    U operator new(unsigned long)

                    U std::cout

                    U std::basic_ostream<char, std::char_traits<char> >& std::endl<char, std::char_traits<char> >(std::basic_ostream<char, std::char_traits<char> >&)

                    U std::basic_ostream<char, std::char_traits<char> >& std::operator<< <std::char_traits<char> >(std::basic_ostream<char, std::char_traits<char> >&, char const*)

0000000000000000    B g_uninit

0000000000000000    D str

0000000000000000    T func1()

0000000000000004    b std::__ioinit

0000000000000008    D g_val

000000000000000c    d func1()::val_static

0000000000000035    T func1(char*)

0000000000000062    t __static_initialization_and_destruction_0(int, int)

00000000000000a0    t _GLOBAL__sub_I_str

```

下面我们再来解析输出信息中各部分所代表的意思吧

首先，前面那一串数字，指的就是地址
然后，我们发现，每一个条目前面还有一个字母，类似'U','B','D等等，其实这些符号代表的就是当前条目所对应的内存所在部分
最右边的就是对应的符号内容了

首要的需要讲解的就是第二点中字符所对应的含义：

同样在还是在linux命令行下man nm指令可以得到：

A     ：符号的值是绝对值，不会被更改

B或b  ：未被初始化的全局数据，放在.bss段

D或d  ：已经初始化的全局数据

G或g  ：指被初始化的数据，特指small objects

I     ：另一个符号的间接参考

N     ：debugging 符号

p     ：位于堆栈展开部分

R或r  ：属于只读存储区

S或s  ：指为初始化的全局数据，特指small objects

T或t  ：代码段的数据，.test段

U     ：符号未定义

W或w  ：符号为弱符号，当系统有定义符号时，使用定义符号，当系统未定义符号且定义了弱符号时，使用弱符号。

？    ：unknown符号

根据以上的规则，我们就可以来分析上述的nm显示结果：

首先，输出的上半部分对应的符号全是U，跟我们常有思路不一致的是，这里的符号未定义并不代表这个符号是无法解析的，而是用来告诉链接器，这个符号对应的内容在我这个文件只有声明，没有具体实现，如std::cout,std::string类，在链接的过程中，链接器需要到其他的文件中去找到它的实现，如果找不到实现，链接器就会报常见的错误：undefined reference。
在接下来的三行中

0000000000000000 B g_uninit

0000000000000000 D str

0000000000000000 T func1()

令人疑惑的是，为什么他们的地址都是0，难道说mcu的0地址同时可以存三种数据？其实不是这样的，按照上面的符号表规则，g_uninit属于.bss段，str属于全局数据区，而func1()属于代码段，这个地址其实是相对于不同数据区的起始地址，即g_uninit在.bss段中的地址是0，以此类推，而.bss段具体被映射到哪一段地址，这属于平台相关，并不能完全确定。

在目标文件中指定的地址都是逻辑地址，符号真正的地址需要到链接阶段时进行相应的重定位以确定最终的地址。
在接下来的四行中

0000000000000004 b std::__ioinit

0000000000000008 D g_val

000000000000000c d func1()::val_static

0000000000000035 T func1(char*)

b在全局数据段中的4地址，因为上述g_uninit占用了四字节，所以std::__ioinit的地址为0+4=4.

而g_val存在于全局数据段(D)中，起始地址为8，在程序定义中，因为在0地址处存放的是str指针,而我的电脑系统为64位，所以指针长度为8，则g_val的地址为0+8=8

而静态变量val_static则是放在全局数据段8+sizeof(g_val)=12处

函数func1(char*)则放在代码段func1()后面

讲到这里，有些细心的朋友就会疑惑了，在全局数据区(D)中存放了str指针，那str指针指向的字符串放到哪里去了？其实这些字符串内容放在常量区，常量区属于代码区(t)(X86平台，不同平台可能有不同策略)，对应nm显示文件的这一部分：

 00000000000000a0    t _GLOBAL__sub_I_str

如果你对此有一些疑惑，你可以尝试将str字符串放大，甚至是改成上千个字节的字符串，就会看到代码段(t)的变化。

好了，关于linux下nm命令的解析就到此为止啦，如果朋友们对于这个有什么疑问或者发现有文章中有什么错误，欢迎留言

原创博客，转载请注明出处！

祝各位早日实现项目丛中过，bug不沾身.

（完）

linux下nm命令的使用的更多相关文章

怎么查看二进制文件内容？linux下nm命令告诉你！
linux下强大的文件分析工具 -- nm 什么是nm nm命令是linux下自带的特定文件分析工具,一般用来检查分析二进制文件.库文件.可执行文件中的符号表,返回二进制文件中各段的信息. 目标文件. ...
Linux下ps命令详解 Linux下ps命令的详细使用方法
http://www.jb51.net/LINUXjishu/56578.html Linux下的ps命令比较常用 Linux下ps命令详解Linux上进程有5种状态:1. 运行(正在运行或在运行队列 ...
例解 Linux 下 Make 命令
Linux 下 make 命令是系统管理员和程序员用的最频繁的命令之一.管理员用它通过命令行来编译和安装很多开源的工具,程序员用它来管理他们大型复杂的项目编译问题.本文我们将用一些实例来讨论 make ...
Linux下who命令之C语言实现
Linux下who命令之C语言实现 Step1:前期准备首先要有一个清楚的认识:linux中一切皆文件实现who命令,who命令也是Linux中的一个文件,那我们怎么找到它呢?我们可以" ...
linux下history命令显示历史指令记录的使用方法
Linux系统当你在shell(控制台)中输入并执行命令时,shell会自动把你的命令记录到历史列表中,一般保存在用户目录下的.bash_history文件中.默认保存1000条,你也可以更改这个值 ...
linux下svn命令使用大全
最近经常使用svn进行代码管理,这些命令老是记不住,得经常上网查,终于找了一个linux下svn命令使用大全:1.将文件checkout到本地目录 svn checkout path(path是服务器 ...
Linux下rz命令使用的实例详解
Linux中rz命令和sz命令都可用于文件传输,而rz命令主要用于文件的上传,下面将通过几个实例来给大家详细介绍下Linux下rz命令的用法,一起来学习下吧. rz命令可以批量上传文件,当然也可上传单 ...
Linux下rar命令详解
Linux下rar命令详解用法: rar <命令> -<选项1> ….-<选项N> < 操作文档> <文件…> <@文件列表…> ...
linux下tar命令详解
linux下tar命令详解 tar是Linux环境下最常用的备份工具之一.tar(tap archive)原意为操作磁带文件,但基于Linux的文件操作机制,同样也可适用于普通的磁盘文件.ta ...

随机推荐

Operation之结合操作符
startWith 该方法会在Observable序列开始之前插入一些事件元素. 即发生事件消息之前, 会发出这些预先插入的事件消息 Observable.of("2", &quo ...
python 科学计算基础库安装
1.numpyNumPy(Numeric Python)是用Python进行科学计算的基本软件包. NumPy是Python编程语言的扩展,增加了对大型多维数组和矩阵的支持,以及一个大型的高级数学函数 ...
Zabbix使用主动模式进行监控配置方法
一直都是在用Zabbix的被动模式(即默认模式)进行监控. 但是总有些情况是不适用被动模式的,刚好工作上有这个需求,于是捣鼓了一下,发现配置起来也挺简单的. (1)Agent配置修改Zabbix-a ...
移芯EC616修改记录
1. FOTA升级的不用修改了,发布的版本已经修改过. 2. 添加AT+LPNM和AT+LGMR
Quartz学习笔记：集群部署&高可用
Quartz学习笔记:集群部署&高可用集群部署一个Quartz集群中的每个节点是一个独立的Quartz应用,它又管理着其他的节点.这就意味着你必须对每个节点分别启动或停止.Quartz集群 ...
imagettftext(): Could not read font
imagettftext(): Could not read font 1 确认FreeType Version ( 2以上版本) 2 确认字体路径,要是绝对路径的 3 确认 php.ini 配置开 ...
dubbo调用服务时，利用zookeeper实现本地动态负载均衡
利用了zookeeper的临时节点的特点,生产者将自己的服务信息注册到zookeeper当中,消费者去zookeeper当中取出服务信息的集合,本地实现负载均衡 public class TestCr ...
RestTemplate的使用和原理你都烂熟于胸了吗？【享学Spring MVC】
每篇一句人圆月圆心圆,人和家和国和---中秋节快乐前言在阅读本篇之前,建议先阅读开山篇效果更佳.RestTemplate是Spring提供的用于访问Rest服务的客户端工具,它提供了多种便捷访问 ...
CORS解决跨域问题（403问题）
1.什么是跨域问题? 跨域问题是浏览器对于ajax请求的一种安全限制:一个页面发起的ajax请求,只能是用当前页同域名同端口的路径,这能有效的阻止跨站攻击. 2.跨域问题出现的条件: 1.跨域问题是a ...
PAT甲级1006水题飘过
题目分析:由于不存在相同的两个时间(24:00:00和00:00:00不会同时存在),则我们假设两个全局变量存放到达的最早的时间和达到的最晚的时间,设置最早的初值为“23:59:59”,设置最晚的初值 ...

linux下nm命令的使用