强大的strace命令用法详解

文章转自： https://www.linuxidc.com/Linux/2018-01/150654.htm

　　strace是什么？

　　按照strace官网的描述, strace是一个可用于诊断、调试和教学的Linux用户空间跟踪器。我们用它来监控用户空间进程和内核的交互，比如系统调用、信号传递、进程状态变更等。

strace底层使用内核的ptrace特性来实现其功能。

　　在运维的日常工作中，故障处理和问题诊断是个主要的内容，也是必备的技能。strace作为一种动态跟踪工具，能够帮助运维高效地定位进程和服务故障。它像是一个侦探，通过系统调用的蛛丝马迹，告诉你异常的真相。

　　strace能做什么？

　　运维工程师都是实践派的人，我们还是先来个例子吧。

　　我们从别的机器copy了个叫做some_server的软件包过来，开发说直接启动就行，啥都不用改。可是尝试启动时却报错，根本起不来！

　　启动命令：

　　./some_server ../conf/some_server.conf

　　输出:

　　FATAL: InitLogFile failed iRet: -1!
　　Init error: -1655

　　为什么起不来呢？从日志看，似乎是初始化日志文件失败，真相到底怎样呢？我们用strace来看看。

　　strace -tt -f  ./some_server ../conf/some_server.conf

　　输出:

　　我们注意到，在输出InitLogFile failed错误的前一行，有个open系统调用:

　　23:14:24.448034 open("/usr/local/apps/some_server/log//server_agent.log", O_RDWR|O_CREAT|O_APPEND|O_LARGEFILE, 0666) = -1 ENOENT (No such file or directory)

　　它尝试打开文件/usr/local/apps/some_server/log//server_agent.log来写(不存在则创建)，可是却出错了，返回码是-1, 系统错误号errorno为ENOENT。查下open系统调用的手册页：

　　man 2 open

　　搜索ENOENT这个错误号errno的解释

ENOENT O_CREAT is not set and the named file does not exist. Or, a directory component in pathname does not exist or is a dangling symbolic link.

　　这里说得比较清楚，因为我们例子中的open选项指定了O_CREAT选项，这里errno为ENOENT的原因是日志路径中某个部分不存在或者是一个失效的符号链接。我们来一级一级看下路径中的哪部分不存在：

　　ls -l /usr/local/apps/some_server/log
　　ls: cannot access /usr/local/apps/some_server/log: No such file or directory
　　ls -l /usr/local/apps/some_server
　　total 8
　　drwxr-xr-x 2 root users 4096 May 14 23:13 bin
　　drwxr-xr-x 2 root users 4096 May 14 22:48 conf

　　原来是log子目录不存在！上层目录都是存在的。手工创建log子目录后，服务就能正常启动了。

　　回过头来， strace究竟能做什么呢？

它能够打开应用进程的这个黑盒，通过系统调用的线索，告诉你进程大概在干嘛。

strace怎么用？

　　既然strace是用来跟踪用户空间进程的系统调用和信号的，在进入strace使用的主题之前，我们的先理解什么是系统调用。

　　关于系统调用：

　　按维基百科中的解释，在计算机中，系统调用（英语：system call），又称为系统呼叫，指运行在用户空间的程序向操作系统内核请求需要更高权限运行的服务。

　　系统调用提供用户程序与操作系统之间的接口。操作系统的进程空间分为用户空间和内核空间：

操作系统内核直接运行在硬件上，提供设备管理、内存管理、任务调度等功能。
用户空间通过API请求内核空间的服务来完成其功能——内核提供给用户空间的这些API, 就是系统调用。

　　在Linux系统上，应用代码通过glibc库封装的函数，间接使用系统调用。

　　Linux内核目前有300多个系统调用，详细的列表可以通过syscalls手册页查看。这些系统调用主要分为几类：

　　文件和设备访问类 比如open/close/read/write/chmod等
　　进程管理类 fork/clone/execve/exit/getpid等
　　信号类 signal/sigaction/kill 等
　　内存管理 brk/mmap/mlock等
　　进程间通信IPC shmget/semget * 信号量，共享内存，消息队列等
　　网络通信 socket/connect/sendto/sendmsg 等
　　其他

　　熟悉Linux系统调用/系统编程，能够让我们在使用strace时得心应手。不过，对于运维的问题定位来说，知道strace这个工具，会查系统调用手册，就差不多够了。

想要深入了解的同学，建议阅读《Linux系统编程》, 《Unix环境高级编程》等书籍。

　　我们回到strace的使用上来。strace有两种运行模式。

　　一种是通过它启动要跟踪的进程。用法很简单，在原本的命令前加上strace即可。比如我们要跟踪 "ls -lh /var/log/messages" 这个命令的执行，可以这样：

　　strace ls -lh /var/log/messages

　　另外一种运行模式，是跟踪已经在运行的进程，在不中断进程执行的情况下，理解它在干嘛。这种情况，给strace传递个-p pid 选项即可。

　　比如，有个在运行的some_server服务，第一步，查看pid:

　　pidof some_server                     
　　17553

　　得到其pid 17553然后就可以用strace跟踪其执行:

　　strace -p 17553

　　完成跟踪时，按ctrl + C 结束strace即可。

　　strace有一些选项可以调整其行为，我们这里介绍下其中几个比较常用的，然后通过示例讲解其实际应用效果。

　　strace常用选项：

　　从一个示例命令来看：

　　strace -tt -T -v -f -e trace=file -o /data/log/strace.log -s 1024 -p 23489

-tt 在每行输出的前面，显示毫秒级别的时间
-T 显示每次系统调用所花费的时间
-v 对于某些相关调用，把完整的环境变量，文件stat结构等打出来。
-f 跟踪目标进程，以及目标进程创建的所有子进程
-e 控制要跟踪的事件和跟踪行为,比如指定要跟踪的系统调用名称
-o 把strace的输出单独写到指定的文件
-s 当系统调用的某个参数是字符串时，最多输出指定长度的内容，默认是32个字节
-p 指定要跟踪的进程pid, 要同时跟踪多个pid, 重复多次-p选项即可。

　　实例：跟踪nginx, 看其启动时都访问了哪些文件

　　strace -tt -T -f -e trace=file -o /data/log/strace.log -s 1024 ./nginx

　　部分输出:

　　输出中，第一列显示的是进程的pid, 接着是毫秒级别的时间，这个是-tt 选项的效果。

　　每一行的最后一列，显示了该调用所花的时间，是-T选项的结果。

　　这里的输出只显示和文件访问有关的内容，这是因为我们通过-e trace=file 选项指定了。

　　strace问题定位案例

　　1、定位进程异常退出

　　问题：机器上有个叫做run.sh的常驻脚本，运行一分钟后会死掉。需要查出死因。

　　定位：进程还在运行时，通过ps命令获取其pid, 假设我们得到的pid是24298

　　strace -o strace.log -tt -p 24298

　　查看strace.log, 我们在最后2行看到如下内容:

　　22:47:42.803937 wait4(-1,  <unfinished ...>
　　22:47:43.228422 +++ killed by SIGKILL +++

　　这里可以看出，进程是被其他进程用KILL信号杀死的。

　　实际上，通过分析，我们发现机器上别的服务有个监控脚本，它监控一个也叫做run.sh的进程，当发现run.sh进程数大于2时，就会把它杀死重启。结果导致我们这个run.sh脚本被误杀。

　　进程被杀退出时，strace会输出killed by SIGX(SIGX代表发送给进程的信号)等，那么，进程自己退出时会输出什么呢？

　　这里有个叫做test_exit的程序，其代码如下:

　　#include <stdio.h>
　　#include <stdlib.h>

　　int main(int argc, char **argv) {
      　　 exit(1);
　　}

　　我们strace看下它退出时strace上能看到什么痕迹。

　　strace -tt -e trace=process -f ./test_exit

　　说明: -e trace=process 表示只跟踪和进程管理相关的系统调用。

　　输出：

　　23:07:24.672849 execve("./test_exit", ["./test_exit"], [/* 35 vars */]) = 0
　　23:07:24.674665 arch_prctl(ARCH_SET_FS, 0x7f1c0eca7740) = 0
　　23:07:24.675108 exit_group(1)           = ?
　　23:07:24.675259 +++ exited with 1 +++

　　可以看出，进程自己退出时（调用exit函数，或者从main函数返回）, 最终调用的是exit_group系统调用，并且strace会输出exited with X（X为退出码）。

　　可能有人会疑惑，代码里面明明调用的是exit, 怎么显示为exit_group?

这是因为这里的exit函数不是系统调用，而是glibc库提供的一个函数，exit函数的调用最终会转化为exit_group系统调用，它会退出当前进程的所有线程。实际上，有一个叫做_exit()的系统调用(注意exit前面的下划线), 线程退出时最终会调用它。

　　2、定位共享内存异常

　　有个服务启动时报错：

　　shmget 267264 30097568: Invalid argument
　　Can not get shm...exit!

　　错误日志大概告诉我们是获取共享内存出错，通过strace看下：

　　strace -tt -f -e trace=ipc ./a_mon_svr     ../conf/a_mon_svr.conf

　　输出：

　　22:46:36.351798 shmget(0x5feb, 12000, 0666) = 0
　　22:46:36.351939 shmat(0, 0, 0)          = ?
　　Process 21406 attached
　　22:46:36.355439 shmget(0x41400, 30097568, 0666) = -1 EINVAL (Invalid argument)
　　shmget 267264 30097568: Invalid argument
　　Can not get shm...exit!

　　这里，我们通过-e trace=ipc 选项，让strace只跟踪和进程通信相关的系统调用。

　　从strace输出，我们知道是shmget系统调用出错了，errno是EINVAL。同样，查询下shmget手册页，搜索EINVAL的错误码的说明:

EINVAL A new segment was to be created and size < SHMMIN or size > SHMMAX, or no new segment was to be created, a segment with given key existed, but size is greater than the size of that segment

　　翻译下，shmget设置EINVAL错误码的原因为下列之一：

要创建的共享内存段比 SHMMIN小 (一般是1个字节)
要创建的共享内存段比 SHMMAX 大 (内核参数kernel.shmmax配置)
指定key的共享内存段已存在，其大小和调用shmget时传递的值不同。

　　从strace输出看，我们要连的共享内存key 0x41400, 指定的大小是30097568字节，明显与第1、2种情况不匹配。那只剩下第三种情况。使用ipcs看下是否真的是大小不匹配：

　　ipcs  -m | grep 41400
　　key        shmid      owner      perms      bytes      nattch     status   
　　0x00041400 1015822    root       666        30095516   1

　　可以看到，已经0x41400这个key已经存在，并且其大小为30095516字节，和我们调用参数中的30097568不匹配，于是产生了这个错误。

　　在我们这个案例里面，导致共享内存大小不一致的原因，是一组程序中，其中一个编译为32位，另外一个编译为64位,代码里面使用了long这个变长int数据类型。

把两个程序都编译为64解决了这个问题。

　　这里特别说下strace的-e trace选项。

　　要跟踪某个具体的系统调用，-e trace=xxx即可。但有时候我们要跟踪一类系统调用，比如所有和文件名有关的调用、所有和内存分配有关的调用。

　　如果人工输入每一个具体的系统调用名称，可能容易遗漏。于是strace提供了几类常用的系统调用组合名字。

-e trace=file 跟踪和文件访问相关的调用(参数中有文件名)
-e trace=process 和进程管理相关的调用，比如fork/exec/exit_group
-e trace=network 和网络通信相关的调用，比如socket/sendto/connect
-e trace=signal 信号发送和处理相关，比如kill/sigaction
-e trace=desc 和文件描述符相关，比如write/read/select/epoll等
-e trace=ipc 进程见同学相关，比如shmget等

　　绝大多数情况，我们使用上面的组合名字就够了。实在需要跟踪具体的系统调用时，可能需要注意C库实现的差异。

比如我们知道创建进程��用的是fork系统调用，但在glibc里面，fork的调用实际上映射到了更底层的clone系统调用。使用strace时，得指定-e trace=clone, 指定-e trace=fork什么也匹配不上。

　　3、性能分析

　　假如有个需求，统计Linux 4.5.4 版本内核中的代码行数(包含汇编和C代码)。这里提供两个Shell脚本实现：

　　poor_script.sh:

!/bin/bash

total_line=0
while read filename; do
line=$(wc -l $filename | awk ‘{print $1}’)
(( total_line += line ))
done < <( find linux-4.5.4 -type f ( -iname ‘.c’ -o -iname ‘.h’ -o -iname ‘*.S’ ) )
echo “total line: $total_line”

　　good_script.sh:

!/bin/bash

find linux-4.5.4 -type f ( -iname ‘.c’ -o -iname ‘.h’ -o -iname ‘*.S’ ) -print0 \
| wc -l —files0-from - | tail -n 1

　　两段代码实现的目的是一样的。我们通过strace的-c选项来分别统计两种版本的系统调用情况和其所花的时间(使用-f同时统计子进程的情况)

　　从两个输出可以看出，good_script.sh 只需要2秒就可以得到结果：19613114行。它大部分的调用(calls)开销是文件操作(read/open/write/close)等，统计代码行数本来就是干这些事情。

　　而poor_script.sh完成同样的任务则花了539秒。它大部分的调用开销都在进程和内存管理上(wait4/mmap/getpid…)。

　　实际上，从两个图中clone系统调用的次数,我们可以看出good_script.sh只需要启动3个进程，而poor_script.sh完成整个任务居然启动了126335个进程！

而进程创建和销毁的代价是相当高的，性能不差才怪。

　　总结

　　当发现进程或服务异常时，我们可以通过strace来跟踪其系统调用，“看看它在干啥”，进而找到异常的原因。熟悉常用系统调用，能够更好地理解和使用strace。

　　当然，万能的strace也不是真正的万能。当目标进程卡死在用户态时，strace就没有输出了。

　　这个时候我们需要其他的跟踪手段，比如gdb/perf/SystemTap等。

　　备注：

　　1、perf原因kernel支持

　　2、ftrace kernel支持可编程

　　3、systemtap 功能强大，RedHat系统支持，对用户态，内核态逻辑都能探查，使用范围更广

　　本文永久更新链接地址：http://www.linuxidc.com/Linux/2018-01/150654.htm

[转帖]强大的strace命令用法详解的更多相关文章

强大的strace命令用法详解
文章转自: https://www.linuxidc.com/Linux/2018-01/150654.htm strace是什么? 按照strace官网的描述, strace是一个可用于诊断.调试和 ...
主机管理+堡垒机系统开发：strace命令用法详解（六）
一.简单介绍 strace是什么? 按照strace官网的描述, strace是一个可用于诊断.调试和教学的Linux用户空间跟踪器.我们用它来监控用户空间进程和内核的交互,比如系统调用.信号传递.进 ...
strace命令用法详解
Linux利器 strace strace常用来跟踪进程执行时的系统调用和所接收的信号. 在Linux世界,进程不能直接访问硬件设备,当进程需要访问硬件设备(比如读取磁盘文件,接收网络数据等等)时,必 ...
Linux Shell脚本入门－－wget 命令用法详解
Linux Shell脚本入门--wget 命令用法详解 wget是在Linux下开发的开放源代码的软件,作者是Hrvoje Niksic,后来被移植到包括Windows在内的各个平台上.它有以下功能 ...
systemctl命令用法详解
systemctl命令用法详解系统环境:Fedora 16binpath:/bin/systemctlpackage:systemd-units systemctl enable httpd.serv ...
Ubuntu kill命令用法详解
转自:Ubuntu kill命令用法详解 1. kill 作用:根据进程号杀死进程用法: kill ［信号代码］进程ID root@fcola:/# ps -ef | grep sen ...
install 命令用法详解
install 命令用法详解 http://man.linuxde.net/install install命令的作用是安装或升级软件或备份数据,它的使用权限是所有用户.install命令和cp命令类似 ...
Linux下find命令用法详解
Linux下find命令用法详解学神VIP烟火学神IT教育:XueGod-IT 最负责任的线上直播教育平台本文作者为VIP学员烟火第一部分:根据文件名查找 1.在当前目录 ...
lsof 命令用法详解
lsof 命令用法详解作用用于查看你进程开打的文件,打开文件的进程,进程打开的端口(TCP.UDP).找回/恢复删除的文件.是十分方便的系统监视工具,因为lsof命令需要访问核心内存和各种文件,所 ...

随机推荐

bufferedinputstream FileInputStream inputstream的比较
BufferedInputStream类相比InputStream类,提高了输入效率,增加了输入缓冲区的功能不带缓冲的操作,每读一个字节就要写入一个字节,由于涉及磁盘的IO操作相比内存的操作要慢很多 ...
PHPCMS v9插件包整合
插件包是已经修改好的文件集合,您可以直接将插件包复制到您的网站中. 注意:插件包会替换phpcms中的文件,如果您修改过phpcms中的文件请先备份好旧的文件. 1.下载插件包 2.解压 3.复制里面 ...
[Luogu] 被污染的河流
https://www.luogu.org/problemnew/show/P3875 线段树扫描线求矩形面积并扫描线的线段树有点奇怪,修改的标记不会下传,标记的意义是当前区间被完整地覆盖了多少次, ...
devstack cinder-volume服务状态为down
cinder-manage service list 查看到有一个 xxx状态 Binary Host Zone Status State Updated At RPC Version Object ...
以字符串为例，谈谈Python到底要学到什么程度
古语云:慈不掌兵,义不为商:离商业越近,离人性越远:我们在自学数据科学时,一定会辅助一些书籍或者视频来学习,怎么学习,选择哪些资料来学习?这时,我们都要理解好第一句话,理解不好,浪费钱是次要,重要的是 ...
Harmonious Graph
D. Harmonious Graph 好后悔在写这个题之前浪费了几分钟时间,不然我就写出来了.... 因为他就是连通块之间的合并问题,所以就用并查集就好了复杂度好像也只是线性的吧... 然后就A了 ...
对@repository，@Service, @Compent,@Controller注解的理解
注解是没什么本质区别,都是声明作用,取不同的名字只是为了更好区分各自的功能. @Repository 用于标注数据访问组件,即DAO组件 @Service 用于标注业务层组件 @Controller ...
Kafka - SASL认证
kafka SASL认证配置 1.找到kafka安装根目录,在config文件夹下创建kafka_server_jaas.conf,写入 KafkaServer { org.apache.kafka. ...
linux Host key verification failed.错误
Host key verification failed. 1. ssh-keygen -R 你要访问的IP地址 2. ssh-keygen -R 108.61.163.242
SQLW3School-高级：SQL TOP 子句
ylbtech-SQLW3School-高级:SQL TOP 子句 1.返回顶部 1. TOP 子句 TOP 子句用于规定要返回的记录的数目. 对于拥有数千条记录的大型表来说,TOP 子句是非常有用的 ...

[转帖]强大的strace命令用法详解

强大的strace命令用法详解

strace是什么？

strace能做什么？

启动命令：

输出:

strace怎么用？

关于系统调用：

strace常用选项：

strace问题定位案例

1、定位进程异常退出

2、定位共享内存异常

3、 性能分析

!/bin/bash

!/bin/bash

总结

[转帖]强大的strace命令用法详解的更多相关文章

随机推荐

热门专题

　　strace是什么？

　　strace能做什么？

　　启动命令：

　　输出:

　　关于系统调用：

　　strace常用选项：

　　strace问题定位案例

　　1、定位进程异常退出

　　2、定位共享内存异常

　　3、性能分析

　　总结