1、lsof 简介

lsof 是 Linux 下的一个非常实用的系统级的监控、诊断工具。

它的意思是 List Open Files,很容易你就记住了它是 “ls + of”的组合~

它可以用来列出被各种进程打开的文件信息,记住:Linux 下 “一切皆文件”,

包括但不限于 pipes, sockets, directories, devices, 等等。

因此,使用 lsof,你可以获取任何被打开文件的各种信息。

只需输入 lsof 就可以生成大量的信息,因为 lsof 需要访问核心内存和各种文件,所以必须以 root 用户的身份运行它才能够充分地发挥其功能。

lsof 的示例输出:

  1. root@YLinux:~/lab 0# lsof
  2. COMMAND     PID   TID       USER   FD      TYPE     DEVICE SIZE/OFF       NODE NAME
  3. systemd       1       root  cwd       DIR        8,6     4096          2 /
  4. systemd       1       root  rtd       DIR        8,6     4096          2 /
  5. systemd       1       root  txt       REG        8,6  2273340    1834909 /usr/lib/systemd/systemd
  6. systemd       1       root  mem       REG        8,6   210473    1700647 /lib/libnss_files-2.15.s
  7. ...

2、lsof 常用用法

2.1 监控打开的文件、设备

查看文件、设备被哪些进程占用:

  1. # lsof /dev/tty1
  2. COMMAND     PID USER   FD   TYPE DEVICE SIZE/OFF NODE NAME
  3. bash       1770 jian    0u   CHR    4,1      0t0 1045 /dev/tty1
  4. bash       1770 jian    1u   CHR    4,1      0t0 1045 /dev/tty1
  5. bash       1770 jian    2u   CHR    4,1      0t0 1045 /dev/tty1
  6. bash       1770 jian  255u   CHR    4,1      0t0 1045 /dev/tty1
  7. startx     1845 jian    0u   CHR    4,1      0t0 1045 /dev/tty1
  8. startx     1845 jian    1u   CHR    4,1      0t0 1045 /dev/tty1
  9. ...

2.2 监控文件系统

指定目录、挂载点,可以看到有哪些进程打开了其下的文件:

  1. # lsof /data/
  2. COMMAND   PID USER   FD   TYPE DEVICE SIZE/OFF NODE NAME
  3. bash    15983 jian  cwd    DIR    8,5     4096 8252 /data/backup
  4. ...

这在 umount 某个文件系统失败时非常有用(通常会报该 FS is busy)。

列出某个目录(挂载点 如 /home 也行)下被打开的文件:

  1. # lsof +D /var/log/
  2. COMMAND   PID   USER  FD   TYPE DEVICE SIZE/OFF   NODE NAME
  3. rsyslogd  488 syslog   1w   REG    8,1     1151 268940 /var/log/syslog
  4. rsyslogd  488 syslog   2w   REG    8,1     2405 269616 /var/log/auth.log
  5. console-k 144   root   9w   REG    8,1    10871 269369 /var/log/ConsoleKit/history

列出被指定进程名打开的文件:

  1. # lsof -c ssh -c init
  2. COMMAND    PID   USER   FD   TYPE DEVICE SIZE/OFF   NODE NAME
  3. init       1       root  txt    REG        8,1   124704  917562 /sbin/init
  4. init       1       root  mem    REG        8,1  1434180 1442625 /lib/i386-Linux-gnu/libc-2.13.so
  5. init       1       root  mem    REG        8,1    30684 1442694 /lib/i386-Linux-gnu/librt-2.13.so
  6. ...
  7. ssh-agent 1528 lakshmanan    1u   CHR        1,3      0t0    4369 /dev/null
  8. ssh-agent 1528 lakshmanan    2u   CHR        1,3      0t0    4369 /dev/null
  9. ssh-agent 1528 lakshmanan    3u  unix 0xdf70e240      0t0   10464 /tmp/ssh-sUymKXxw1495/agent.1495

2.3 监控进程

指定进程号,可以查看该进程打开的文件:

  1. # lsof -p 2064
  2. COMMAND  PID USER   FD   TYPE     DEVICE SIZE/OFF    NODE NAME
  3. firefox 2064 jian  cwd    DIR        8,6     4096 1571780 /home/jian
  4. firefox 2064 jian  rtd    DIR        8,6     4096       2 /
  5. firefox 2064 jian  txt    REG        8,6    44224 1985670 /usr/lib/firefox-12.0/firefox
  6. firefox 2064 jian  mem    REG        8,6 14707012  925361 /usr/share/fonts/chinese/msyhbd.ttf
  7. firefox 2064 jian  mem    REG        8,6 15067744  925362 /usr/share/fonts/chinese/msyh.ttf
  8. firefox 2064 jian  mem    REG        8,6 16791251 1701681 /usr/share/fonts/wenquanyi/wqy-zenhei.ttc
  9. firefox 2064 jian  mem    REG       0,16 67108904   10203 /dev/shm/pulse-shm-3021850167
  10. ...

当你想要杀掉某个用户所有打开的文件、设备,你可以这样:

  1. kill -9 `lsof -t -u lakshmanan`

此处 -t 的作用是单独的列出 进程 id 这一列。

关于杀死进程的 4 种方式,请参考:

http://www.thegeekstuff.com/2009/12/4-ways-to-kill-a-process-kill-killall-pkill-xkill/

2.4 监控网络

查看指定端口有哪些进程在使用(lsof -i 列出所有的打开的网络连接):

  1. # lsof -i:22
  2. COMMAND  PID USER   FD   TYPE DEVICE SIZE/OFF NODE NAME
  3. sshd    1569 root    3u  IPv4  10303      0t0  TCP *:ssh (LISTEN)
  4. sshd    1569 root    4u  IPv6  10305      0t0  TCP *:ssh (LISTEN)
  5. ...

列出被某个进程打开所有的网络文件:

  1. lsof -i -a -p 234

或者:

  1. lsof -i -a -c ssh

列出所有 tcp、udp 连接:

  1. lsof -i tcp;
  2. lsof -i udp;

列出所有 NFS 文件:

  1. lsof -N -u lakshmanan -a

查看指定网口有哪些进程在使用:

  1. # lsof -i@192.168.1.91
  2. COMMAND     PID USER   FD   TYPE DEVICE SIZE/OFF NODE NAME
  3. skype      1909 jian   54u  IPv4   9116      0t0  TCP 192.168.1.91:40640->64.4.23.153:40047 (ESTABLISHED)
  4. pidgin     1973 jian    7u  IPv4   6599      0t0  TCP 192.168.1.91:59311->hx-in-f125.1e100.net:https (ESTABLISHED)
  5. pidgin     1973 jian   13u  IPv4   9260      0t0  TCP 192.168.1.91:54447->by2msg3010511.phx.gbl:msnp (ESTABLISHED)
  6. ...

3、更多使用技巧

3.1 监控用戶

查看指定用戶打开的文件(lsof -u ^lakshmanan 可以排除某用户):

  1. # lsof -u messagebus
  2. COMMAND    PID       USER   FD   TYPE     DEVICE SIZE/OFF    NODE NAME
  3. dbus-daem 1805 messagebus  cwd    DIR        8,6     4096       2 /
  4. dbus-daem 1805 messagebus  rtd    DIR        8,6     4096       2 /
  5. dbus-daem 1805 messagebus  txt    REG        8,6  1235361 1834948 /usr/bin/dbus-daemon
  6. dbus-daem 1805 messagebus  mem    REG        8,6   210473 1700647 /lib/libnss_files-2.15.so
  7. dbus-daem 1805 messagebus  mem    REG        8,6   190145 1700642 /lib/libnss_nis-2.15.so
  8. dbus-daem 1805 messagebus  mem    REG        8,6   490366 1700636 /lib/libnsl-2.15.so
  9. ...

3.2 监控应用程序

查看指定程序打开的文件:

  1. # lsof -c firefox
  2. COMMAND  PID USER   FD   TYPE     DEVICE SIZE/OFF    NODE NAME
  3. firefox 2064 jian  cwd    DIR        8,6     4096 1571780 /home/jian
  4. firefox 2064 jian  rtd    DIR        8,6     4096       2 /
  5. firefox 2064 jian  txt    REG        8,6    44224 1985670 /usr/lib/firefox-12.0/firefox
  6. firefox 2064 jian  mem    REG        8,6 14707012  925361 /usr/share/fonts/chinese/msyhbd.ttf
  7. firefox 2064 jian  mem    REG        8,6 15067744  925362 /usr/share/fonts/chinese/msyh.ttf
  8. firefox 2064 jian  mem    REG        8,6 16791251 1701681 /usr/share/fonts/wenquanyi/wqy-zenhei.ttc
  9. ...

4、命令模式技巧

4.1 组合逻辑查询条件

只有多个查询条件都满足, 用 "-a" 参数,默认是 -o 。

  1. # lsof -a -c bash -u root
  2. COMMAND  PID USER   FD   TYPE DEVICE SIZE/OFF    NODE NAME
  3. bash    1986 root  cwd    DIR    8,6     4096 1701593 /root/lab
  4. bash    1986 root  rtd    DIR    8,6     4096       2 /
  5. bash    1986 root  txt    REG    8,6  1994157 1700632 /bin/bash
  6. bash    1986 root  mem    REG    8,6  9690800  405214 /usr/lib/locale/locale-archive
  7. bash    1986 root  mem    REG    8,6   210473 1700647 /lib/libnss_files-2.15.so

4.2 lsof 命令的重复执行模式:

基于给定的参数延时多少秒重复执行 lsof:

  • +r 表示 当没有文件被打开的时候,repeat mode 将自行结束。
  • -r 表示 不管文件是否存在或者被打开,它都将执行,直到你中断它。

每个循环的输出使用 ‘=======’ 做分隔符,你也可以用 ‘-r’ | ‘+r’ 指定延时时间。

  1. # lsof -u lakshmanan -c init -a -r5
  2. =======
  3. =======
  4. COMMAND   PID       USER   FD   TYPE DEVICE SIZE/OFF    NODE NAME
  5. inita.sh 2971 lakshmanan  cwd    DIR    8,1     4096  393218 /home/lakshmanan
  6. inita.sh 2971 lakshmanan  rtd    DIR    8,1     4096       2 /
  7. inita.sh 2971 lakshmanan  txt    REG    8,1    83848  524315 /bin/dash
  8. inita.sh 2971 lakshmanan  mem    REG    8,1  1434180 1442625 /lib/i386-Linux-gnu/libc-2.13.so
  9. inita.sh 2971 lakshmanan  mem    REG    8,1   117960 1442612 /lib/i386-Linux-gnu/ld-2.13.so
  10. inita.sh 2971 lakshmanan    0u   CHR  136,4      0t0       7 /dev/pts/4
  11. inita.sh 2971 lakshmanan    1u   CHR  136,4      0t0       7 /dev/pts/4
  12. inita.sh 2971 lakshmanan    2u   CHR  136,4      0t0       7 /dev/pts/4
  13. inita.sh 2971 lakshmanan   10r   REG    8,1       20  393578 /home/lakshmanan/inita.sh
  14. =======

以上输出是前 5 秒没有输出,然后 “inita.sh” 启动后,开始有了输出。

5、最后的技巧

关于磁盘空间告警 df -h --max=1 与 du -hx --max=1 显示不一致的问题,

最常见的的还是下面这种情况:

  1. lsof|grep -i delete

看看被删除的文件:有些删了文件,但是进程没 reload,那些空间还是占用的,你可以理解为类似 windows 下的进程句柄没释放的概念吧~ 只是 windows 下如果有文件被进程使用,你一般是删不掉的,而 Linux 虽然不做删除限制,但却要等到进程使用完文件才能完全释放,以防止进程奔溃,这是操作系统对资源的管理差异吧~

例如 nginx 会有很多临时文件占用了 /tmp 目录,删掉后,依然占用着空间,

此时你可以:

  1. pkill -9 nginx && /etc/init.d/nginx restart

好吧,本文到此结束了,关于 lsof 还有很多很多,不过哥常用、知道的就这些了,哥也只能帮你到这儿了,

如果你还需要其它的内容,请自行 google 吧,骚年。。。

6、refer: 

使用 lsof 查找打开的文件:

http://www.ibm.com/developerworks/cn/aix/library/au-lsof.html

15 Linux lsof Command Examples (Identify Open Files):

http://www.thegeekstuff.com/2012/08/lsof-command-examples/

实用的系统工具之 lsof:

http://www.yLinux.org/forum/t/276

Linux 系统监控和诊断工具:lsof的更多相关文章

  1. [转]linux 系统监控、诊断工具之 IO wait

    1.问题: 最近在做日志的实时同步,上线之前是做过单份线上日志压力测试的,消息队列和客户端.本机都没问题,但是没想到上了第二份日志之后,问题来了: 集群中的某台机器 top 看到负载巨高,集群中的机器 ...

  2. linux 系统监控、诊断工具之 lsof 用法简介

    1.lsof 简介 lsof 是 Linux 下的一个非常实用的系统级的监控.诊断工具. 它的意思是 List Open Files,很容易你就记住了它是 "ls + of"的组合 ...

  3. (转)Linux 系统监控、诊断工具之 top命令详解

    原文:https://www.linuxidc.com/Linux/2014-12/110563.htm 目录 (1)系统.任务统计信息:(2)进程. cpu 统计信息:(3)最后两行为内存信息:3. ...

  4. 系统监控、诊断工具之top

    大家对top 命令可能不会陌生,它的作用主要用来监控系统实时负载率.进程的资源占用率及其它各项系统状态属性是否正常. top命令的截图如下: (1)系统.任务统计信息: 前8行是系统整体的统计信息.第 ...

  5. linux系统监控常用工具

    linux系统监控常用工具 一.系统核心工具包(coreutils) 1./bin/df 报告系统的磁盘空间用量 df -h  显示磁盘分区fdisk -l 2./bin/uname 显示系统信息 u ...

  6. Linux系统监控实用工具Glances

    Linux系统监控实用工具Glances Glances安装 Glances安装要求:python >= 2.6 和 psutil >= 0.4.1 1.第一步,安装了python-> ...

  7. <JVM下篇:性能监控与调优篇>03-JVM监控及诊断工具-GUI篇

    笔记来源:尚硅谷JVM全套教程,百万播放,全网巅峰(宋红康详解java虚拟机) 同步更新:https://gitee.com/vectorx/NOTE_JVM https://codechina.cs ...

  8. <JVM下篇:性能监控与调优篇>01-概述篇-02-JVM监控及诊断工具-命令行篇

    笔记来源:尚硅谷JVM全套教程,百万播放,全网巅峰(宋红康详解java虚拟机) 同步更新:https://gitee.com/vectorx/NOTE_JVM https://codechina.cs ...

  9. linux系统监控sar命令

    linux系统监控sar命令详解 sar(System Activity Reporter系统活动情况报告)是目前 Linux 上最为全面的系统性能分析工具之一,可以从多方面对系统的活动进行报告, 包 ...

随机推荐

  1. jetty ZipException: invalid entry size

    The issue, as I suspected, was due a corrupt JAR file. The solution for me was to clear my local rep ...

  2. 一位ACM过来人的心得(转)

    励志下! 刻苦的训练我打算最后稍微提一下.主要说后者:什么是有效地训练? 我想说下我的理解.很多ACMer入门的时候,都被告知:要多做题,做个500多道就变牛了.其实,这既不是充分条件.也不会是必要条 ...

  3. org.tigris.subversion.javahl.ClientException: Attempted to lock an already-locked dir异常解决方法

    myeclipse用svn提交的时候报错: Attempted to lock an already-locked dir svn: Working copy 'D:/Program Files/My ...

  4. Asp.Net生成RSS方法

    一.RSS简介 什么是RSS? RSS是一种网页内容联合格式(web content sydication format). 它的名字是Really Simple Syndication的缩写. RS ...

  5. NavieBayes中的多项式与伯努力模型

    1文本分类过程 例如文档:Good good study Day day up可以用一个文本特征向量来表示,x=(Good, good, study, Day, day , up).在文本分类中,假设 ...

  6. 查看ORACLE执行计划的几种常用方法

    SQL的执行计划实际代表了目标SQL在Oracle数据库内部的具体执行步骤,作为调优,只有知道了优化器选择的执行计划是否为当前情形下最优的执行计划,才能够知道下一步往什么方向. 执行计划的定义:执行目 ...

  7. C++ STL算法系列1---count函数

    一.count函数 algorithm头文件定义了一个count的函数,其功能类似于find.这个函数使用一对迭代器和一个值做参数,返回这个值出现次数的统计结果. 编写程序读取一系列int型数据,并将 ...

  8. PICT实现组合测试用例(一)

    最近阅读了史亮老师的<软件测试实战:微软技术专家经验总结>一书,其中“测试建模”一章让我受益匪浅.想想以前的测试有多久没有花过心思放在测试用例的设计上了,一直强调“测试思想”的培养也都只是 ...

  9. Tableau学习笔记之五

    计算用户自定义字段,虽然在Tableau软件中已经加入了很多的数值操作运算,比如平均值,最大值等,但是可以自定义自己需要的数值操作运算. 数值操作可以有以下:预定义函数,百分比,总计,分级等等 1.直 ...

  10. C++调用Matlab引擎及Eigen配置

    这个周开始要着手实现网格水印的代码了,虽然还什么都不会,但也只能一步步摸索着往前走了. 我要实现的论文题目是<<Watermarking 3D Polygonal Meshes in th ...