一、概述

  jstack是java虚拟机自带的一种堆栈跟踪工具。jstack用于打印出给定的java进程ID或core file或远程调试服务的Java堆栈信息,如果是在64位机器上,需要指定选项"-J-d64",Windows的jstack使用方式只支持以下的这种方式:

  1. jstack [-l] pid   

  主要分为两个功能:

    a.  针对活着的进程做本地的或远程的线程dump;

    b.  针对core文件做线程dump。

  stack用于生成java虚拟机当前时刻的线程快照。线程快照是当前java虚拟机内每一条线程正在执行的方法堆栈的集合,生成线程快照的主要目的是定位线程出现长时间停顿的原因,如线程间死锁、死循环、请求外部资源导致的长时间等待等。 线程出现停顿的时候通过jstack来查看各个线程的调用堆栈,就可以知道没有响应的线程到底在后台做什么事情,或者等待什么资源。 如果java程序崩溃生成core文件,jstack工具可以用来获得core文件的java stack和native stack的信息,从而可以轻松地知道java程序是如何崩溃和在程序何处发生问题。另外,jstack工具还可以附属到正在运行的java程序中,看到当时运行的java程序的java stack和native stack的信息, 如果现在运行的java程序呈现hung的状态,jstack是非常有用的。

jstack命令主要用来查看Java线程的调用堆栈的,可以用来分析线程问题(如死锁)。

1.1、线程的几种状态:  

  NEW,未启动的。不会出现在Dump中。

  RUNNABLE,在虚拟机内执行的。运行中状态,可能里面还能看到locked字样,表明它获得了某把锁。

  BLOCKED,受阻塞并等待监视器锁。被某个锁(synchronizers)給block住了。

  WATING,无限期等待另一个线程执行特定操作。等待某个condition或monitor发生,一般停留在park(), wait(), sleep(),join() 等语句里。

  TIMED_WATING,有时限的等待另一个线程的特定操作。和WAITING的区别是wait() 等语句加上了时间限制 wait(timeout)。

  TERMINATED,已退出的。

1.2、Monitor

  在多线程的 JAVA程序中,实现线程之间的同步,主要是 Monitor。 Monitor是 Java中用以实现线程之间的互斥与协作的主要手段,它可以看成是对象或者Class的锁。每一个对象都有,也仅有一个monitor。下面这个图,描述了线程和 Monitor之间关系,以 及线程的状态转换图:

  

  进入区(Entrt Set):表示线程通过synchronized要求获取对象的锁。如果对象未被锁住,则迚入拥有者;否则则在进入区等待。一旦对象锁被其他线程释放,立即参与竞争。

  拥有者(The Owner):表示某一线程成功竞争到对象锁。

  等待区(Wait Set):表示线程通过对象的wait方法,释放对象的锁,并在等待区等待被唤醒。

  从图中可以看出,一个Monitor在某个时刻,只能被一个线程拥有,该线程就是 “Active Thread”,而其它线程都是 “Waiting Thread”,分别在两个队列 “ Entry Set”和 “Wait Set”里面等候。在 “Entry Set”中等待的线程状态是 “Waiting for monitor entry”,而在“Wait Set”中等待的线程状态是 “in Object.wait()”。 先看 “Entry Set”里面的线程。我们称被 synchronized保护起来的代码段为临界区。当一个线程申请进入临界区时,它就进入了 “Entry Set”队列。对应的 code就像:

  1. synchronized(obj) {
  2. //.........
  3. }

1.3、调用修饰

表示线程在方法调用时,额外的重要的操作。线程Dump分析的重要信息。修饰上方的方法调用。

  locked <地址> 目标:使用synchronized申请对象锁成功,监视器的拥有者。

  waiting to lock <地址> 目标:使用synchronized申请对象锁未成功,在迚入区等待。

  waiting on <地址> 目标:使用synchronized申请对象锁成功后,释放锁幵在等待区等待。

  parking to wait for <地址> 目标

1.3.1、locked

  1. at oracle.jdbc.driver.PhysicalConnection.prepareStatement
  2. - locked <0x00002aab63bf7f58> (a oracle.jdbc.driver.T4CConnection)
  3. at oracle.jdbc.driver.PhysicalConnection.prepareStatement
  4. - locked <0x00002aab63bf7f58> (a oracle.jdbc.driver.T4CConnection)
  5. at com.jiuqi.dna.core.internal.db.datasource.PooledConnection.prepareStatement

通过synchronized关键字,成功获取到了对象的锁,成为监视器的拥有者,在临界区内操作。对象锁是可以线程重入的。

1.3.2、waiting to lock

  1. at com.jiuqi.dna.core.impl.CacheHolder.isVisibleIn(CacheHolder.java:165)
  2. - waiting to lock <0x0000000097ba9aa8> (a CacheHolder)
  3. at com.jiuqi.dna.core.impl.CacheGroup$Index.findHolder
  4. at com.jiuqi.dna.core.impl.ContextImpl.find
  5. at com.jiuqi.dna.bap.basedata.common.util.BaseDataCenter.findInfo

通过synchronized关键字,没有获取到了对象的锁,线程在监视器的进入区等待。在调用栈顶出现,线程状态为Blocked。

1.3.3、waiting on

  1. at java.lang.Object.wait(Native Method)
  2. - waiting on <0x00000000da2defb0> (a WorkingThread)
  3. at com.jiuqi.dna.core.impl.WorkingManager.getWorkToDo
  4. - locked <0x00000000da2defb0> (a WorkingThread)
  5. at com.jiuqi.dna.core.impl.WorkingThread.run

通过synchronized关键字,成功获取到了对象的锁后,调用了wait方法,进入对象的等待区等待。在调用栈顶出现,线程状态为WAITING或TIMED_WATING。

1.3.4、parking to wait for

park是基本的线程阻塞原语,不通过监视器在对象上阻塞。随concurrent包会出现的新的机制,不synchronized体系不同。

1.4、线程动作

   线程状态产生的原因

    runnable:状态一般为RUNNABLE。

    in Object.wait():等待区等待,状态为WAITING或TIMED_WAITING。

    waiting for monitor entry:进入区等待,状态为BLOCKED。

    waiting on condition:等待区等待、被park。

    sleeping:休眠的线程,调用了Thread.sleep()。

  Wait on condition 该状态出现在线程等待某个条件的发生。具体是什么原因,可以结合 stacktrace来分析。 最常见的情况就是线程处于sleep状态,等待被唤醒。 常见的情况还有等待网络IO:在java引入nio之前,对于每个网络连接,都有一个对应的线程来处理网络的读写操作,即使没有可读写的数据,线程仍然阻塞在读写操作上,这样有可能造成资源浪费,而且给操作系统的线程调度也带来压力。在 NewIO里采用了新的机制,编写的服务器程序的性能和可扩展性都得到提高。 正等待网络读写,这可能是一个网络瓶颈的征兆。因为网络阻塞导致线程无法执行。一种情况是网络非常忙,几 乎消耗了所有的带宽,仍然有大量数据等待网络读 写;另一种情况也可能是网络空闲,但由于路由等问题,导致包无法正常的到达。所以要结合系统的一些性能观察工具来综合分析,比如 netstat统计单位时间的发送包的数目,如果很明显超过了所在网络带宽的限制 ; 观察 cpu的利用率,如果系统态的 CPU时间,相对于用户态的 CPU时间比例较高;如果程序运行在 Solaris 10平台上,可以用 dtrace工具看系统调用的情况,如果观察到 read/write的系统调用的次数或者运行时间遥遥领先;这些都指向由于网络带宽所限导致的网络瓶颈。(来自http://www.blogjava.net/jzone/articles/303979.html

二、命令格式

jstack [ option ] pid
jstack [ option ] executable core
jstack [ option ] [server-id@]remote-hostname-or-IP

2.1、常用参数说明

1)options:

executable Java executable from which the core dump was produced.(可能是产生core dump的java可执行程序)

core 将被打印信息的core dump文件

remote-hostname-or-IP 远程debug服务的主机名或ip

server-id 唯一id,假如一台主机上多个远程debug服务

2)基本参数:

-F当’jstack [-l] pid’没有相应的时候强制打印栈信息,如果直接jstack无响应时,用于强制jstack),一般情况不需要使用

-l长列表. 打印关于锁的附加信息,例如属于java.util.concurrent的ownable synchronizers列表,会使得JVM停顿得长久得多(可能会差很多倍,比如普通的jstack可能几毫秒和一次GC没区别,加了-l 就是近一秒的时间),-l 建议不要用。一般情况不需要使用

-m打印java和native c/c++框架的所有栈信息.可以打印JVM的堆栈,显示上Native的栈帧,一般应用排查不需要使用

-h | -help打印帮助信息

pid 需要被打印配置信息的java进程id,可以用jps查询.

2.2、线程dump的分析工具:

一般情况下,通过jstack输出的线程信息主要包括:jvm自身线程、用户线程等。其中jvm线程会在jvm启动时就会存在。对于用户线程则是在用户访问时才会生成。

三、使用示例

3.1、jstack 查看线程具体在做什么,可看出哪些线程在长时间占用CPU,尽快定位问题和解决问题

  1. 1.top查找出哪个进程消耗的cpu高。执行top命令,默认是进程视图,其中PID是进程号
  2. 21125 co_ad2 18 0 1817m 776m 9712 S 3.3 4.9 12:03.24 java
  3. 5284 co_ad 21 0 3028m 2.5g 9432 S 1.0 16.3 6629:44 ja
  4.  
  5. 这里我们分析21125这个java进程
  6. 2.topshift+h 或“H”查找出哪个线程消耗的cpu
  7. 先输入top,然后再按shift+h 或“H”,此时打开的是线程视图,pid为线程号
  8. 21233 co_ad2 15 0 1807m 630m 9492 S 1.3 4.0 0:05.12 java
  9. 20503 co_ad2_s 15 0 1360m 560m 9176 S 0.3 3.6 0:46.72 java
  10.  
  11. 这里我们分析21233这个线程,并且注意的是,这个线程是属于21125这个进程的。
  12.  
  13. 3.使用jstack命令输出这一时刻的线程栈,保存到文件,命名为jstack.log。注意:输出线程栈和保存top命令快照尽量同时进行。
  14. 由于jstack.log文件记录的线程ID16进制,需要将top命令展示的线程号转换为16进制。
  15.  
  16. 4. jstack查找这个线程的信息
  17. jstack [进程]|grep -A 10 [线程的16进制]
  18. 即: jstack 21125|grep -A 10 52f1
  19.  
  20. -A 10表示查找到所在行的后10行。21233用计算器转换为16进制52f1,注意字母是小写。
  21. 结果:
  22.  
  23. "http-8081-11" daemon prio=10 tid=0x00002aab049a1800 nid=0x52bb in Object.wait() [0x0000000042c75000]
  24. java.lang.Thread.State: WAITING (on object monitor)
  25. at java.lang.Object.wait(Native Method)
  26. at java.lang.Object.wait(Object.java:485)
  27. at org.apache.tomcat.util.net.JIoEndpoint$Worker.await(JIoEndpoint.java:416)
  28.  
  29. 在结果中查找52f1,可看到当前线程在做什么。

3.2、代码测试

  1. public class JStackDemo1 {
  2. public static void main(String[] args) {
  3. while (true) {
  4. //Do Nothing
  5. }
  6. }
  7. }

先是有jps查看进程号:

  1. jps
  2. 29788 JStackDemo1
  3. 29834 Jps

然后使用jstack 查看堆栈信息:

  1. $ jstack 29788
  2. 2015-04-17 23:47:31
  3. ...此处省略若干内容...
  4. "main" prio=10 tid=0x00007f197800a000 nid=0x7462 runnable [0x00007f197f7e1000]
  5. java.lang.Thread.State: RUNNABLE
  6. at javaCommand.JStackDemo1.main(JStackDemo1.java:7)

可以看到,当前一共有一条用户级别线程,线程处于runnable状态,执行到JStackDemo1.java的第七行。

3.3、代码测试

  1. public class JStackDemo1 {
  2. public static void main(String[] args) {
  3. Thread thread = new Thread(new Thread1());
  4. thread.start();
  5. }
  6. }
  7. class Thread1 implements Runnable{
  8. @Override
  9. public void run() {
  10. while(true){
  11. System.out.println(1);
  12. }
  13. }
  14. }

线程堆栈信息

  1. "Reference Handler" daemon prio=10 tid=0x00007fbbcc06e000 nid=0x286c in Object.wait() [0x00007fbbc8dfc000]
  2. java.lang.Thread.State: WAITING (on object monitor)
  3. at java.lang.Object.wait(Native Method)
  4. - waiting on <0x0000000783e066e0> (a java.lang.ref.Reference$Lock)
  5. at java.lang.Object.wait(Object.java:503)
  6. at java.lang.ref.Reference$ReferenceHandler.run(Reference.java:133)
  7. - locked <0x0000000783e066e0> (a java.lang.ref.Reference$Lock)

我们能看到:

线程的状态: WAITING 线程的调用栈 线程的当前锁住的资源: <0x0000000783e066e0> 线程当前等待的资源:<0x0000000783e066e0>

为什么同时锁住的等待同一个资源:

线程的执行中,先获得了这个对象的 Monitor(对应于 locked <0x0000000783e066e0>)。当执行到 obj.wait(), 线程即放弃了 Monitor的所有权,进入 “wait set”队列(对应于 waiting on <0x0000000783e066e0> )。

012-JDK可视化监控工具-jstack的更多相关文章

  1. Java虚拟机学习 - JDK可视化监控工具 ( 7 )

    1.JConsole JConsole工具在JDK/bin目录下,启动JConsole后,将自动搜索本机运行的jvm进程,不需要jps命令来查询指定.双击其中一个jvm进程即可开始监控,也可使用“远程 ...

  2. jdk可视化工具系列——检视阅读

    jdk可视化工具系列--检视阅读 参考 java虚拟机系列 RednaxelaFX知乎问答 RednaxelaFX博客 JConsole--Java监视与管理控制台 jconsole介绍 JConso ...

  3. 三、jdk工具之jstack(Java Stack Trace)

    目录 一.jdk工具之jps(JVM Process Status Tools)命令使用 二.jdk命令之javah命令(C Header and Stub File Generator) 三.jdk ...

  4. 010-JDK可视化监控工具-VisualVM

    一.概述 VisualVM是一个集成多个JDK命令行工具的可视化工具.VisualVM基于NetBeans平台开发,它具备了插件扩展功能的特性,通过插件的扩展,可用于显示虚拟机进程及进程的配置和环境信 ...

  5. JVM 监控工具 jstack 和 jvisualvm 的使用

    Java线程状态 线程的五种状态 * 新建:new(时间很短) * 运行:runnable * 等待:waitting(无限期等待),timed waitting(限期等待) * 阻塞:blocked ...

  6. 超好用的memcache管理及可视化监控工具,真方便!

    memcache做为主流的缓存数据库之一,广泛在各互联网平台使用,但是大家使用中都知道memcache目前没有一个比较好用的可视化客户端工具,每次都要输入命令进行操作,十分不方便.  而另一款主流缓存 ...

  7. 011-JDK可视化监控工具-Jstat

    一.概述 Jstat 是JDK自带的一个轻量级小工具.全称“Java Virtual Machine statistics monitoring tool”,它位于java的bin目录下,主要利用JV ...

  8. 009-JDK可视化监控工具-JConsole

    Console工具在JDK/bin目录下,启动JConsole后,将自动搜索本机运行的jvm进程,不需要jps命令来查询指定.双击其中一个jvm进程即可开始监控,也可使用“远程进程”来连接远程服务器. ...

  9. JVM 监控工具——jstack

    [参考文章]:jstack 命令使用经验总结 1. 简介 jstack主要用于生成java虚拟机当前时刻的线程快照. 线程快照是当前java虚拟机内每一条线程正在执行的方法堆栈的集合, 主要目的是定位 ...

随机推荐

  1. CCNA2.0笔记_路由分类

    直连路由:当在路由器上配置了接口的IP地址,并且接口状态为up的时候,路由表中就出现直连路由项 静态路由:静态路由是由管理员手工配置的,是单向的. 默认路由:当路由器在路由表中找不到目标网络的路由条目 ...

  2. 关于dbutils中QueryRunner看批量删除语句batch

    //批量删除 public void delBooks(String[] ids) throws SQLException { QueryRunner qr = new QueryRunner(C3P ...

  3. Vim 学习笔记二

    1. 粘帖 p 光标前 P 2. 撤销对撤销的撤销 Ctrl+r 3. dl:删除一个字符,daw:删除一个单词,dap:删除一个段落 4. 单个c字符并无效果,cc删除整个一行 C:从当前光标出删除 ...

  4. 【转帖】关于sql server 2008 的mdf收缩问题

    原帖地址:http://social.msdn.microsoft.com/forums/windowsazure/pt-br/388f92e1-9a1e-497d-bde1-6664561fd44e ...

  5. php调用c语言编写的so动态库

    from http://blog.csdn.net/wzhwho/article/details/6949297 PHP除了使用扩展库的方式调用c函数,还可以通过socket通信的方式.这里介绍前者. ...

  6. 编写可维护的JavaScript----笔记(三)

    1.块语句花括号的使用 在JavaScript中,注入if和for语句有两种写法,使用花括号包裹的多行代码或者不使用花括号的单行代码.但强烈建议不论是单行还是多行代码,都应该使用花括号. 2.花括号的 ...

  7. 基于WebBrowser 的爬虫程序

    WebBrowser的属性和事件 WebBrowser 如何跳转页面 web.Navigate(""); WebBrowser 如何循环跳转获取页面内容 bool loading ...

  8. python文件的编译

    背景知识 pyc文件: .pyc 是一种二进制文件,是由 .py 文件经过编译后,生成一种byte code文件. .py 文件变成 .pyc 文件后,加载的速度有所提高,而且 .pyc 是一种跨平台 ...

  9. 【Raspberry Pi】修改时区

    Raspberry Pi没有时钟模块,所以每次断电都会丢失时间,但它有联网获取时间的预设.但要修改默认时区 http://outofmemory.cn/code-snippet/2899/shumei ...

  10. sql查询用nolock

    大家在写查询时,为了性能,往往会在表后面加一个nolock,或者是with(nolock),其目的就是查询是不锁定表,从而达到提高查询速度的目的. 什么是并发访问:同一时间有多个用户访问同一资源,并发 ...