相信很多人都有这样一种感受,自己写的代码在开发、测试环境跑的稳得一笔,可一到线上就抽风,不是缺这个就是少那个反正就是一顿报错,而线上调试代码又很麻烦,让人头疼得很。不过, 阿里巴巴出了一款名叫Arthas的工具,可以在线分析诊断Java代码,让人眼前一亮。

Arthas 是什么?

Arthas(阿尔萨斯) 是阿里开源的一个Java在线分析诊断工具。

Arthas 能解决啥问题?

在日常开发上线过程中,我们多多少少都会遇到下边这些问题,苦于无法在线调试,只能通过老鸟的经验来硬分析bug,效率上不去还总开口问别人答疑解惑,多少有些不好意思

  • 这个类从哪个 jar 包加载的?为什么会报各种类相关的 Exception?

  • 我改的代码为什么没有执行到?难道是我没 commit?分支搞错了?

  • 遇到问题无法在线上 debug,难道只能通过加日志再重新发布吗?

  • 线上遇到某个用户的数据处理有问题,但线上同样无法 debug,线下无法重现!

  • 是否有一个全局视角来查看系统的运行状况?

  • 有什么办法可以监控到JVM的实时运行状态?

  • 线上代码有错误,不想重新发布?那能不能改class文件替换一下?

Arthas两种安装、启动方式

1、jar包启动

  1. wget https://alibaba.github.io/arthas/arthas-boot.jar
  2. java -jar arthas-boot.jar --target-ip 0.0.0.0

首先想用arthas调试项目,服务器必须要有运行着的Java服务,demo-0.0.1-SNAPSHOT.jar就是我启动的测试项目,启动arthas后它会自动检测本地所有的Java服务列出来,我们只需按照序号输入想要调试的项目即可,选1进入对应进程的arthas交互平台

  1. [root@iz2zehzeir87zi8q99krk1z data]# java -jar arthas-boot.jar --target-ip 172.17.72.201
  2. [INFO] arthas-boot version: 3.1.0
  3. [INFO] Found existing java process, please choose one and hit RETURN.
  4. * [1]: 28679 demo-0.0.1-SNAPSHOT.jar

2、在线安装

  1. curl -L https://alibaba.github.io/arthas/install.sh | sh

执行上面的命令会在所在的文件中生成as.sh执行文件



启动arthas

  1. ./as.sh PID #进程id 指定JAVA进程id
  2. ./as.sh -h #h来获取更多参数信息

3、远程连接:

要想使用arthas服务的 web console必须对外暴露本机ip

  1. java -jar arthas-boot.jar --target-ip 172.17.72.201
  2. java -jar arthas-boot.jar --telnet-port 9999 --http-port -1
  1. ./as.sh --target-ip 0.0.0.0
  2. ./as.sh --telnet-port 9999 --http-port -1

访问arthas控制台也有两种方法

(1)、web console 界面

重点说明:--target-ipip 一定要是arthas所在机器对外暴露的ip,但如果用的是阿里云机器必须要使用私有ip启动arthas服务,但访问必须是公网IP

(2)、telnet方式

  1. telnet 10.0.2.5 8563



访问 http://59.110.218.9:8563/ ,进入交互平台

Arthas 命令使用

1、Dashboard 命令

查看当前系统的实时数据面板,例如:服务器thread信息、内存memory、GC回收等情况

2、Thread(线程监控)

  1. $ thread -n 3
  2. "as-command-execute-daemon" Id=57 cpuUsage=72% RUNNABLE
  3. at sun.management.ThreadImpl.dumpThreads0(Native Method)
  4. at sun.management.ThreadImpl.getThreadInfo(ThreadImpl.java:448)
  5. at com.taobao.arthas.core.command.monitor200.ThreadCommand.processTopBusyThreads(ThreadCommand.java:133)
  6. at com.taobao.arthas.core.command.monitor200.ThreadCommand.process(ThreadCommand.java:79)
  7. at com.taobao.arthas.core.shell.command.impl.AnnotatedCommandImpl.process(AnnotatedCommandImpl.java:82)
  8. at com.taobao.arthas.core.shell.command.impl.AnnotatedCommandImpl.access$100(AnnotatedCommandImpl.java:18)
  9. at com.taobao.arthas.core.shell.command.impl.AnnotatedCommandImpl$ProcessHandler.handle(AnnotatedCommandImpl.java:111)
  10. at com.taobao.arthas.core.shell.command.impl.AnnotatedCommandImpl$ProcessHandler.handle(AnnotatedCommandImpl.java:108)
  11. at com.taobao.arthas.core.shell.system.impl.ProcessImpl$CommandProcessTask.run(ProcessImpl.java:370)
  12. at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149)
  13. at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624)
  14. at java.lang.Thread.run(Thread.java:748)
  15. Number of locked synchronizers = 1
  16. - java.util.concurrent.ThreadPoolExecutor$Worker@a2f70c7

可以看到这个线程是被synchroned关键字锁导致的阻塞 ,目前只支持找出synchronized关键字阻塞住的线程, 如果是java.util.concurrent.Lock, 目前还不支持。

  1. Number of locked synchronizers = 1
  2. - java.util.concurrent.ThreadPoolExecutor$Worker@a2f70c7
  3. thread -n 3 #当前最忙的前N个线程
  4. thread -b, ##找出当前阻塞其他线程的线程
  5. thread -n 3 -i 1000 #间隔一定时间后展示

重点学习thread -b, ##找出当前阻塞其他线程的线程

3、JVM (jvm实时运行状态,内存使用情况等)

  1. $ jvm
  2. RUNTIME
  3. --------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
  4. MACHINE-NAME 28679@iz2zehzeir87zi8q99krk1z
  5. JVM-START-TIME 2019-03-28 17:32:16
  6. MANAGEMENT-SPEC-VERSION 1.2
  7. SPEC-NAME Java Virtual Machine Specification
  8. SPEC-VENDOR Oracle Corporation
  9. SPEC-VERSION 1.8
  10. VM-NAME Java HotSpot(TM) 64-Bit Server VM
  11. VM-VENDOR Oracle Corporation
  12. VM-VERSION 25.191-b12
  13. INPUT-ARGUMENTS []
  14. CLASS-PATH demo-0.0.1-SNAPSHOT.jar
  15. BOOT-CLASS-PATH /usr/local/jdk/jre/lib/resources.jar:/usr/local/jdk/jre/lib/rt.jar:/usr/local/jdk/jre/lib/sunrsasign.jar:/usr/local/jdk/jre/lib/jsse.jar:/usr/local/jdk/jre/lib/jce.jar
  16. :/usr/local/jdk/jre/lib/charsets.jar:/usr/local/jdk/jre/lib/jfr.jar:/usr/local/jdk/jre/classes
  17. LIBRARY-PATH /usr/java/packages/lib/amd64:/usr/lib64:/lib64:/lib:/usr/lib

4、trace (当前方法内部调用路径,路径上每个节点的耗时)

  1. $ trace #类名 #方法名



对于执行耗时相对较长的方法,调用链路耗时属性会高亮显示方便排查

参数 -j 可以过滤jdk的函数 trace -j com.example.demo.controller index2

参数 #cost 可以按执行耗时毫秒ms过滤 trace -j com.example.demo.controller index2 ’#cost >10‘

5、watch

当前方法执行数据观测,能观察到的范围为:返回值、抛出异常、入参

  1. $ trace #类名 #方法名 "{params,target,returnObj,throwExp }"
  1. OGNL 表达式 {params,target,returnObjthrowExp }

throwExp:异常

params :入参(数组),单个参数params【0】

returnObj:返回值

  1. $ watch com.example.demo.controller index2 "{params,target,returnObj}" -x 5
  2. Press Q or Ctrl+C to abort.
  3. Affect(class-cnt:1 , method-cnt:1) cost in 81 ms.
  4. ts=2019-03-29 14:24:14; [cost=1000.746582ms] result=@ArrayList[
  5. @Object[][
  6. @String[辛志富],
  7. ],
  8. @controller[
  9. ],
  10. @String[index2],
  11. ]

6、stack

当前方法被调用的路径,显示当前方法被那些方法调用

  1. public static String uuidOne() {
  2. return uuidTwo();
  3. }
  4. public static String uuidTwo() {
  5. return UUID.randomUUID().toString().replaceAll("-", "");
  6. }
  1. $ stack com.example.demo.controller uuidTwo
  2. Press Q or Ctrl+C to abort.
  3. Affect(class-cnt:1 , method-cnt:1) cost in 58 ms.
  4. ts=2019-03-29 14:38:19;thread_name=http-nio-8888-exec-5;id=13;is_daemon=true;priority=5;TCCL=org.springframework.boot.web.embedded.tomcat.TomcatEmbeddedWebappClassLoader@525b461a
  5. @com.example.demo.controller.uuidOne()
  6. at com.example.demo.controller.index2(controller.java:31)
  7. at sun.reflect.GeneratedMethodAccessor36.invoke(null:-1)
  8. at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)

7、monitor 命令

监控类、方法的调用进行监控,调用次数、成功次数、失败次数、平均响应时长、失败率等

  1. $ monitor -c 4 com.example.demo.controller uuidTwo
  2. Press Q or Ctrl+C to abort.
  3. Affect(class-cnt:1 , method-cnt:1) cost in 56 ms.
  4. timestamp class method total success fail avg-rt(ms) fail-rate
  5. --------------------------------------------------------------------------------------------------------
  6. 2019-03-29 14:55:40 com.example.demo.controller uuidTwo 7 7 0 0.18 0.00%

8、classloader 命令

将JVM中所有的类加载器统计出来,树状展示

  1. $ classloader #每种classloader加载类的个树
  2. name numberOfInstances loadedCountTotal
  3. org.springframework.boot.loader.LaunchedURLClassLoader 1 4463
  4. com.taobao.arthas.agent.ArthasClassloader 2 3631
  5. BootstrapClassLoader 1 2961
  6. java.net.FactoryURLClassLoader 1 835
  7. sun.misc.Launcher$AppClassLoader 1 46
  8. sun.reflect.DelegatingClassLoader 41 41
  9. sun.misc.Launcher$ExtClassLoader 1 25
  10. Affect(row-cnt:7) cost in 7 ms.
  11. $ classloader -t # 类加载器间的层级关系
  12. +-BootstrapClassLoader
  13. +-sun.misc.Launcher$ExtClassLoader@1959f618
  14. +-com.taobao.arthas.agent.ArthasClassloader@5fc476c6
  15. +-com.taobao.arthas.agent.ArthasClassloader@5017e14b
  16. +-sun.misc.Launcher$AppClassLoader@5c647e05
  17. +-java.net.FactoryURLClassLoader@4ad317f0
  18. +-org.springframework.boot.loader.LaunchedURLClassLoader@20ad9418
  19. Affect(row-cnt:7) cost in 5 ms

线上代码热更新(动态修改上线项目代码)

手动在代码中抛异常,不停机不重新发包的情况下,修改线上代码



启动服务也达到我们预期异常

替换代码的流程:

1、jad命令 将需要更改的文件先进行反编译,保存下来 ,编译器修改

  1. $ jad --source--only com.example.demo.DemoApplication > /data/DemoApplication.java

修改完以后需要将类重新加载到JVM

2、SC命令 查找当前类是哪个classLoader加载的

  1. $ sc -d *DemoApplication | grep classLoader
  2. classLoaderHash 20ad9418 #类加载器 编号

3、MC命令 用指定的classloader重新将类在内存中编译

  1. $ mc -c 20ad9418 /data/DemoApplication.java -d /data
  2. Memory compiler output:
  3. /data/com/example/demo/DemoApplication.class

4、redefine命令 将编译后的类加载到JVM

上边编译后的.class文件地址

  1. $ redefine /data/com/example/demo/DemoApplication.class
  2. redefine success, size: 1

文件替换后我们再次访问一下程序,发现异常没有了程序已经是我们修改正确后的,class文件替换成功

总结

这样我们就用arthas现实了不停机、不发包替换了生产环境的Java代码,功能确实比较强大,本文只揭开了arthas强大功能的冰山一角,后续将出更详细的文章,方便大家一起学习。

越懒越勤快

arthas的整体功能虽然很强大,但命令行的输入方式让我头疼不已,岁数大了记忆力真的下降严重,而且作为一个贼 TM 懒的程序员,让我去记住如此多的命令和参数,简直是要了老命。又一次因为懒让我勤快起来,我决定做个arthas命令可视化平台。

设计初衷:设计这个平台的初衷很简单,就是让程序员们把更多的精力放在问题的排查上,而不是记那么多枯燥无趣的命令。本身我也不是一个愿意死记硬背的人,觉得脑子里还是应该多放一些有趣、有意义的东西。可能在用惯了命令行的大佬眼里,这个功能比较鸡肋,甚至有点多余,但毕竟像我这样平凡的人更多一些,每天还陷入在重复的工作当中,工作量能减一点就多轻松一点嘛。

本以为自己很牛X,谁成想去哪儿网已经整合arthas开发了比较完善的可视化Java诊断工具,此刻有点泄气。github地址 :https://github.com/qunarcorp/bistoury

目前平台还在持续的开发中,由于平台是自己在维护,开发进度并不客观,平时利用一些碎片时间开发,毕竟不能耽误工作丢了饭碗嘛。不管会不会有人用,我都会一直做下去,只为给自己留一份骄傲。项目github地址 : https://github.com/chengxy-nds/arthas-web.git

感兴趣的小伙伴可以私信我,让我们一起打造这个有趣的东西吧!

小福利:

几百本各类技术电子书相送,嘘~,免费 送给小伙伴们。关注我的公号,回复【 666 】,无套路自行领取哦

不停机还能替换代码?6年的 Java程序员表示不可思议的更多相关文章

  1. 还不知道如何实践微服务的Java程序员,这遍文章千万不要错过!

    作者:古霜卡比 前言 本文将介绍微服务架构和相关的组件,介绍他们是什么以及为什么要使用微服务架构和这些组件.本文侧重于简明地表达微服务架构的全局图景,因此不会涉及具体如何使用组件等细节. 要理解微服务 ...

  2. 一个10年Java程序员的年终总结,献给还在迷茫中的你

    我越来越担心我作为一个Java程序员的未来. 恍然间,发现自己在这个行业里已经摸爬滚打将近10年了,原以为自己就凭已有的项目经验和工作经历怎么着也应该算得上是一个业内比较资历的人士了,但是今年在换工作 ...

  3. java程序员--小心你代码中的内存泄漏

    当你从c&c++转到一门具有垃圾回收功能的语言时,程序员的工作就会变得更加容易,因为你用完对象,他们会被自动回收,但是,java程序员真的不需要考虑内存泄露吗? 其实不然 1.举个例子-看你能 ...

  4. Java程序员拥有这些工具,还怕干不出好活

    老话说,工欲善其事,必先利其器. 那么,作为编程人员,你都用过哪些“兵器”呢?你的”兵器“够”锋利”吗? 近期,有很多新朋友问,都有什么画流程图的工具,给推荐推荐? 索性,就静下来,好好梳理一下,从事 ...

  5. Android java程序员必备技能,集合与数组中遍历元素,增强for循环的使用详解及代码

    Android java程序员必备技能,集合与数组中遍历元素, 增强for循环的使用详解及代码 作者:程序员小冰,CSDN博客:http://blog.csdn.net/qq_21376985 For ...

  6. (转)致Java程序员:你离架构师还差多远?

    转至:https://blog.csdn.net/ityouknow/article/details/82782965 几乎每个Java程序员心中,都有着成为架构师的技术追求.那么,成为Java架构师 ...

  7. Java程序员注意——审查Java代码的六种常见错误

    代码审查是消灭Bug最重要的方法之一,这些审查在大多数时候都特别奏效.由于代码审查本身所针对的对象,就是俯瞰整个代码在测试过程中的问题和Bug.并且,代码审查对消除一些特别细节的错误大有裨益,尤其是那 ...

  8. C++代码书写规范——给新手程序员的一些建议

    代码就是程序员的面子,无论是在工作中在电脑上写程序代码还是在面试时在纸上写演示代码我们都希望写出整洁,优雅的代码.特别在工作中当我们碰到需要维护别人的代码,或者是多人参与一个项目大家一起写代码的时候, ...

  9. 90% 的 Java 程序员都说不上来的为何 Java 代码越执行越快(1)- JIT编译优化

    麻烦大家帮我投一票哈,谢谢 经常听到 Java 性能不如 C/C++ 的言论,也经常听说 Java 程序需要预热,那么其中主要原因是啥呢? 面试的时候谈到 JVM,也有很多面试官喜欢问,为啥 Java ...

随机推荐

  1. Notepad++正则表达式查找替换文本中文字符

    测试需求 测试工具中xml配置文件中注释字段包含中文字符,在Win10系统下使用工具中偶尔会出现中文乱码导致配置文件失效.解决方法将配置文件中的中文注释换成英文注释或者直接替换删除.如何将配置文件中的 ...

  2. qq,新浪分享

    var _title,_source,_sourceUrl,_pic,_showcount,_desc,_summary,_site; // 新浪微博分享$('.xlwb-share').on('cl ...

  3. Redis调用lua生成验证码

    场景: ​ 通过微信公众号拿验证码在APP上绑定,为了防止重复,尝试使用reids-lua的方法实现此功能 以下是 php 调用 redis.eval 方法传入的 lua 方法,当然这只是修改后的,保 ...

  4. Thinking in Java学习杂记(第7章)

    将一个方法调用同一个方法主体连接到一起就称为"绑定"(Binding).若在程序运行以前执行绑定,就叫做"早期绑定".而Java中绑定的所有方法都采用后期绑定技 ...

  5. 万物互联—MQTT协议

    一.简介 MQTT(Message Queuing Telemetry Transport,消息队列遥测传输),最早是1999年由IBM开发的基于发布/订阅范式的消息协议,是一种极其简单和轻量级的消息 ...

  6. Activiti7新的API介绍

    一.Activiti7 的组成部分 Activiti Core 作为Activiti 的核心部分,Activiti Cloud 主要是利用云服务来实现分布式业务流程开发. 二.Activiti 新的 ...

  7. Html 慕课园编程练习9-22

    题目要求: 制作一个表格,显示班级的学生信息. 要求: 1. 鼠标移到不同行上时背景色改为色值为 #f2f2f2,移开鼠标时则恢复为原背景色 #fff 2. 点击添加按钮,能动态在最后添加一行 3. ...

  8. x86汇编利用int 16h中断实现伪多线程输入

    x86汇编利用int 16h中断实现伪多线程输入 我们都知道,如果想让一个程序,同时又干这个,又干那个,最好的办法就是多线程.这个在高级语言里面已经用烂了. 但是,DOS是只有单线程的.我如果想让程序 ...

  9. 数据结构和算法(Golang实现)(30)查找算法-2-3-4树和普通红黑树

    文章首发于 阅读更友好的GitBook. 2-3-4树和普通红黑树 某些教程不区分普通红黑树和左倾红黑树的区别,直接将左倾红黑树拿来教学,并且称其为红黑树,因为左倾红黑树与普通的红黑树相比,实现起来较 ...

  10. Java第二十天,Map集合(接口)

    Map接口 一.定义 Map集合是双列集合,即一个元素包含两个值(一个key,一个value),Collection集合是单列集合. 定义格式: public interface Map<K,V ...