写这篇文章主要目的是完成自己多年来运维JAVA应用的一个总结,相当于个人知识库,以后工作中遇到问题便于临时查阅并不断完善自己的知识体系。

 
 

上图,就知道Tomcat在JAVA容器界是多么重要。

Tomcat是一个开箱即用的软件,配置java环境变量即可把Tomcat进程运行起来,但要投入生产环境,有哪些需要注意的呢?

(1)、性能,默认的Tomcat配置可以正常提供服务,但对于高负载的应用就相当吃力。

  1. 调JVM

    • 调整为server模式,默认为client模式,针对生产环境有做优化,启动速度慢,运行速度快(官方说的);
    • 为了减少JVM垃圾回收和重新分配内存的频率可以把Xms和Xmx设置同样的值,从而tomcat提供更多的服务;
    • JVM有几种垃圾回收算法:【阅读一篇文章:建议开发不要主动去调用System.gc(),这会导致stop-the-world,让JVM自己去解决垃圾回收吧】
      • 垃圾标识算法:引用计数法、根搜索算法;
      • 垃圾收集算法:标记-清除算法,复制算法,标记-整理算法,分代收集算法(Generational Garbage Collection);
      • 垃圾收集器对比与应用场景:

         
         
    • 进程启动参数选择【可以进入网站自助生成配置:http://jvmmemory.com/
       
       
    • 总结GC 调优目标基本有三个思路:
      • 降低 GC 频率,可以通过增大堆空间,减少不必要对象生成;
      • 降低 GC 暂停时间,可以通过减少堆空间,使用 CMS GC 算法实现;
      • 避免 Full GC,调整 CMS 触发比例,避免 Promotion Failure 和 Concurrent mode failure(老年代分配更多空间,增加 GC 线程数加快回收速度),减少大对象生成等。
  2. 配置连接器(有三种连接器供选择)

    • BIO全称blocking I/O,配置参数
      protocol=”HTTP/1.1”
    • NIO全称Non-blocking I/O,配置
      protocol=”org.apache.coyote.http11.Http11NioProtocol”
    • APR全称Apache Portable Runtime,配置
      protocol=”org.apache.coyote.http11.Http11AprProtocol”
    • 下面是三者之间对比:

       
       
    • 配置模版:

       
       

(2)、性能监控

推荐使用JavaMelody 能够监测Java或Java EE应用程序服务器,并以图表的方式显示:Java内存和Java CPU使用情况,用户Session数量,JDBC连接数, 和http请求、sql请求、jsp页面与业务接口方法(EJB3、Spring、 Guice)的执行数量,平均执行时间,错误百分比等。图表可以按天,周,月,年或自定义时间段查看。

  1. 下载地址:
    https://storage.googleapis.com/google-code-archive-downloads/v2/code.google.com/javamelody/javamelody-1.48.0.jar

  2. 配置web.xml:

       <filter>
<filter-name>monitoring</filter-name>
<filter-class>net.bull.javamelody.MonitoringFilter</filter-class>
</filter>
<filter-mapping>
<filter-name>monitoring</filter-name>
<url-pattern>/*</url-pattern>
</filter-mapping>
<listener>
<listener-class>net.bull.javamelody.SessionListener</listener-class>
</listener>
  1. 重启Tomcat应用,访问地址:
    http://host/context/monitoring

     
     

(3)、高可用

  • Tomcat的高可用官方目前是3种方案:

    • Session持久化并把session保存在共享存储;
    • Session持久化并把session保存的共享数据库(JDBC连接);
    • 通过SimpleTcpCluster ,每个tomcat节点都保存所有tomcat节点的数据,这个也是集群模式的基础;
    • 另外,第三方有支持redis共享session从而实现高可用,比较推荐,但是模块稳定性可能需要考虑下。
  • 官方给的集群方案。

     
     
  • 高可用涉及面比较广,需要根据自己业务情况设计对应的方案,推荐两个链接可以详细研究:
    https://tomcat.apache.org/tomcat-8.0-doc/cluster-howto.html
    https://segmentfault.com/a/1190000009591087

(4)、安全

  1. 移除容器版本信息,黑客很容易根据容器版本号找到对应的漏掉做针对性的攻击;
    修改文件server.xml,如下
<Connector port="8080" protocol="HTTP/1.1"  connectionTimeout="20000" Server =" "
redirectPort="8443" />
  1. 安全启动进程,试想有人在请求中加<% System.exit(1); %>,后果是很严重的。
    官方建议tomcat正确启动姿势,
    ./startup.sh -security
    参考链接:https://tomcat.apache.org/tomcat-6.0-doc/security-manager-howto.html

  2. 推荐使用HTTPS协议,如果tomcat直接对外访问就加一个HTTPS吧,如果前端有负载均衡器,负载均衡器使用HTTPS,tomcat放在一个安全的内网使用http也可;

  3. 为Cookie设置HttpOnly属性

     
     
  4. 推荐tomcat启动使用单独的普通用户,避免黑客攻击后导致整个服务器沦陷;

  5. 在部署生产环境时,去除tomcat默认的应用和页面,避免存在安全风险,删除$tomcat/webapps目录下所有文件即可;

  6. 改变Tomcat的shutdown端口和命令,假如默认的8005端口对外网访问,可以直接通过远程将运行的tomcat关闭,很危险,建议修改server.xml
    <Server port="8867" shutdown="NOTGONNAGUESS">

  7. 替换默认的404,403,500页面,和避免异常报错暴露在页面
    在web.xml文件下添加到</web-app>之前

<error-page>
<error-code>404</error-code>
<location>/error.jsp</location>
</error-page>
<error-page>
<error-code>403</error-code>
<location>/error.jsp</location>
</error-page>
<error-page>
<error-code>500</error-code>
<location>/error.jsp</location>
</error-page>
<error-page>
<exception-type>java.lang.Exception</exception-type>
<location>/error.jsp</location>
</error-page>

(5)、线程dump

当我们的java应用比我们预期的要慢的时候,我们就需要用到thread dumps,然后分析它们并知道他们的瓶颈或阻塞的线程等信息,然后针对性的优化从而提示整个系统的性能。

  1. 首先我们了解2个概念;

    • Thread contention(线程竞争):线程竞争是一个状态,等待锁被释放,这个锁正好被其他线程占用。在web网站中,不同的线程频繁的访问共享资源。比如记录日志,线程要记录日志必须要获得锁然后才能记录日志。
    • Deadlock(死锁):死锁是一种特殊的线程竞争,2个或者更多的线程为了完成自己的任务必须等待其他线程完成他们的任务。比较典型案例,如果线程A锁住了记录1并等待记录2,而线程B锁住了记录2并等待记录1,这样两个线程就发生了死锁现象。
  2. 了解java线程背景信息

    • 线程同步:
      为了解决同时访问资源,一个线程需要在访问共享资源时使用线程同步。Java中使用monitor作为线程同步,每个对象都有一个monitor,一个monitor只能被一个线程拥有。假如其他线程获得这个monitor需要进入等待队列,等待释放;

    • 线程状态:

      • NEW:线程刚刚启动还没有开始处理任务;
      • RUNNABLE:线程正在占用CPU并且处理任务;
      • BLOCKED:线程是阻塞的,等待获取monitor,一般是等待共享对象、资源;
      • WAITING:线程无限时间等待另外一个线程,为了执行特定的任务;
      • TIMED_WAITING:线程有限时间等待另外一个线程,为了执行特定的任务;
      • TERMINATED:线程已经结束生命;
    • 线程类型:

      • daemon thread:守护线程,
      • non-daemon threads:非守护线程
  3. 获取Java堆栈

jps -v #获取java进程PID
jstack -F 31336 > dump.log #强制dump出线程堆栈(不同版本,获取方式不一样)

【注】:线程堆栈是某一时刻的堆栈快照,为了分析线程状态改变,需要提取5-10次,每5秒dump一次。

  1. 具体的线程分析内容比较多,可以参考下面链接:
    https://dzone.com/articles/how-analyze-java-thread-dumps
    https://dzone.com/articles/how-to-read-a-thread-dump

(6)、JVM dump

Head dump是JVM某个时刻的内存快照,可以帮助我们分析内存泄露和分析java应用的内存使用情况。Heap dump通常市存储2进程hprof文件,我们打开和分析需要用jhat 或者JVisualVM等其他工具。

  1. 获取Heap dump
    jmap -F -dump:live,format=b,file=/tmp/dump.hprof 12587 #dump时间比较长
  2. 查看heap dump 【不建议在生产环境分析,建议在本地找一台内存大的机器启动】
    jhat /tmp/dump.hprof 12587
  3. 访问:http://ip:7000/
  4. 具体分析内容比较多,给两个链接详细研究。
    https://www.baeldung.com/java-heap-dump-capture
    https://www.javatang.com/archives/2017/10/30/53562102.html

(7)、GC日志

GC叫做垃圾收集,正常的垃圾回收是对整个JVM健康起着重要作用,如果回收不及时,会导致GC频繁,GC时间过长,严重情况可能导致OOM,严重影响业务正常。下面介绍怎么开启gc日志,命令行查看gc,常用gc的含义。

  • 开启gc日志
-XX:+PrintGCDetails -Xloggc:/opt/tmp/myapp-gc.log         #这个支持java 8
-Xlog:gc*:file=/opt/tmp/myapp-gc.log #这个支持java 9
 
gclog-analysis

有下面的参数适合于java 8可以选择性开启:

-XX:+DisableExplicitGC                             #开发想自己调用垃圾回收,在生产环境中不建议开发调用:System.gc() or Runtime.getRuntime().gc()
-XX:+PrintGCDetails #默认是禁用的,可以打印更加详细的垃圾回收信息
-XX:+PrintGCApplicationStoppedTime #默认是禁用的,这个选项代表在GC过程中,应用pause时间
-XX:+PrintGCApplicationConcurrentTime #默认是禁用的,这个选项代表在GC过程中,应用running时间
-XX:+PrintGCDateStamps #打印每个gc的日期和时间
-Xloggc:gclog.log #gclog.log是gc日志的具体路径,所有gc日志记录在这个文件
-XX:+UseGCLogFileRotation #假如gc日志达到指定的大小,会开启自动轮换
-XX:NumberOfGCLogFiles=5 #默认是1,轮换日志的数目
-XX:GCLogFileSize=2000k #指定gc日志的大小,当达到这个大小后会轮换一次
  • 命令行开启gc
jps -v #获取java进程PID
jstat –gc PID 1000 #PID是jvm的进程号

输出内容解释:
S0C #显示当前Survivor 0区的大小
S1C #显示当前Survivor 1区的大小
S0U #显示当前使用Survivor 0区的大小
S1U #显示当前使用Survivor 1区的大小
EC #显示E区的大小
EU #显示已使用E区的大小
OC #显示old区的大小
OU #显示已经使用的old区
PC #显示permanent区的大小
PU #显示已经使用的permanent区大小
YGC #young区发生gc的次数
YGCT #在young区累计的时间
FGC #full gc发生的次数
FGCT #full gc累计占有时间
GCT #gc累计消耗时间

详细的可以见下面:
https://docs.oracle.com/javase/7/docs/technotes/tools/share/jstat.html

(8)、java实用命令【java命令集很强大】

  • java:启动java应用,引导main()方法;
  • jps:主要是列出目标机器上运行的JVM;
  • jstat:列出JVM性能统计数据;
  • jstack:打印指定进程的java堆栈信息;
  • jcmd:发送一些诊断命令给运行的JVM;
  • jmap: 打印指定进程、核心文件或远程调试服务器的共享对象内存映射或堆内存细节。
  • jhat:命令行工具解析Heap dump文件并启动一个web服务;
  • jdb:针对java class,简单的命令行debug工具;
  • jinfo:打印指定java进程的配置信息;
  • keytool:是一个密钥和证书的管理工具,java使用https需要用到;
  • jar:主要是给java应用的打包和解压工具;
  • javac:将java源码编译为二进制class文件;
  • jconsole:开启一个图形界面,让你监控和管理java应用;
  • jvisualvm:很好的heap dump分析工具;

作者:链接:https://www.jianshu.com/p/355ee06c3d2b

JAVA运维总结篇的更多相关文章

  1. java运维: 一次线上问题排查所引发的思考

    本文转载自 crossoverJie 的b博客 https://www.cnblogs.com/crossoverJie/p/9282065.html 前言 之前或多或少分享过一些内存模型.对象创建之 ...

  2. 02 . Ansible高级用法(运维开发篇)

    自动化任务简介 假设我们要在10台linux服务器上安装一个nginx服务,手动是如何做的? # 第一步, ssh登录NUM(1,n)服务器 # 第二步,输入对应服务器密码 # 第三步,执行命令: y ...

  3. 运维监控篇(2)_Zabbix简单的性能调优

    Zabbix是一款高性能的分布式监控报警系统.比如现在常见的家用台式机配置处理器I5-3470.内存4GB1600MHz.硬盘7200rpm就能够监控1000台左右的HOST,是的没错Zabbix就是 ...

  4. 运维学习篇之jenkins的安装(CentOS7)

    一. 介绍   Jenkins是一个开源软件项目,是基于Java开发的一种持续集成工具,用于监控持续重复的工作,旨在提供一个开放易用的软件平台,使软件的持续集成变成可能二. 作用  1.持续的软件版本 ...

  5. 运维监控篇Zabbix简单的性能调优

    Zabbix是一款高性能的分布式监控报警系统.比如现在常见的家用台式机配置处理器I5-3470.内存4GB1600MHz.硬盘7200rpm就能够监控1000台左右的HOST,是的没错Zabbix就是 ...

  6. web运维第一篇:nginx配置文件详解笔记

    #定义Nginx运行的用户和用户组 user www www; #nginx进程数,建议设置为等于CPU总核心数. worker_processes 8; #全局错误日志定义类型,[ debug | ...

  7. Linux运维基础篇大全

    基础知识的文章都在这里https://www.jianshu.com/u/a3c215af055a ,想要了解,请访问这个地址!!!!

  8. 从苦逼到牛逼,详解Linux运维工程师的打怪升级之路

    做运维也快四年多了,就像游戏打怪升级,升级后知识体系和运维体系也相对变化挺大,学习了很多新的知识点. 运维工程师是从一个呆逼进化为苦逼再成长为牛逼的过程,前提在于你要能忍能干能拼,还要具有敏锐的嗅觉感 ...

  9. 详解Linux运维工程师

    运维工程师是从一个呆逼进化为苦逼再成长为牛逼的过程,前提在于你要能忍能干能拼,还要具有敏锐的嗅觉感知前方潮流变化.如:今年大数据,人工智能比较火……(相对表示就是 Python 比较火) 之前写过运维 ...

随机推荐

  1. 关于Http协议与TCP协议的一些简单理解

    TCP协议对应于传输层,而HTTP协议对应于应用层,从本质上来说,二者没有可比性.Http协议是建立在TCP协议基础之上的,当浏览器需要从服务器获取网页数据的时候,会发出一次Http请求.Http会通 ...

  2. [Selenium2+python2.7][Scrap]爬虫和selenium方式下拉滚动条获取简书作者目录并且生成Markdown格式目录

    预计阅读时间: 15分钟 环境: win7 + Selenium2.53.6+python2.7 +Firefox 45.2  (具体配置参考 http://www.cnblogs.com/yoyok ...

  3. centos下关闭自动锁屏

    自己这段时间在学习Linux,选用的系统的为CentOS,在实际操作过程中遇到问题,在无任何操作情况下,系统过一段时间自动锁屏需要重新输入密码.经过多次尝试以后终于成功!解决方法如下: Setting ...

  4. K8S漏洞报告 | 近期bug fix解读&1.13主要bug fix汇总

    K8s近期漏洞详解 Kubernetes仪表盘漏洞(CVE-2018-18264) 因为这一漏洞,用户可以“跳过”登录过程获得仪表盘所使用的自定义TLS证书.如果您已将Kubernetes仪表盘配置为 ...

  5. XPath 爬虫解析库

    XPath     XPath,全称 XML Path Language,即 XML 路径语言,它是一门在 XML 文档中查找信息的语言.最初是用来搜寻 XML 文档的,但同样适用于 HTML 文档的 ...

  6. layui模块化使用

    layui模块化使用分为两部分: 1.自身模块的设置与使用.2.自定义模块的设置与使用.直接上案例吧 <a>加载入口模块与自定义模块设置: <b>自定义模块名 <c> ...

  7. SP703 SERVICE - Mobile Service[DP]

    题意翻译 Description 一个公司有三个移动服务员.如果某个地方有一个请求,某个员工必须赶到那个地方去(那个地方没有其他员工),某一时刻只有一个员工能移动.只有被请求后,他才能移动,不允许在同 ...

  8. Selenium(二)开发环境的搭建

    1.安装python的开发集成环境 我之前有写,可参考https://www.cnblogs.com/dydxw/p/10405797.html 2.使用selenium打开火狐浏览器 先从selen ...

  9. springboot2.0入门(八)-- profile启动文件配置

    一.不同环境使用不同配置文件 将application.yml文件拷贝三份,在文件末尾分别对应开发/生产/测试,dev/prod/test/文件夹,其中application.yml 中默认激活开发环 ...

  10. 037_自动添加防火墙规则,开启某些服务或端口(适用于 RHEL7)

    #!/bin/bash#设置变量定义需要添加到防火墙规则的服务和端口号#使用 firewall-cmd --get-services 可以查看 firewall 支持哪些服务 service=&quo ...