你好呀, 我是歪歪。

之前不是发布了这篇文章嘛:《千万不要把Request传递到异步线程里面!有坑!》

说的是由于 Request 在 tomcat 里面是复用的,所以如果在一个 Request 的生命周期完成之后,在异步线程里面调用了相关的方法,会导致这个 Request 被污染,然后在下一个请求中观察到一些匪夷所思的场景。

但是文章的评论区里面出现了个问题,还一下把我问住了:

由于我那篇文章关注的重点是把 Request 传递到异步线程这个骚操作,并没有特别的关注 Request 到底是怎么复用的。

我只是通过打印日志的方式去观察到了复用的这个现象:

把项目启动起来之后,分别访问 testRequest 和 testRequest1,从控制台的输出来看,Request 对象确实是一个对象。

但是从前面的线程名称来看,这是线程池里面两个完全不同的线程。

所以,虽然我还啥都没分析呢,基于日志就至少能看出这个问题的答案:

复用的request是和线程绑定的吗?

不是,没有绑定关系。

如果不是和线程绑定,那么问题就随之而来了:

如何决定哪个线程每次复用哪个request呢?

这是个好问题,我也不知道答案,所以我决定来盘一盘它。

但是在盘它之前,我们先想个问题:假设 Request 和请求线程绑定在一起了,这是一个合理的设计吗?

肯定不是的。

线程就应该是单纯的线程,不应该给它“绑定”一个 Request。这种绑定让线程不单纯了,线程和请求耦合在一起了。

好一点的设计应该是 Request 放在一个“池子”里面,来一个线程就从池子里面去取可以用的 Request。

这样可以实现线程和请求之间解耦的效果。

当然,这也只是我在进行探索之前的一个假设而已,先放在这里,最后看看这个猜想是否正确。

看这篇文章不需要你对 Tomcat 有多少了解,会用它就行,很多东西都是可以基于源码推理出来的。

对了,说一下 Tomcat 源码版本:9.0.58。

第一个断点

要找到问题的答案肯定得去翻源码,但是从哪里开始翻呢?

或者换个问题:第一个断点打在哪呢?

遇到这个问题我的第一反应还是从日志里面看看能不能找到相关的线索,从而找到打第一个断点的位置。

但是我分别把日志调整到 DEBUG 级别和 TRACE 级别,均没有发现有价值的信息,所以日志这条路感觉走不通了,怎么办?

不慌,这个时候就要冷静分析一下了。

悄悄的问自己一句:我可以把断点打在方法入口处吗?

当然可以了,这也是能想到的一个非常常规的手段:

但是如果把断点打在这里,相当于从业务代码的第一行反向去推源码,把路绕的稍微远了一点。

那么还可以把断点打在哪里呢?

我这里不是输出了 Request 这个对象的全类名吗:

http-nio-8080-exec-2:testRequest1 = org.apache.catalina.connector.RequestFacade@5db48dd3

RequestFacade,这个类能用,必然有一个 new 它的地方,而要 new 它,必定要调用它的构造方法。

那我是不是只要在其对应的构造方法上打个断点,当程序创建这个类的时候,不就是我要找的源头吗?

所以,我把第一个断点打在了 RequestFacade 的构造方法上。

从构造方法入手,这也是我的一个调试小技巧,送给你,不客气。

有的小伙伴就要问了:如果一个类有多个构造方法怎么办呢?

很简单,大力出奇迹,每个构造方法都打上断点,一定会有一个地方触发的。

调试源码

找到第一个断点的位置了,接下来就是把项目重启,发起调用了。

我连续发起了两次调用,从程序的表现上我就知道这个断点打对了。

我先给你上个动图,你就知道我为什么这么说了:

项目启动之后,第一次调用在断点的地方停下来了,接着第二次调用并没有在断点的地方停下来。

说明第二次确实没有新建 RequestFacade 对象,而是复用了第一次调用时产生的 RequestFacade 对象。

验证了断点打的位置没毛病之后,就可以开始慢慢的调试了。

首先,我们关注一下这个 RequestFacade 对象创建的地方:

有两个 if 判断。

第一个是判断 facade 是否为 null,不为 null 就 new。

第二个是把 facade 赋值给 applicationRequest 对象,接着返回 applicationRequest 对象。

第二个 if 其实很有意思,你想啊,这里直接返回 facade 也可以呀,为什么要用 applicationRequest 来承接一下呢?

这是一个好问题。

这两个 if 的关键在于 facade 和 applicationRequest 是否为空。

第一次访问的时候肯定是空。那么后续什么时候又会变为空呢?

就是在一次请求结束,执行 recycle 方法的时候:

org.apache.catalina.connector.Request#recycle

从源码中可以看到 applicationRequest 是直接设置为 null 的。

但是这个 facade 设置为 null 有个前提,getDiscardFacades 方法返回为 true。

这是个什么玩意?

看一眼就知道了:

意思是 RECYCLE_FACADES 这个参数控制着是否循环使用 facade 这个对象,如果设置为 true 会提高安全性,而这个参数默认是 false。

也就是说我这个地方如果把这个参数修改为 true,facade 对象就会在每次调用完成之后进行回收。

可以通过启动参数JAVA_OPTS来配置:

-Dorg.apache.catalina.connector.RECYCLE_FACADES=true

从前面的源码中可以知道,在默认的情况下,applicationRequest 会在每次请求完成之后设置为 null,而 facade 会保留下来。

因此下一次请求过来的时候,facede 并不为空,直接复用 facade。把 facade 赋值给 applicationRequest

所以我们在日志里面观察到的现象是两次请求输出的 facade 对象是一样的。

接着,我们继续看调用堆栈。

看创建 facade 的这个 getRequest 请求到底是谁在调用:

发现是一个 Request 对象在调用 getRequest 方法。

所以接下来要找的就是 Request 对象最开始是从哪个方法开始作为入参传递的。

顺着调用堆栈,可以找到下面这个地方:

org.apache.coyote.http11.Http11Processor#service

这就是 Request 对象最开始作为入参传递的地方。

那么这个 Request 对象是怎么产生的呢?

我也不知道。

所以,要知道这个问题的答案,第二个断点打的位置也就呼之欲出了:

重启项目,发起请求,发现 Debug 停在了 AbstractProcessor 类的构造方法,这就是 request 最开始产生的地方,同时我们又收获了一个调用堆栈:

org.apache.coyote.AbstractProcessor#AbstractProcessor(org.apache.coyote.Adapter, org.apache.coyote.Request, org.apache.coyote.Response)

这个 Request 是怎么来的呢?

new 出来的:

为什么要执行这个 new 方法呢?

因为这个地方在 createProcessor:

而我们要寻找的问题的答案,就藏在上面这个截图中。

准确的说,就藏在上面截图中,标记了五角星的地方:

processor = recycledProcessors.pop();

从代码的片段看,如果从 recycledProcessors 里面 pop 出的 processor 对象不为空,则不会调用 createProcessor 方法。

而从调试的角度看,不调用 createProcessor 方法,也就不会创建 RequestFacade 对象。

所以,recycledProcessors,这个玩意是华点、是真正的突破口。

这一小节,主要是分享一下我找到这个突破口的一个过程,两个关键的断点是基于上面考虑设置的。

其实你回想一下,这是一个非常顺其自然的事情,带着问题去调试源码是一件比较简单的事情。

不要怂,就是翻。

recycledProcessors

你看这个对象的名称,recycled + Processors,一看就知道里面有故事,有关于对象复用的故事。

org.apache.coyote.AbstractProtocol.RecycledProcessors

这个类的方法也特别简单,就三个方法:push、pop、clear。

继承至 SynchronizedStack 对象,就是一个标标准准的栈结构,只不过是用 Synchronized 修改了对应的方法:

在 SynchronizedStack 类的注释上提到了这是一个对象池、这个对象池不需要缩容、目的是为了减少垃圾对象,释放 GC 压力。

现在我们找到了这个对象池,也找到了调用这个对象池 pop 的地方。

那么什么时候往这个对象池 push 呢?

我也不知道。

所以第三个断点就来了,可以打在 push 方法上:

然后发起调用,发现是在请求处理完成,release 当前 processor 的时候,就把这个 processor 放到 recycledProcessors 里面去,等着下一次请求使用:

此时我们已经掌握了这样的一个闭环:

当请求来了之后,先看 recycledProcessors 这个栈结构里面有没有可用的 processor,没有则调用 createProcessor 方法创建一个新的,接着在请求结束之后,将其放入到栈结构里面。

而在调用 createProcessor 方法的时候,会构建一个新的 Request 对象,最终这个 Request 对象会封装为 RequestFacade 对象。

所以我现在想要验证 Processor、Request 和 RequestFacade 三者之间有这样的一个对应关系。

怎么验证呢?

打印日志。

注意,接下来又是一个调试小技巧了。

我想要在选定 processor 之后,加入一行输出语句:

怎么加呢?

在自己的项目里面创建一个和源码一样的包路径,然后把对应的类直接粘贴过来:

因为是在自己的项目里面,你想怎么改都行:

比如我加入这个输出语句,打印出 processor 和里面的 request。

发起请求之后你会发现确实生效了,但是 reuqest 的输出是这样的:

为什么呢?

因为在源码里面,这个类的 toString 方法被重写了:

怎么办?

改源码啊,刚刚才教你了的:

修改之后发起调用,就可以在控制台看到对应的预期的输出了:

你看,processor 里面有个 request。现在我要找的是 request 和 RequestFacade 之间的关系。

很简单,在 getRequest 方法这里也输出一行:

发起调用之后,发现,完犊子了:

这两个 Request 根本就不是同一个玩意啊:

org.apache.coyote.Request@667cbb30
org.apache.catalina.connector.Request@9ffc697

不要慌,冷静下来细嗦一下,虽然这是两个不同的 Request,但是它们之间一定有着千丝万缕的联系。

先看一下 org.apache.catalina.connector.Request 是怎么来的,老规矩,构造方法上打断点:

基于这个调用堆栈,往前找一点点,就能看到一个值得注意的地方:

org.apache.catalina.connector.CoyoteAdapter#service

在上面截图的这个方法中,有一行这样的代码:

request.setCoyoteRequest(req);

其中 request 是 org.apache.catalina.connector.Request 对象。

而 req 是 org.apache.coyote.Request 对象。

也就是说,我这里的这个输出语句应该是这样的才对:

修改之后,再次发起调用,输出日志是这样的:

如果你还没看出点什么的话,我给你加工一下:

意思就是 Processor 和 RequestFacade 确实是一一对应的。

回到文章最开始的这个截图,为什么我发起两次请求,RequestFacade 对象是同一个呢?

因为两次请求用的是同一个 Processor 呀。

你看我再发起两次请求,都是 Http11Processor@26807016 在处理:

所以,表面上看是同一个 RequestFacade,实质上是用的同一个 Processor。

换句话说:要是两个请求用的是不同的 Processor,就不会存在复用的情况。

怎么验证一下呢?

我想到了下面的这个验证方式:

我可以先请求 sleepTenSeconds,然后在 10s 内请求 testRequest。这样,我就能观察到两个不同的 Processor:

为了更加直观的看到这个现象。

我决定在操作 recycledProcessors 的 pop 方法之前和 push 方法之后,输出一下 recycledProcessors 里面的内容:

org.apache.coyote.AbstractProtocol.RecycledProcessors

但是你按照我这样写的时候会发现: RecycledProcessors 的父类,也就是 SynchronizedStack 类并没有提供 print 方法,怎么办呢?

很简单嘛,源码我都可以拿到,加一个方法,还不是手到擒来的事情?

接着,我还是按照先访问 sleepTenSeconds 再访问 testRequest 方法的顺序发起请求,日志是这样的:

单独拿出来,testRequest 整个请求完成之后,对应的日志是这样的,

========pop之前【开始】打印当前所有Processor========
========pop之前【结束】打印当前所有Processor========
1.processor=org.apache.coyote.http11.Http11Processor@6720055f,request=org.apache.coyote.Request@69e7f7cb
2.coyoteRequest=org.apache.coyote.Request@69e7f7cb,facade=org.apache.catalina.connector.RequestFacade@6dd86e2f
3.http-nio-8080-exec-1:testRequest = org.apache.catalina.connector.RequestFacade@6dd86e2f
========push之后【开始】打印当前所有Processor========
org.apache.coyote.http11.Http11Processor@6720055f
========push之后【结束】打印当前所有Processor========

而 sleepTenSeconds 整个请求完成之后,对应的日志是这样的:

========pop之前【开始】打印当前所有Processor========
========pop之前【结束】打印当前所有Processor========
1.processor=org.apache.coyote.http11.Http11Processor@7ba33829,request=org.apache.coyote.Request@1334fe58
2.coyoteRequest=org.apache.coyote.Request@1334fe58,facade=org.apache.catalina.connector.RequestFacade@2a0231eb
3.http-nio-8080-exec-2:sleepTenSeconds = org.apache.catalina.connector.RequestFacade@2a0231eb
========push之后【开始】打印当前所有Processor========
org.apache.coyote.http11.Http11Processor@6720055f
org.apache.coyote.http11.Http11Processor@7ba33829
========push之后【结束】打印当前所有Processor========

也就是说,此时 recycledProcessors 里面有两个 Processor:

========push之后【开始】打印当前所有Processor========
org.apache.coyote.http11.Http11Processor@6720055f
org.apache.coyote.http11.Http11Processor@7ba33829
========push之后【结束】打印当前所有Processor========

那么问题就来了:你说我接下来再次发起一个请求,哪个 Processor 会来承接这个请求呢?

虽然我还没有发起请求,但是我知道,一定是 Http11Processor@7ba33829 来进行处理。

因为我知道它将是下一个被 pop 出来的 Processor 对象。

不信,你就看这个动图:

在上面的动图中,我先是 testRequest 这个请求。

如果我先访问 sleepTenSeconds,再访问 testRequest 呢?

虽然我还没有发起请求,但是我知道,一定是这样的对应关系来处理这两次请求:

sleepTenSeconds->Http11Processor@7ba33829
testRequest->Http11Processor@6720055f

因为 sleepTenSeconds 请求来的时候,recycledProcessors 里面会 pop 出 Processor@7ba33829 这个对象,来处理这个请求。

所以在 10 秒内,也就是 sleepTenSeconds 请求未完成的时候,访问 testRequest 请求,recycledProcessors 里面接着 pop 出来的 就是 Http11Processor@6720055f 这个对象。

不信的话,你再看这个动图:

所以,现在我们是不是找到这个问题的答案了:

如何决定哪个线程每次复用那个request呢?

请求线程和 request 之间没有关联关系。每次请求使用哪个 request 取决于使用哪个 Processor。而每次请求使用哪个 Processor,取决于 recycledProcessors 类里面缓存了哪些 Processor。请求过来的时候,pop 出来哪个,就是哪个。

recycledProcessors 既然是一个缓存,它的大小,一定程度上决定了项目的性能。

而它的默认值是 200:

为什么是 200 呢?

因为 tomcat 线程池的最大线程数默认就是 200:

这个能想明白吧?

虽然线程和 Processor 之间没有绑定关系,但是从逻辑上讲一个线程对应一个 Processor。因此,好一点的做法是让线程数和 Processor 的数量保持一致。

如果我把 processorCache 这个参数修改为 1:

server.tomcat.processor-cache=1

你说高并发的时候会发生什么事情呢?

很多请求 push 的时候会 push 不进去,从而走到 handler.unregister(processor) 的逻辑里面去:

而这个 unregister 方法,对应的还有一个 register 方法,我一起给你看看:

它们持有的是同一笔 synchronized 锁,说明它们之间有竞争。

我们知道,一个请求结束之后会调用 RecycledProcessors 的 push 方法,而 push 的时候会调用 unregister 方法。

那么问题就来了:register 什么时候调用呢?

其实前面已经出现过了:

一个请求来了,创建完 processor 之后。

所以,当我把 processorCache 设置为 1,高并发的情况下,在不停的调用 register 和 unregister,锁竞争频繁,性能下降。

这个结论,就是我通过翻阅源码得出来的结论,而不是在其他的某个书上或者视频里面得到的一个现成的结论。

这就是翻阅源码的快乐和意义。

回手掏

写到这里的时候,我不由的想起了我在《千万不要把Request传递到异步线程里面!有坑!》这篇文章中踩到的坑。

再看一下这个动图,主要关注两次调用的时候控制台对应的输出:

就是因为在 Request 的生命周期之外使用了它,导致复用的时候出现了问题。

当时我给出的正确方案是使用 Request 的异步编程,也就是 startAsync 和 AsyncContext.complete 方法那一套。

但是这篇文章写完之后,我又想到了两个骚操作。

第一个方法,就藏在我前面说的 RECYCLE_FACADES 这个配置中。

从官方文档上的描述来看这个参数如果设置为 true 会提高安全性,但是它默认是 false。

它怎么提高安全性呢?

就是每次把 RequestFacade 也给回收了。

那我把它改成 true 试一试,看看啥效果:

-Dorg.apache.catalina.connector.RECYCLE_FACADES=true

启动项目,发起调用:

抛出了一个异常。

看到这个异常的时候,我一下就明白了官方文档里面说的“安全性”是什么意思了:你的用法错误了,我给你抛个异常,给你提醒一下,这里需要进行修改,提升安全性。

而第二个是这样的:

server.tomcat.processor-cache=0

你明白我意思吧?

我直接不让你复用了,每次都用新的,绕过复用这个“坑”:

先别管它好不好用,有没有性能问题,你就说在彻底理解了底层逻辑之后,这个操作骚不骚吧。

关于Request复用的那点破事儿。研究明白了,给你汇报一下。的更多相关文章

  1. JSP Servlet中Request与Response所有成员方法的研究

    HttpServletRequest与HttpServletResponse作为Servlet中doGet.doPost等方法中传递的参数,承接了Http请求与响应中的大部分功能,请求的解析与响应的返 ...

  2. 转载 asp.net的Request.ServerVariables参数说明

    转载原地址: http://blog.csdn.net/vincent_void/article/details/7739338 当讨论Request对象内容时,要研究的集合之一就是ServerVar ...

  3. 关于微信小程序的Request请求错误处理

    在学微信小程序的request请求的时候,一开始报“不在以下合法域名列表中,请参考文”的错误,后来又莫名其妙的报“400 Bad Request”错误,经过半天的研究,终于搞定了,把遇到的错误给大家分 ...

  4. Vue中应用CORS实现AJAX跨域,及它在 form data 和 request payload 的小坑处理

    基本概念部分(一):理解CORS 说道Vue的跨域AJAX,我想先梳理一遍CORS跨域,"跨域资源共享"(Cross-origin resource sharing),它是一个W3 ...

  5. 关于CAE的那点儿破事儿【二】

    前面在<关于CAE的那点破事儿>一文中,主要提到了CAE是什么.CAE能做些什么.人在CAE应用中的作用以及CAE从业中应当具有哪些基本素质.然而CAE是一把双刃剑,如果不能在工程应用中很 ...

  6. dedecms代码研究五

    上一次留几个疑问: 1)DedeTagParse类LoadTemplet方法. 2)MakeOneTag到底在搞什么. 从DedeTagParse开始前面,我们一直在dedecms的外围,被各种全局变 ...

  7. Android AdapterView View的复用机制 分析

    对于ListView.GridView相信大家都不陌生,重写个BaseView,实现对于的几个方法,然后就完毕了我们的界面展示.而且在大部分情况下,我们载入特别多的Item也不会发生OOM,大家也都明 ...

  8. jsp九大内置对象之一request

    request对象,目的是用来获取客户端的请求. 主要方法有: request.getMethod();                      // 获取提交请求的方式 request.getPr ...

  9. 用户研究Q&A(1)

    近来,不少同事开始认同用户研究的价值,希望通过接触,理解和研究用户来获取提升产品的有效信息.这绝对是件好事,因为我一直抱持的理念是,研究并不是藏在实验室或者握在少部分人手中的稀罕货,更重要是一种理念和 ...

随机推荐

  1. 1903021121-刘明伟 实验一 19信计JAVA—Markdown排版学习

    项目 内容 班级博客链接 19信计班(本) 作业要求链接 实验一 课程学习目标 学习使用Markdown排版 这个作业帮助我们实现了什么学习目标 学会使用Markdown排版 任务一:在博客园平台注册 ...

  2. 嵌入:CAN

    说下我的学习过程.刚到公司的时候我根本不知道什么是CAN,甚至连以太网和串口通讯都不懂.领导把USBCAN分析仪拿给我,把铜线短接上,用软件在CAN1窗口点下发送,CAN2窗口马上接收到了发送出来的数 ...

  3. unity---点击事件

    点击事件 点击触发的事件脚本 脚本挂载方式 On Click() 如果点击后触发,调用Button物体下,Button_lick脚本中的func函数/func_text 结果

  4. django请求生命周期流程与路由层相关知识

    目录 请求生命周期流程图 路由层之路由匹配 无名有名分组 反向解析 无名有名分组反向解析 路由分发 名称空间 请求生命周期流程图 django请求生命周期流程图 路由层之路由匹配 我们都知道,路由层是 ...

  5. Python 微博搜索爬虫

    微博搜索爬虫 网页分析 由于网页端反爬虫机制比较完善所以才去移动端进行爬虫. url地址:https://m.weibo.cn/ 搜索框,输入关键词进行搜索 对网页进行抓包,找到相关数据 查看数据是否 ...

  6. net core天马行空系列-微服务篇:全声明式http客户端feign快速接入微服务中心nacos

    1.前言 hi,大家好,我是三合,距离上一篇博客已经过去了整整两年,这两年里,博主通关了<人生>这个游戏里的两大关卡,买房和结婚.最近闲了下来,那么当然要继续写博客了,今天这篇博客的主要内 ...

  7. Anaconda新建虚拟环境并添加到Jupyter Notebook

    可参考:https://www.jianshu.com/p/ab9ae548b253 虚拟环境是Python的隔离工作副本.这意味着每个环境都可以具有自己的依赖关系,甚至可以具有自己的Python版本 ...

  8. 001 手把手用Git,Git从入门到上传本地项目到Github,看这篇就够了

    安装git 下载Git 下载好后,一路next即可 安装好后,打开Git bash,进行配置 首先配置自己的身份 git config --global user.name "Name&qu ...

  9. JS:条件语句1

    条件语句: 1.if...else if (condition1) { 当条件 1 为 true 时执行 } else { 当条件 1 不为 true 时执行 } if (condition1) { ...

  10. 如何使用lerna进行多包(package)管理

    为什么要用lerna 将大型代码仓库分割成多个独立版本化的 软件包(package)对于代码共享来说非常有用.但是,如果某些更改 跨越了多个代码仓库的话将变得很 麻烦 并且难以跟踪,并且, 跨越多个代 ...