【原创】经验分享:一个Content-Length引发的血案(almost....)
前言
上周在工作中遇到一个问题,挺有意思,这里记录一下。上周在工作中遇到一个问题,挺有意思,这里记录一下。标题起的很唬人,这个问题差点引发血案,花哥还是很严谨的一个人,后面备注了almost....
在测试环境中,前端调用我们服务一个接口时发现巨慢无比,响应时间超过了30s,简直无法忍受!!
查看日志显示是我们服务在通过Feign
请求调用另一个服务的GET
接口时一直超时,然后重试了一直直到失败。 但是奇怪的是手动通过ip+端口
请求这个超时的GET
接口时却响应速度很快。
这就很奇怪了,之前一直调用好好的接口,怎么现在就一直超时呢?此时的我是满脑子问号。。。
现象
前端调用我们服务(这里叫做服务A
)的一个查询接口,这里前端用的是POST
请求,我们服务又会通过Feign
调用到另一个服务(这里叫做服务B
)的一个接口,这个接口对外提供GET
形式的调用。
从现象上来看就是调用我们服务特别慢,一个请求响应几十秒,具体流程如下:
问题排查
当时脑子中出现的疑惑就是太奇怪了,之前一只调用的接口不应该会出现这种情况,而且手动通过ip+端口
去调用的话响应速度很快的,于是找了服务B
对外开发的同学一起看,因为自己忽略了一些重要的日志信息,所以这里走了不少弯路,在同事的帮助下自己也将这个问题梳理清楚了。
问题的根本原因是我们在GET
请求的Header
中传递了Content-Length
参数,而且服务B近期添加了一个jar
包,jar
中有一个拦截器做了一些事情导致了这个问题。我这里从源码层面上梳理下整个问题的根本原因,以及以后如何避免此类问题!
对于这个问题,自己本地分别启动服务A
和服务B
,以DEBUG
模式启动,发现可以稳定重现,而且可以看到在调用服务B
卡住时候的堆栈信息:
服务A
发起的请求卡住的原因是在awaitLatch()
被挂起了,到了这里才算是找到了问题原因的突破口,下面继续往上一步步跟踪就可以找到问题的所在了,下面会一步步认真分析。
问题原因
这里问题的原因其实是通过上面问题排查反推出来的:
- 前端调用服务端接口时,因为是
post
请求,所以header
中传递的有Content-Length
属性,调用feign
请求时,不论get
还是post
请求,公司底层包中有个Feign
拦截器会将前端请求Header
属性赋值给feign
请求中的Header
,导致我们发送的GET
请求Header
中也含有Content-Length
属性。
ps: 这一点很坑,依赖的底层包加了一个Feign拦截器,我们是通过打印feign请求日志在控制台才看到Content-Length属性的,最后跟踪到这个FeignInterceptor中的
- 服务B刚好依赖了另一个
jar
包,该包中包含一个Filter
拦截器,它会读取发送的请求body
数据,然后做一些日志打印。而且这个jar
包依赖也是他们刚加的,他们使用该包中的其他一些工具类
public class ChannelFilter implements Filter {
public void doFilter(ServletRequest servletRequest, ServletResponse servletResponse, FilterChain filterChain) throws IOException, ServletException {
if (servletRequest instanceof HttpServletRequest) {
requestWrapper = new RequestWrapper((HttpServletRequest)servletRequest);
log.info("Http RequestURL : {}, Method : {}, RequestParam : {}, RequestBody : {}", new Object[]{((HttpServletRequest)servletRequest).getRequestURL(), ((HttpServletRequest)servletRequest).getMethod(), JSON.toJSON(servletRequest.getParameterMap()), ((RequestWrapper)requestWrapper).getBody()});
}
filterChain.doFilter((ServletRequest)requestWrapper, servletResponse);
}
public void destroy() {
}
}
public class RequestWrapper extends HttpServletRequestWrapper {
private static final Logger log = LoggerFactory.getLogger(RequestWrapper.class);
private final String body;
public RequestWrapper(HttpServletRequest request) {
super(request);
StringBuilder stringBuilder = new StringBuilder();
BufferedReader bufferedReader = null;
ServletInputStream inputStream = null;
try {
inputStream = request.getInputStream();
if (inputStream != null) {
bufferedReader = new BufferedReader(new InputStreamReader(inputStream));
char[] charBuffer = new char[4096];
boolean var6 = true;
int bytesRead;
while((bytesRead = bufferedReader.read(charBuffer)) != -1) {
stringBuilder.append(charBuffer, 0, bytesRead);
}
}
} catch (IOException var19) {
log.error(var19.getMessage(), var19);
}
}
}
在执行request body
读取的代码时使用到:
while((bytesRead = bufferedReader.read(charBuffer)) != -1) {
stringBuilder.append(charBuffer, 0, bytesRead);
}
bufferedReader.read()
最终会调用到Tomcat
中org.apache.tomcat.util.net.NioBlockingSelector.read()
的方法读取request
中的body
属性:
int keycount = 1;
while(!timedout) {
if (keycount > 0) { //only read if we were registered for a read
read = socket.read(buf);
if (read != 0) {
break;
}
}
try {
if ( att.getReadLatch()==null || att.getReadLatch().getCount()==0) att.startReadLatch(1);
poller.add(att,SelectionKey.OP_READ, reference);
if (readTimeout < 0) {
att.awaitReadLatch(Long.MAX_VALUE, TimeUnit.MILLISECONDS);
} else {
att.awaitReadLatch(readTimeout, TimeUnit.MILLISECONDS);
}
} catch (InterruptedException ignore) {
// Ignore
}
}
这里因为GET
请求的body
为空,所以socket.read()
返回为0,进而走到att.awaitReadLatch(readTimeout, TimeUnit.MILLISECONDS)
;
protected void awaitLatch(CountDownLatch latch, long timeout, TimeUnit unit) throws InterruptedException {
if ( latch == null ) throw new IllegalStateException("Latch cannot be null");
latch.await(timeout,unit);
}
这里就会调用到LockSuport.parkNanos(time)
接口 直到超时,此时的你们会不会仍然有疑惑,为什么Header
中传递了Content-Length
就会走这个逻辑链路呢?别急,继续往下看,后面还有更精彩的分析......
解决方案
服务B
取消有问题jar
包的依赖- 修改问题
jar
包中Filter
的配置,判断只有Post
请求才去读取body
属性 - 接口调用方添加配置如果是
GET
请求时过滤掉Content-Length
属性(主要原因) - 修改底层依赖包
FeignInterceptor
,判断请求的方式然后再针对Header
赋值(公司底层依赖的包我们不太好修改)
其实最应该修改的是方案4,只是这个是全公司都会依赖的一个底层包,如果改动起来需要通知架构组等等,而且影响面会比较大。
最终我们先采用方案3,在我们请求链路中去做一些判断,去除GET
请求中Content-Length
的传递。
解决原理
接下来就是真正原理的地方了,当服务端发出feign
请求后,一定会走Tomcat
中的org.apache.coyote.http11.Http11Processor.prepareRequest()
方法,代码如图:
如果contentLength >= 0
,那么会添加一个org.apache.coyote.http11.filters.IdentityInputFilter
类,在服务B
添加的jar
包中的RequestWrapper
中的bufferedReader.read()
会调用到 org.apache.coyote.http11.filters.IdentityInputFilter.doRead()
方法:
这个方法又会直接调用到 org.apache.tomcat.util.net.NioBlockingSelector.read()
中:
因为GET
请求的request body
为空,所以这里通过socket
去读取时返回为0,直接运行下面的awaitReadLatch()
方法,这里会调用LockSuport.parkNanos(time)
接口 直到超时,这也是为什么我们每次feign
请求都会超时的原因。
但是如果服务请求方配置了传递的Content-Length
为空呢?这里会构造一个org.apache.coyote.http11.filters.VoidInputFilter
,这个拦截器的构造在上面Http11Processor.prepareRequest()
图示中已经标明:
显而易见,这里直接返回-1,不会再去调用NioBlockingSelector.read()
方法了,所以成功解决此问题,这也是问题的关键所在。
总结
这里没有过多的去介绍Content-Length
的概念,默许大家都知道这个,如果不太清楚的还可以参考:
https://blog.piaoruiqing.com/2019/09/08/do-you-know-content-length/
一个简单的Content-Length
确实难住了我,请求的不规范才是这次问题的真正原因。而排查出来这个问题也花费了很多时间,不过这些都是挺值得的,一个人的成长离不开各种问题的洗礼,希望大家阅读完也会有所收获。
欢迎关注:
【原创】经验分享:一个Content-Length引发的血案(almost....)的更多相关文章
- 【原创经验分享】JQuery(Ajax)调用WCF服务
最近在学习这个WCF,由于刚开始学 不久,发现网上的一些WCF教程都比较简单,感觉功能跟WebService没什么特别大的区别,但是看网上的介绍,就说WCF比WebService牛逼多少多少,反正我刚 ...
- 【原创经验分享】WCF之消息队列
最近都在鼓捣这个WCF,因为看到说WCF比WebService功能要强大许多,另外也看了一些公司的招聘信息,貌似一些中.高级的程序员招聘,都有提及到WCF这一块,所以,自己也关心关心一下,虽然目前工作 ...
- 一个由正则表达式引发的血案 vs2017使用rdlc实现批量打印 vs2017使用rdlc [asp.net core 源码分析] 01 - Session SignalR sql for xml path用法 MemCahe C# 操作Excel图形——绘制、读取、隐藏、删除图形 IOC,DIP,DI,IoC容器
1. 血案由来 近期我在为Lazada卖家中心做一个自助注册的项目,其中的shop name校验规则较为复杂,要求:1. 英文字母大小写2. 数字3. 越南文4. 一些特殊字符,如“&”,“- ...
- 转:一个Sqrt函数引发的血案
转自:http://www.cnblogs.com/pkuoliver/archive/2010/10/06/1844725.html 源码下载地址:http://diducoder.com/sotr ...
- 一个Sqrt函数引发的血案(转)
作者: 码农1946 来源: 博客园 发布时间: 2013-10-09 11:37 阅读: 4556 次 推荐: 41 原文链接 [收藏] 好吧,我承认我标题党了,不过既然你来了, ...
- 【转载】一个Sqrt函数引发的血案
转自:http://www.cnblogs.com/pkuoliver/archive/2010/10/06/sotry-about-sqrt.html 源码下载地址:http://diducoder ...
- 一个Sqrt函数引发的血案
源码下载地址:http://diducoder.com/sotry-about-sqrt.html 好吧,我承认我标题党了,不过既然你来了,就认真看下去吧,保证你有收获. 我们平时经常会有一些数据运算 ...
- 一个数字键盘引发的血案——移动端H5输入框、光标、数字键盘全假套件实现
https://juejin.im/post/5a44c5eef265da432d2868f6 为啥要写假键盘? 还是输入框.光标全假的假键盘? 手机自带的不用非得写个假的,吃饱没事干吧? 装逼?炫技 ...
- 【原创】经验分享:一个小小emoji尽然牵扯出来这么多东西?
前言 之前也分享过很多工作中踩坑的经验: 一个线上问题的思考:Eureka注册中心集群如何实现客户端请求负载及故障转移? [原创]经验分享:一个Content-Length引发的血案(almost.. ...
- Expression Blend4经验分享:制作一个简单的图片按钮样式
这次分享如何做一个简单的图片按钮经验 在我的个人Silverlight网页上,有个Iphone手机的效果,其中用到大量的图片按钮 http://raimon.6.gwidc.com/Iphone/de ...
随机推荐
- 基于Qt实现的TCP端口数据转发服务器
对于Qt,比较喜欢qt的sdk框架,我也是用于做一些工作中用到的工具软件,基于qt的sdk做起来也比较快: 一.概述 今天要说的这个tcp端口转发服务器,主要是用于将监听端口的数据转发到另外一个服务器 ...
- Spring Security学习笔记一
一.使用Spring Security 1.在pom 文件中添加Spring Security的依赖. <dependency> <groupId>org.springfram ...
- 004_自己尝试go语言中的方法
go语言可以给任意类型定义方法,我在学习过程中,一开始一头雾水,但是随着理解的深入,现在也大概知道了什么叫做方法 之前的一些例子其实讲的并不是特别生动,下面我用一个生动的例子演示一下 首先提出需求.我 ...
- Spring Boot 数据缓存 - EhCache
EhCache 集成 EhCache 是一个纯 Java 的进程内缓存框架,具有快速.精干等特点,是 Hibernate 中默认的 CacheProvider. 在 Spring Boot 中集成 E ...
- Devops 原始思想 所要实现的目标
解释: DevOps(Development和Operations的组合词)是一组过程.方法与系统的统称,用于促进开发(应用程序/软件工程).技术运营和质量保障(QA)部门之间的沟通.协作与整合. 它 ...
- Q#–一个新年愿望清单
本文章为机器翻译.https://blogs.msdn.microsoft.com/visualstudio/2018/12/24/qsharp-wish-list-for-new-year/# 在以 ...
- python中os模块操作
学习时总结的一些常用方法>>>> 目录函数 os.getcwd() 返回当前工作目录 os.chdir() 改变工作目录 os.listdir(path="path& ...
- GUAVA-cache实现
GUAVA Cache Guava Cache与ConcurrentMap很相似基于分段锁及线程安全,但也不完全一样.最基本的区别是ConcurrentMap会一直保存所有添加的元素,直到显式地移除 ...
- 你真的会做 2 Sum 吗?| 含双重好礼
小预告:文末有两份福利,记得看到最后哦- 2 Sum 这题是 Leetcode 的第一题,相信大部分小伙伴都听过的吧. 作为一道标着 Easy 难度的题,它真的这么简单吗? 我在之前的刷题视频里说过, ...
- C++ Templates 目录
第1部分 : 基本概念 第1章 函数模板 1.1 初识函数模板 1.1.1 定义模板 1.1.2 使用模板 1.1.3 二阶段翻译 1.2 模板参数推导 1.3 多模板参数 1.3.1 返回类型的模板 ...