前言

这篇文章从实际问题 → 问题解决步骤 → 问题解决思路,帮助大家能够明白如何在程序中发现问题,定位问题,解决问题。并真正理解那些问题解决思路。

首先说说这个实际问题是什么,又是怎么遇到的。

我这边做了一个操作日志模块,需要提供独立查询页面。正好集团内部有一个xxx前端产品,可以简单配置就生成一个报表页面。

但是由于该产品请求http接口时,会自动加入一个“sorts=[]”的参数,作为报表排序的依据。但是悲剧发生了。请求后,后端服务器返回一个400-bad request。

而xxx前端产品的mock数据就没问题。说明是后端差异造成的。所以需要后端优先解决。

定位问题

断点定位

通过远程debug(因为是部署到远程预发环境的),进行断点查看。
首先将断点打在对应Controller上,发现没用。
紧接着将断点打在了DispatcherServlet的doService方法上,发现还是没用。

那么再往前就不是SpringBoot这样的应用服务范围了,而是属于Tomcat这样的Web服务范围了。
于此同时,我们发现400请求的页面与tomcat的错误页面很相似。由于很久没有看到tomcat错误页面,所以并没有在第一时间察觉。

资料查询

这时候,已经很难通过断点方式进行查询了。但是我们已经有一定的把握将问题定位在tomcat这一web容器了。并且通过之前的接口测试,确定问题发生在“[”这样字符上。
所以,直接通过百度查询“tomcat 非法字符 400“这样的关键字,找到了如下的博客:
解决springboot项目请求出现非法字符问题 java.lang.IllegalArgumentException:Invalid character found in the request target. The valid characters are defined in RFC 7230 and RFC 3986

根据博客中给出的方法,加入TomcatConfiguration这一配置类:

/**
* @author: zw
* @create: 2019-06-27 11:19
**/
@Configuration
public class TomcatConfig { @Bean
public TomcatServletWebServerFactory webServerFactory() {
TomcatServletWebServerFactory factory = new TomcatServletWebServerFactory();
factory.addConnectorCustomizers((Connector connector) -> {
connector.setProperty("relaxedPathChars", "\"<>[\\]^`{|}");
connector.setProperty("relaxedQueryChars", "\"<>[\\]^`{|}");
});
return factory;
}
}

这里说一下,为什么没有采用其他博客所说的修改tomcat的配置文件。因为这种偏底层的改变,在大公司里面实现是非常麻烦的。所以优先考虑通过应用服务自身的设置完成。

但是,问题到这里就真的结束了嘛?
当然没有。如果只是如此,我只需要转载上面那篇博客就OK了。

版本冲突

问题发生

当时,通过上述方法,在本地的demo已经解决了问题。
但是,集团内部的xxx平台无法成功将代码部署到日常环境。查看错误日志,并没有看到有效的信息。只是一些ClassNotFound等异常,但并没有具体信息。

问题定位

简单搜索一下相关异常,看到一个关键字眼-版本冲突。
结合之前TomcatConfiguration引入的依赖,唯一可能存在问题的就是下面这条依赖:
import org.springframework.boot.web.embedded.tomcat.TomcatServletWebServerFactory;

该依赖,来自SpringBoot 2.x。之前引入该依赖时,比较担心的是系统采用的是集团内部的xxxboot,可能不兼容。但是后来发现系统有引入SpringBoot,所以就没有担心了。
现在看来,这里还是存在问题。
通过maven,发现:原项目采用的是SpringBoot1.x,而不是SpringBoot2.x,所以才会在启动时,产生版本冲突问题。

问题解决

确定问题位置后,接下来就是解决问题。
但是比较尴尬的是,SpringBoot1.x没有TomcatConfiguration所需要的TomcatServletWebServerFactory。

所以,接下来就是寻找SpringBoot1.x版本的解决方案。

首先谷歌”SpringBoot1.x tomcat configuration“(这种偏原理的,优先考虑谷歌。尤其是有这个网络条件,并且英文看得懂),找到以下博客:

How to Configure Spring Boot Tomcat

但是并没有找到直接的解决方案(相信这也是大家经常遇到的情况)。

这个时候,看到tomcat存在一个application.properties配置项:
server.tomcat.accesslog.enabled=true

因为TomcatConfiguration是@Configuration修饰的配置类,所以直接在实际项目代码(SpringBoot1.x)的application.properties增加该属性,通过属性跳转,跳到ServerProperties(位于org.springframework.boot.autoconfigure.web下)。

直接搜索tomcat,发现了TomcatEmbeddedServletContainerFactory,而这与SpringBoot2.x所使用的TomcatServletWebServerFactory很类似。
打开代码,发现两者都继承自AbstractEmbeddedServletContainerFactory,并实现了ResourceLoaderAware接口。

所以针对之前的解决方案,修改成下面样子就OK了。

package tech.jarry.learning.birdlog.birdlog.config;

import org.apache.catalina.connector.Connector;
//import org.springframework.boot.web.embedded.tomcat.TomcatServletWebServerFactory;
import org.springframework.boot.context.embedded.tomcat.TomcatEmbeddedServletContainerFactory;
import org.springframework.context.annotation.Bean;
import org.springframework.context.annotation.Configuration; /**
* Tomcat配置类:SpringBoot1.x下,解决Tomcat对非法字符返回400问题
* @author: jarry
**/
@Configuration
public class TomcatConfiguration { @Bean
public TomcatEmbeddedServletContainerFactory webServerFactory() {
TomcatEmbeddedServletContainerFactory factory = new TomcatEmbeddedServletContainerFactory();
factory.addConnectorCustomizers((Connector connector) -> {
connector.setProperty("relaxedPathChars", "\"<>[\\]^`{|}");
connector.setProperty("relaxedQueryChars", "\"<>[\\]^`{|}");
});
return factory;
}
}

总结

至此,tomcat非法字符请求直接返回400的问题,就在SpringBoot1.x版本下解决了。

但是,如果只是到此为止,不再向前一步就太可惜了。就如同百米赛跑,跑到99米为止,放弃了。

问题的解决固然重要,但是更重要的是解决问题的思路。因为问题千千万万,每个问题的解决方法可能都不一样。而解决问题的思路才是有限的,才有最为宝贵的。

所以,让我们复盘一下上述问题的解决思路:

tomcat对非法字符返回400

  1. 通过远程debug的断点,将问题范围确定在应用服务之前,进而判断大概率在tomcat(当然也可能是在应用服务前的nginx等。不过在当前场景优先排查tomcat)。
  2. 通过400错误页面的样式,联想到tomcat其他错误页面,猜测问题发生在tomcat。
  3. 通过资料查询,网站搜索,找到初步解决方案(这里需要重视搜索关键词,关键词的准确性决定了查询效率)

SpringBoot版本冲突问题

  1. 通过日志中的错误信息,配合搜索引擎,猜测错误是由于版本冲突造成。
  2. 通过代码的增量,判断问题发生在SpringBoot2.x的依赖上。
  3. [可选] 这里可以通过demo,确定问题是否版本冲突造成(这里的demo必须精准,否则就多准备几个)。
  4. 通过maven查看项目依赖树,确定是由于SpringBoot2.x与SpringBoot1.x的版本冲突造成。
  5. 查询资料,没有明确解决方案直接指向。
  6. 通过提示的tomcat配置信息,找到ServerProperties类
  7. 在ServerProperties类中,寻找Tomcat相关的类。
  8. 最终找到TomcatEmbeddedServletContainerFactory,两者父类与接口吻合,并且可以直接替换原有的TomcatServletWebServerFactory

事后思考了一下,发现上述5-8可以更加简单。那就是直接查询SpringBoot1.x中类似TomcatServletWebServerFactory的类。

具体方法就是明确TomcatServletWebServerFactory的父类AbstractEmbeddedServletContainerFactory(实际功能)与接口ResourceLoaderAware(资源注入)。
在SpringBoot1.x中直接查找AbstractEmbeddedServletContainerFactory子类即可(发现有三个,分别对应Tomcat,Netty与Undertow,都实现了ResourceLoaderAware接口)。不过需要确认是否可以直接使用,还是需要再进行转化等。

小结

再将上述步骤浓缩一下,就是大家常见的:

  • 查询资料
  • debug,打断点
  • 代码跳转
  • 联想
  • 单一变量进行筛选
  • ...

相信上面这类总结,大家见得多了。但是真正落实后,效率确实差别很大的。

这篇文章,从实际问题 → 问题解决步骤 → 问题解决思路,帮助大家能够真正明白如何在程序中发现问题,定位问题,解决问题,理解问题解决思路。如果可以的话,希望大家更进一步,学到如何进行这样的总结。

愿与诸君共进步。

十分钟通过一个实际问题,真正教会大家如何解决Bug的更多相关文章

  1. 十分钟开发一个调用Activity的PhoneGap插件

    在HybridApp开发中,非常多业务我们是没有办法通过HTML5+js实现的,比方调用第三方的包括Activity的jar包,一些必须使用原生代码才干实现的功能,比方复杂的UI的效果,调用通讯相关的 ...

  2. 十分钟通过 NPM 创建一个命令行工具

    大过年的,要不要写点代码压压惊?来花十分钟学一下怎么通过 NPM 构建一个命令行工具. 写了一个小 demo,用于代替 touch 的创建文件命令 touchme ,可以创建自带“佛祖保佑”注释的文件 ...

  3. 【NLP】十分钟快览自然语言处理学习总结

    十分钟学习自然语言处理概述 作者:白宁超 2016年9月23日00:24:12 摘要:近来自然语言处理行业发展朝气蓬勃,市场应用广泛.笔者学习以来写了不少文章,文章深度层次不一,今天因为某种需要,将文 ...

  4. 十分钟轻松让你认识ASP.NET MVC6

    这篇文章说明下如何在普通编辑器下面开发mvc6应用程序. 上篇文章: 十分钟轻松让你认识ASP.NET 5(MVC6) 首先安装mvc6的nuget包: 可以看到在project.json文件中添加了 ...

  5. 十分钟轻松让你认识ASP.NET 5(MVC6)

    ASP.NET 5差不多快发布了.自己也学习了有两个月了.今天给没有接触asp.net 5的同学写一个简单地十分钟教程,教你认识一下asp.net 5. 1.安装kvm 首先,你需要以管理员权限打开c ...

  6. 十分钟了解分布式计算:Google Dataflow

    介绍 Google Cloud Dataflow是一种构建.管理和优化复杂数据处理流水线的方法,集成了许多内部技术,如用于数据高效并行化处理的Flume和具有良好容错机制流处理的MillWheel.D ...

  7. 十分钟了解分布式计算:GraphX

    GraphX原型论文 GraphX是Spark中用于图(e.g., Web-Graphs and Social Networks)和图并行计算(e.g., PageRank and Collabora ...

  8. 快速入门:十分钟学会Python

    初试牛刀 假设你希望学习Python这门语言,却苦于找不到一个简短而全面的入门教程.那么本教程将花费十分钟的时间带你走入Python的大门.本文的内容介于教程(Toturial)和速查手册(Cheat ...

  9. 十分钟入门less(翻译自:Learn lESS in 10 Minutes(or less))

    十分钟入门less(翻译自:Learn lESS in 10 Minutes(or less)) 注:本文为翻译文章,因翻译水平有限,难免有缺漏不足之处,可查看原文. 我们知道写css代码是非常枯燥的 ...

随机推荐

  1. Visio2013 专业版激活码和激活工具 亲测有效

    Visio2013密钥 专业版:Visio Professional 2013 KEY C2FG9-N6J68-H8BTJ-BW3QX-RM3B3 2NYF6-QG2CY-9F8XC-GWMBW-29 ...

  2. 模块 psutil 系统信息获取

    psutil模块介绍 psutil是一个开源切跨平台的库,其提供了便利的函数用来获取才做系统的信息,比如CPU,内存,磁盘,网络等.此外,psutil还可以用来进行进程管理,包括判断进程是否存在.获取 ...

  3. what the fuck!(二分查找 / 暴力模拟)

    what the fuck! Description 现在有一家公司有nnn个员工(nnn为奇数),他们的工资发放是基本工资+提成,现在这家公司计划再招一批人.要写一篇招聘启事,但是对于这个招聘启事中 ...

  4. SWUSTOJ 960A题总结,又完成一个讨厌的题,内含链表操作启发

    今天debug了一个nice代码,先码在这里,SWUST OJ960 双向链表的操作问题 1000(ms) 10000(kb) 2994 / 8244 建立一个长度为n的带头结点的双向链表,使得该链表 ...

  5. 多线程之旅(Task 任务)

    一.Task(任务)和ThreadPool(线程池)不同       源码 1.线程(Thread)是创建并发工具的底层类,但是在前几篇文章中我们介绍了Thread的特点,和实例.可以很明显发现局限性 ...

  6. DALI 48V驱动

    DALI-CC-30W-48V技术手册 产品名称:DALI-CC-30W-48V 支持协议:IEC 62386-101:2018,IEC 62386-102:2018,IEC 62386-207:20 ...

  7. 从一个慢查询到MySQL字符集编码

    从一个慢查询到MySQL字符集编码 目录 从一个慢查询到MySQL字符集编码 1. 问题起源 2. MySQL字符集和字符集排序规则 2.1 字符集相关概念 2.2 MySQL中的字符集和字符集排序规 ...

  8. Hadoop在Ubuntu的安装和使用

    由于小编在本学期有一门课程需要学习hadoop,需要在ubuntu的linux系统下搭建Hadoop环境,在这个过程中遇到一些问题,写下这篇博客来记录这个过程,并把分享给大家. Hadoop的安装方式 ...

  9. 【Selenium06篇】python+selenium实现Web自动化:日志处理

    一.前言 最近问我自动化的人确实有点多,个人突发奇想:想从0开始讲解python+selenium实现Web自动化测试,请关注博客持续更新! 这是python+selenium实现Web自动化第六篇博 ...

  10. 玩家的numpertpry 对象 中 不仅仅要同步 君主武将的等级,阶级也要同步

    因为好多列表 中 需要 批量查询 玩家的等级 和阶级(用来显示玩家icon颜色用的),如果阶级 在numperty 中已同步 的话,就不用批量去查玩家武将列表了.同理如果其他属性也经常用的话也可以同步 ...