一.概述 Linux 内核(以下简称内核)是一个不与特定进程相关的功能集合,内核的代码很难轻易的在调试器中执行和跟踪.开发者认为,内核如果发生了错误,就不应该继续运 行.因此内核发生错误时,它的行为通常被设定为系统崩溃,机器重启.基于动态存储器的电气特性,机器重启后,上次错误发生时的现场会遭到破坏,这使得查找 内核的错误变得异常困难. 线上的k8s集群,有时候回出现重启的现象,但是什么原因导致重启,无法得知. Kdump Kdump 是一种基于 kexec 的内存转储工具,目前它已经被内核主线接…