kdump机制和crash常见使用】的更多相关文章

kdump简介 kdump是系统崩溃的时候,用来转储运行内存的一个工具. 系统一旦崩溃,内核就没法正常工作了,这个时候将由kdump提供一个用于捕获当前运行信息的内核, 该内核会将此时内存中的所有运行状态和数据信息收集到一个dump core文件中以便之后分析崩溃原因. 一旦内存信息收集完成,可以让系统将自动重启. kdump是RHEL5之后才支持的,2006被主线接收为内核的一部分.它的原理简单来说是在内存中保留一块 区域,这块区域用来存放capture kernel,当production…
kdump相关概念 standard(production) kernel   生产内核    ,是指我们正在使用的kernel. Crash(capture)kernel             捕获内核     ,linux系统崩溃后使用的内核. Kdump需要配置两个不同目的的kernel,其中一个我们在这里称作standard(production) kernel:另外一个称之为Crash(capture)kernel.生产内核是捕获内核服务的对像.捕获内核会在生产内核崩溃时启动起来,与…
文章目录 1. 简介 1.1 安装 1.2 触发 kdump 1.3 调试 kdump 1.3.1 安装 debuginfo vmlinux 1.3.2 编译 kernel 1.4 kdump-tools.service 流程分析 2. 原理分析 2.1 elf core 文件格式 3. `/proc/kcore` 3.1 准备数据 3.2 读取 elf core 4. `/proc/vmcore` 4.1 准备 elf header (运行在 normal kernel) 4.1.1 cras…
kdump简介 kdump是系统崩溃的时候,用来转储运行内存的一个工具. 系统一旦崩溃,内核就没法正常工作了,这个时候将由kdump提供一个用于捕获当前运行信息的内核, 该内核会将此时内存中的所有运行状态和数据信息收集到一个dump core文件中以便之后分析崩溃原因. 一旦内存信息收集完成,可以让系统将自动重启. kdump是RHEL5之后才支持的,2006被主线接收为内核的一部分.它的原理简单来说是在内存中保留一块 区域,这块区域用来存放capture kernel,当production…
Technorati 标签: Kernel Panic 出现原因 1. Linux在中断处理程序中,它不处于任何一个进程上下文,如果使用可能睡眠的函数,则系统调度会被破坏,导致kernel panic.因此,在中断处理程序中,是不能使用有可能导致睡眠的函数(例如信号量等). 在中断发起的软中断中,其上下文环境有可能是中断上下文,同理,也不能调用可能导致睡眠的函数.软中断执行时,全局中断是打开的,而中断程序执行时,全局中断是禁止的. 软中断除了系统调度进入点,当软中断数量频繁时,内核中有一个专门的…
1. 为什么会Crash 常见的Crash原因有:访问已经被释放的内存,数组越界,使用!解包值为nil的变量.当遇到这些情况时,说明应用已经遇到了很严重的非预期错误,无法再继续运行.操作系统检测到这些非法操作时会向应用发送对应的信号,而应用对这些信号的默认处理是直接让应用退出(已信号值作为退出码).这样就出现了我们看到的Crash,闪退. 具体的信号种类和信号机制见Unix Signal 2. 如何捕获和处理Crash 在swift3.0中,我们可以通过如下调用来注册对特定信号的处理逻辑. si…
crash简介 crash是redhat的工程师开发的,主要用来离线分析linux内核转存文件,它整合了gdb工具,功能非常强大.可以查看堆栈,dmesg日志,内核数据结构,反汇编等等.crash支持多种工具生成的转存文件格式,如kdump,LKCD,netdump和diskdump.同时crash还可以调试运行时系统,直接运行crash即可. crash安装以及系统配置 1, 配置内核支持kdump 配置内核启动参数 vim /etc/default/grub修改crashkernel=128…
一.简介 思考一下这个场景:如果重做日志可以无限地增大,同时缓冲池也足够大,那么是不需要将缓冲池中页的新版本刷新回磁盘.因为当发生宕机时,完全可以通过重做日志来恢复整个数据库系统中的数据到宕机发生的时刻. 但是这需要两个前提条件:1.缓冲池可以缓存数据库中所有的数据:2.重做日志可以无限增大 因此Checkpoint(检查点)技术就诞生了,目的是解决以下几个问题:1.缩短数据库的恢复时间:2.缓冲池不够用时,将脏页刷新到磁盘:3.重做日志不可用时,刷新脏页. 当数据库发生宕机时,数据库不需要重做…
进程通信是指进程之间的信息交换.PV操作是低级通信方式,例如信号量,主要是进程间以及同一进程内不同线程之间的同步手段.髙级通信方式是指以较高的效率传输大量数据的通信方式.高级通信方法主要有以下三个类. 共享存储 在通信的进程之间存在一块可直接访问的共享空间,通过对这片共享空间进行写/读操作实现进程之间的信息交换.在对共享空间进行写/读操作时,需要使用同步互斥工具(如 P操作.V操作),对共享空间的写/读进行控制.共享存储又分为两种:低级方式的共享是基于数据结构的共享:高级方式则是基于存储区的共享…
strcpy和memcpy有什么区别?strcpy是如何设计的,memcpy呢?   strcpy提供了字符串的复制.即strcpy只用于字符串复制,并且它不仅复制字符串内容之外,还会复制字符串的结束符.(保证dest可以容纳src.) memcpy提供了一般内存的复制.即memcpy对于需要复制的内容没有限制,因此用途更广.   strcpy的原型是:char* strcpy(char* dest, const char* src); char * strcpy(char * dest, co…
原文链接 http://www.cnblogs.com/chenpingzhao/p/5107480.html 一.简介 思考一下这个场景:如果重做日志可以无限地增大,同时缓冲池也足够大,那么是不需要将缓冲池中页的新版本刷新回磁盘.因为当发生宕机时,完全可以通过重做日志来恢复整个数据库系统中的数据到宕机发生的时刻. 但是这需要两个前提条件:1.缓冲池可以缓存数据库中所有的数据:2.重做日志可以无限增大 因此Checkpoint(检查点)技术就诞生了,目的是解决以下几个问题:1.缩短数据库的恢复时…
SpringBoot默认的错误处理机制 即我们常见的白色的ErrorPage页面 浏览器发送的请求头: 如果是其他的请求方式,比如客户端,则相应一个json数据: 原理:是通过 ErrorMvcAutoConfiguration,错误处理的自动配置: 给容器中添加了以下组件 1.DefaultErrorAttributes: 帮我们在页面共享信息: @Override public Map<String, Object> getErrorAttributes(RequestAttributes…
一.反射的理解 (1)正射 在理解反射这个概念之前,我们先来理解Java中的“正射”. 我们在编写代码时,当需要使用到某一个类的时候,必定先会去了解这是一个什么类,是用来做什么的,有怎么样的功能. 之后我们才对这个类进行实例化,之后再使用这个类的实例化对象进行操作. Person person = new Person(); person.sleep("8:00"); (2)反射 上面的栗子介绍了什么是“正射”,以及“正射”的一般代码实现: 而反射则是在代码一开始编写时不知道要初始化的…
java中的fail-fast(快速失败)机制 简介 fail-fast机制,即快速失败机制,是java集合中的一种错误检测机制.当在迭代集合的过程中对该集合的结构改变是,就有可能会发生fail-fast,即跑出ConcurrentModificationException异常.fail-fast机制并不保证在不同步的修改下一定抛出异常,它只是近最大努力去抛出,所以这种机制一般仅用于检测bug fail-fast的出现场景 在我们常见的java集合中就可能出现fail-fast机制,比如常见的A…
在 Android 开发当中,View 的事件分发机制是一块很重要的知识.不仅在开发当中经常需要用到,面试的时候也经常被问到. 如果你在面试的时候,能把这块讲清楚,对于校招生或者实习生来说,算是一块不错的加分项.对于工作几年的我们来说,这是必须掌握的,讲不明白,那你回去等通知吧,哈哈. 目录大概如下: View 事件分发机制简介 View 常见滑动冲突解决 View 双击,多击事件是怎么实现的 手势识别 小结 View 事件分发机制简介 View 触摸事件 对于屏幕的点击,滑动,抬起等一系的动作…
转自:http://my.oschina.net/fgq611/blog/113249 内核开发比用户空间开发更难的一个因素就是内核调试艰难.内核错误往往会导致系统宕机,很难保留出错时的现场.调试内核的关键在于你的对内核的深刻理解. 一  调试前的准备 在调试一个bug之前,我们所要做的准备工作有: 有一个被确认的bug. 包含这个bug的内核版本号,需要分析出这个bug在哪一个版本被引入,这个对于解决问题有极大的帮助.可以采用二分查找法来逐步锁定bug引入版本号. 对内核代码理解越深刻越好,同…
目录[-] 一  调试前的准备 二  内核中的bug 三  内核调试配置选项 1  内核配置 2  调试原子操作 四  引发bug并打印信息 1  BUG()和BUG_ON() 2  dump_stack() 五  printk() 1  printk函数的健壮性 2  printk函数脆弱之处 3  LOG等级 4  记录缓冲区 5  syslogd/klogd 6  dmesg 7 注意 8 内核printk和日志系统的总体结构 9  动态调试 六  内存调试工具 1  MEMWATCH 2…
Linux内核调试方法总结 一  调试前的准备 二  内核中的bug 三  内核调试配置选项 1  内核配置 2  调试原子操作 四  引发bug并打印信息 1  BUG()和BUG_ON() 2  dump_stack() 五  printk() 1  printk函数的健壮性 2  printk函数脆弱之处 3  LOG等级 4  记录缓冲区 5  syslogd/klogd 6  dmesg 7 注意 8 内核printk和日志系统的总体结构 9  动态调试 六  内存调试工具 1  ME…
红帽Linux故障定位技术详解与实例(2) 2011-09-28 14:26 圈儿 BEAREYES.COM 我要评论(0) 字号:T | T 在线故障定位就是在故障发生时, 故障所处的操作系统环境仍然可以访问,故障处理人员可通过console, ssh等方式登录到操作系统上,在shell上执行各种操作命令或测试程序的方式对故障环境进行观察,分析,测试,以定位出故障发生的原因. AD:2014WOT全球软件技术峰会北京站 课程视频发布 3.内核故障情形及处理 (1)内核panic panic是内…
开发语言:rpc编程环境 服务器端:在linux平台下部署 客户端:一般是cli界面下的mount命令 相关包:rpcbind,nfs-utils 背景 http://nfs.sourceforge.net/http://linux-nfs.org/wiki/index.php/Main_Page 相关进程 rpc.idmapd - NFSv4 ID <-> Name Mapper rpc.idmapd is the NFSv4 ID <-> name mapping daemon…
使用 libevent 和 libev 提高网络应用性能 http://www.ibm.com/developerworks/cn/aix/library/au-libev/ libevent实现http client http://blog.csdn.net/foruok/article/details/8936298 libevent多线程使用事项 http://www.cnblogs.com/Seapeak/archive/2010/04/08/1707807.html http://ww…
http://mogu.io/156-156 摘要 本文一是为了讨论在Linux系统出现问题时我们能够借助哪些工具去协助分析,二是讨论出现问题时大致的可能点以及思路,三是希望能给应用层开发团队介绍一些Linux内核机制从而选择更合适的使用策略. 前言 搜索团队的服务器前段时间频繁出现CPU load很高(比如load average达到80多)的情况,正所谓术业有专攻,搜索的兄弟们对Linux底层技术理解的不是很深入,所以这个问题困扰了他们一段时间. 相信我们在遇到问题时都有类似的经历,如果这个…
这篇文章介绍下libevent在socket异步编程中的应用.在一些对性能要求较高的网络应用程序中,为了防止程序阻塞在socket I/O操作上造成程序性能的下降,需要使用异步编程,即程序准备好读写的函数(或接口)并向系统注册,然后在需要的时候只向系统提交读写的请求之后就继续 做自己的事情,实际的读写操作由系统在合适的时候调用我们程序注册的接口进行.异步编程会给一些程序猿带来一些理解和编写上的困难,因为我们通常写的一些 简单的程序都是顺序执行的,而异步编程将程序的执行顺序打乱了,有些代码什么情况…
转自:http://www.cnblogs.com/wwang/archive/2010/11/19/1881304.html 在我的上一篇博文<Linux内核的Oops>的最后介绍到一个Linux内核转储工具Kdump,这个工具可以在发生kernel panic时把现场dump到一个文件里,以供后续分析之用.本文主要介绍在Ubuntu下如何使用kdump. Kdump是一个通用的Linux内核转储工具,详细的用法说明可以参考这篇Kdump Tutorial.这篇教程洋洋洒洒几十页(链接里有p…
前言 前言 从软件测试最终目的发现问题缺陷来看,Findyou比较认同一个观念,测试的能力大致可以划分成三个能力层次:发现问题.定位问题.预防问题.有机会探讨一下这个分类. 发现问题各种方式方法,比如边界值,如何有效提高发现问题的效率?比如APP前后台切换数据为什么容易丢失?什么情况下容易产生OOM? 定位问题要求测试综合能力强,你比如业务熟悉.代码熟悉.平台(比如Linux系统.Android系统)熟悉等均有很强的要求.比如上文的栗子,APP前后台切换界面录入数据丢失,能否通过日志.代码.系统…
这篇文章介绍下libevent在socket异步编程中的应用.在一些对性能要求较高的网络应用程序中,为了防止程序堵塞在socket I/O操作上造成程序性能的下降,须要使用异步编程,即程序准备好读写的函数(或接口)并向系统注冊.然后在须要的时候仅仅向系统提交读写的请求之后就继续做自己的事情.实际的读写操作由系统在合适的时候调用我们程序注冊的接口进行. 异步编程会给一些程序员带来一些理解和编写上的困难,由于我们通常写的一些简单的程序都是顺序运行的.而异步编程将程序的运行顺序打乱了,有些代码什么情况…
作者 | 姚捷(喽哥)阿里云容器平台集群管理高级技术专家 本文节选自<不一样的 双11 技术:阿里巴巴经济体云原生实践>一书,点击即可完成下载. 导读:值得阿里巴巴技术人骄傲的是 2019 年阿里巴巴 双11 核心系统 100% 以云原生的方式上云,完美支撑了 54.4w 峰值流量以及 2684 亿的成交量.背后承载海量交易的计算力就是来源于容器技术与神龙裸金属的完美融合. 集团上云机器资源形态 阿里巴巴 双11 采用三地五单元架构,除 2 个混部单元外,其他 3 个均是云单元.神龙机型经过…
这篇文章介绍下libevent在socket异步编程中的应用.在一些对性能要求较高的网络应用程序中,为了防止程序阻塞在socket I/O操作上造成程序性能的下降,需要使用异步编程,即程序准备好读写的函数(或接口)并向系统注册,然后在需要的时候只向系统提交读写的请求之后就继续 做自己的事情,实际的读写操作由系统在合适的时候调用我们程序注册的接口进行.异步编程会给一些程序猿带来一些理解和编写上的困难,因为我们通常写的一些 简单的程序都是顺序执行的,而异步编程将程序的执行顺序打乱了,有些代码什么情况…
这篇文章介绍下libevent在socket异步编程中的应用.在一些对性能要求较高的网络应用程序中,为了防止程序阻塞在socket I/O操作上造成程序性能的下降,需要使用异步编程,即程序准备好读写的函数(或接口)并向系统注册,然后在需要的时候只向系统提交读写的请求之后就继续 做自己的事情,实际的读写操作由系统在合适的时候调用我们程序注册的接口进行.异步编程会给一些程序猿带来一些理解和编写上的困难,因为我们通常写的一些 简单的程序都是顺序执行的,而异步编程将程序的执行顺序打乱了,有些代码什么情况…
https://www.amazon.com/gp/product/1118887735 The chapter about debugging is rather outdated - it describes LKCD/lcrash environment but all new kernels have kexec/kdump facility and 'crash' is the preferred debugger for those vmcores. Maybe 2.4 kernel…