首先需要介绍一下,阅读此文需要有基本的汇编知识。
1、rbp(基址寄存器),rsp(堆栈寄存器),rip(指令寄存器).
2、程序执行时,没有遇到函数调用时,IP自增长,遇到函数调用时,
需要保存bp,ip寄存器到栈上,函数调用结束时,恢复。(这个过程的细节需要很清楚)
(注:因此需要简单描述一下,函数调用时的步骤。
第一,将函数执行完成后的下一条指令的地址存放进当前rsp的位置,(即结束时,ret命令利用此信息恢复rip)
第二,进入函数后,保存当前rsp到rbp寄存器中,原因是rsp需要随时变化(结束时,需要将堆栈位置还原) )
 
两年前,有XX专家,来讲述了一下关于无堆栈信息core文件的定位方法。
没有留下任何文档,也没有讲述原理。
告知了可以使用如下方法来进行排查:
根据寄存器rbp里的地址,对临近区域的内存进行排查,查询出最近的内容为0x004xxxxx的指令,
在gdb中用x/i 0x004xxxxx来查询为何指令(函数)。该函数可能为越界出现问题的地方,可以走查代码来排查。
之后,我也根据此线索推导出了原理,但一直没有形成总结。今天,详细说明此中原委。
 
软件平台:
No LSB modules are available.
Distributor ID:Ubuntu
Description:Ubuntu 12.04.3 LTS
Release:12.04
Codename:precise
 
简单程序如下:
#include <iostream>
using namespace std;
 
void test(int n)
{
    cout << n << endl;
    //rbp
    *(int*)(&n + 1) = 3;
    *(int*)(&n + 2) = 4;
    //rip
    *(int*)(&n + 3) = 4;
 
}
 
void caller()
{
    test(20);
    cout << "caller" << endl;
}
 
int main()
{
    caller();
    cout << "main" << endl;
    return 0;
}
 
----------------------------------------------
(gdb) x/32ux $rbp
0x7fffffffe510:0xffffe520 0x00007fff 0x00400865 0x00000000
0x7fffffffe520:0xffffe530 0x00007fff 0x0040088c 0x00000000
0x7fffffffe530:0x00000000 0x00000000 0xf773876d 0x00007fff
 ----------------------------------------------
(gdb) disas caller
Dump of assembler code for function caller():
   0x0000000000400857 <+0>:push   %rbp
   0x0000000000400858 <+1>:mov    %rsp,%rbp
   0x000000000040085b <+4>:mov    $0x14,%edi
   0x0000000000400860 <+9>:callq  0x400804 <test(int)>
   0x0000000000400865 <+14>:mov    $0x4009fc,%esi
   0x000000000040086a <+19>:mov    $0x601060,%edi
   0x000000000040086f <+24>:callq  0x4006f0 <_ZStlsISt11char_traitsIcEERSt13basic_ostreamIcT_ES5_PKc@plt>
   0x0000000000400874 <+29>:mov    $0x400710,%esi
   0x0000000000400879 <+34>:mov    %rax,%rdi
   0x000000000040087c <+37>:callq  0x400700 <_ZNSolsEPFRSoS_E@plt>
   0x0000000000400881 <+42>:pop    %rbp
   0x0000000000400882 <+43>:retq 
(gdb) disas main
Dump of assembler code for function main():
   0x0000000000400883 <+0>: push   %rbp
   0x0000000000400884 <+1>: mov    %rsp,%rbp
   0x0000000000400887 <+4>: callq  0x400857 <caller()>
   0x000000000040088c <+9>: mov    $0x400a03,%esi
   0x0000000000400891 <+14>: mov    $0x601060,%edi
   0x0000000000400896 <+19>: callq  0x4006f0 <_ZStlsISt11char_traitsIcEERSt13basic_ostreamIcT_ES5_PKc@plt>
   0x000000000040089b <+24>: mov    $0x400710,%esi
   0x00000000004008a0 <+29>: mov    %rax,%rdi
   0x00000000004008a3 <+32>: callq  0x400700 <_ZNSolsEPFRSoS_E@plt>
   0x00000000004008a8 <+37>: mov    $0x0,%eax
   0x00000000004008ad <+42>: pop    %rbp
   0x00000000004008ae <+43>: retq
 
根据$rbp表明,当前实际应该是执行到了 main()函数的0x000000000040088c <+9>: mov    $0x400a03,%esi的上一条指令(caller()函数)
的0x0000000000400865 <+14>:mov    $0x4009fc,%esi的上一条0x0000000000400860 <+9>:callq  0x400804 <test(int)>中。
 
在coredump以后。
------------------------------------------------------
(gdb) info register
rax            0x7fffffffe518 140737488348440
rbx            0x0 0
rcx            0x7ffff77fd910 140737345739024
rdx            0x0 0
rsi            0x7ffff7ad1ab0 140737348704944
rdi            0x7ffff7ad0260 140737348698720
rbp            0x400000003 0x400000003
rsp            0x7fffffffe520 0x7fffffffe520
r8             0x7ffff7202740 140737339467584
r9             0x7ffff7202740 140737339467584
r10            0x7fffffffe280 140737488347776
r11            0x7ffff7785c90 140737345248400
r12            0x400720 4196128
r13            0x7fffffffe610 140737488348688
r14            0x0 0
r15            0x0 0
rip            0x4 0x4
eflags         0x216 [ PF AF IF ]
cs             0x33 51
ss             0x2b 43
ds             0x0 0
es             0x0 0
fs             0x0 0
gs             0x0 0
------------------------------------------------------
根据core文件的寄存器信息,可知,bp及ip均已写飞。只能利用sp指针来查询。
------------------------------------------------------
(gdb) x/32ux $rsp
0x7fffffffe520: 0xffffe530 0x00007fff 0x0040088c 0x00000000
(gdb) x/i 0x0040088c
   0x40088c <main()+9>: mov    $0x400a03,%esi
(gdb) disas main
Dump of assembler code for function main():
   0x0000000000400883 <+0>: push   %rbp
   0x0000000000400884 <+1>: mov    %rsp,%rbp
   0x0000000000400887 <+4>: callq  0x400857 <caller()>
   0x000000000040088c <+9>: mov    $0x400a03,%esi
------------------------------------------------------
由此,可以查出是core在了main函数中。
 
例子使用的最简单的,实际测试时,会有多层调用,但是原理不变。
 
限制:如果越界的长度超过了函数调用堆栈的长度,本方法则不再可用。
 
以后补个图。今天就到这里了
 
 

core文件无堆栈信息定位的思路的更多相关文章

  1. GDB调试之core文件(如何定位到Segment fault)

    core dump又叫核心转储,当程序运行过程中发生异常,程序异常退出时,由操作系统把程序当前的内存状况存储在一个core文件中,叫core dump.(内部实现是:linux系统中内存越界会收到SI ...

  2. Core文件作用、设置及用法

    http://blog.csdn.net/lanmolei814/article/details/45201693 ====================================== 1.C ...

  3. 如何设置、查看以及调试core文件

    http://blog.csdn.net/xiaoxiaoniaoer1/article/details/7740820 1.core文件的生成开关和大小限制--------------------- ...

  4. Linux上调试core文件(Good)

    coredump文件 什么是coredump? 通常情况下coredmp包含了程序运行时的内存,寄存器状态,堆栈指针,内存管理信息等.可以理解为把程序工作的当前状态存储成一个文件.许多程序和操作系统出 ...

  5. GDB调试core文件(2)

    使用gdb和core dump迅速定位段错误 关键字:gdb.段错误.core dump 一.什么是core dump core:内存.核心的意思: dump:抛出,扔出: core dump:前提: ...

  6. GDB Core,gdb 调试大全,core文件调试

    编译: gcc -g -o hello hello.c gdb 调试: 基本 gdb 命令. 命 令 描 述 小结:常用的gdb命令 backtrace 显示程序中的当前位置和表示如何到达当前位置的栈 ...

  7. Linux 如何使用gdb 查看core堆栈信息

    转载:http://blog.csdn.net/mergerly/article/details/41994207 core dump 一般是在segmentation fault(段错误)的情况下产 ...

  8. 如何在没有core文件的情况下用dmesg+addr2line定位段错误

    前言 在现网环境下,程序奔溃后不一定会留下core文件,原因有很多,比如存储空间不足就是其中一个常见的原因.此时我们只能依据linux记录的错误日志来定位问题. 涉及linux命令 本文涉及以下几条命 ...

  9. Java内存泄漏分析系列之一:使用jstack定位线程堆栈信息

    原文地址:http://www.javatang.com 前一段时间上线的系统升级之后,出现了严重的高CPU的问题,于是开始了一系列的优化处理之中,现在将这个过程做成一个系列的文章. 基本概念 在对J ...

随机推荐

  1. BZOJ 4028: [HEOI2015]公约数数列 分块

    4028: [HEOI2015]公约数数列 题目连接: http://www.lydsy.com/JudgeOnline/problem.php?id=4028 Description 设计一个数据结 ...

  2. 研究人员发现绝大部分酷派(Coolpad)手机暗藏后门(转)

    隐私问题被曝光得越来越多,随着物联网的发展,只会变得越来越严重,不过从当前看来 ,国人对隐私的重视度还远没有国外,期待加强对隐私的保护策略.   转自:http://www.freebuf.com/n ...

  3. JavaScript 开发的45个技巧2

    http://mp.weixin.qq.com/s?src=3&timestamp=1474692926&ver=1&signature=agI3W5rKmVC6GgbdTXh ...

  4. MySQL优化之如何了解SQL的执行频率

    http://www.jb51.net/article/50180.htm show [session|global] status 可以根据需要加上参数“ session ”或者“ global ” ...

  5. Visual Studio中 sln 和 suo 文件

    我们通过双击.sln加载出我们的工程,Visual Studio采用两种文件类型(.sln和.suo)来存储解决方案的设置,它们总称为解决方案文件. .sln文件 solution,即解决方案.它引用 ...

  6. oracle 察看用户是否被锁,解锁以及改密码

     以管理员身份登陆 察看用户状态(是否被锁) select * from dba_users where username='user1' 解锁 ALTER USER user1 ACCOUNT UN ...

  7. Helm安装和项目使用

    整体架构 1.为什么要用? 首先在原来项目中都是基于yaml文件来进行部署发布的,而目前项目大部分微服务化或者模块化,会分成很多个组件来部署,每个组件可能对应一个deployment.yaml,一个s ...

  8. Spring与Quartz的整合

    Quartz Quartz是一个完全由Java编写的开源作业调度框架,为在Java应用程序中进行作业调度提供了简单却强大的机制.Quartz允许开发人员根据时间间隔来调度作业.它实现了作业和触发器的多 ...

  9. SecureCRT配置文件保存和导入

    每次重装系统,都要重新配置SecureCRT,为了减少重复工作.直接在SecureCRT软件中找到:选项---全局选项---常规---配置文件夹下面路径:C:\Users\Administrator\ ...

  10. IP地址转换、主机大小端、htonl、ntohl实现

    copy   #include <IOSTREAM> //#include <WINSOCK.H> using std; typedef  uint16; unsigned   ...