最近在整理Linux调试方面的文档,正好碰到了一个内存泄漏踩栈的问题,借此机会记录一下分析过程. 首先,发现问题之后,赶紧看一下产生coredump文件没有,果不其然,产生了coredump,果断上gdb调试. $ arm-buildroot-linux-gnueabi-gdb ./linecard ~/core_tMscRcv_165 GNU gdb (GDB) 7.10.1 Copyright (C) 2015 Free Software Foundation, Inc. License G…
1.物理地址和虚拟地址 Linux采用页表机制管理内存,32位系统中页大小一般为4KB,物理内存被划分为连续的页,每一个页都有一个唯一的页号. 为了程序的的可移植性,进程往往需要运行在flat memory中:另外为了方便内核统一管理所有进程的内存布局.诸如此类的原因,Linux进程运行在虚拟地址空间(几乎所有现代操作系统都是这么设计的),虚拟地址空间也是以页为单位进行管理. Linux进程的虚拟地址空间在实际使用的过程中需要映射到物理内存地址空间中,这是通过MMU和TLB硬件单元实现的. 虚拟…
番外 2019年7月26日至27日,公司邀请<软件调试>和<格蠹汇编——软件调试案例集锦>两本书的作者张银奎老师进行<Linux高级调试与优化>培训,有幸聆听张老师的课程.若干年前有幸拜读过<软件调试>一书,受益匪浅. 张老师给人的感觉温文尔雅,谦谦如玉,对Windows和Linux内核的内存分配和任务管理机制有非常深入的了解,对Intel CPU的内部实现机制也有很深的功底,如数据/代码缓存.数据/代码TLB缓存.乱序执行.MMU机制等. 整个培训的内容包…
JVisualVM简介与内存泄漏实战分析 学习了:https://blog.csdn.net/kl28978113/article/details/53817827…
内存问题是软件世界的住房问题 嵌入式Linux系统中,物理内存资源通常比较紧张,而不同的进程可能不停地分配和释放不同大小的内存,因此需要一套高效的内存管理机制. 内存管理可以分为三个层次,自底向上分别为: 1)Linux内核内存管理: 2)glibc层使用系统调用(brk/sbrk)维护的内存管理算法:即glibc库维护一个内存资源池,在应用层满足其他应用的需求.   glibc库使用第三方的ptmalloc库实现用户态堆管理器,当应用程序调用glibc库封装的malloc函数申请内存时,首先在…
Address Sanitizer ASAN最早可以追溯到 LLVM 的 sanitizers项目(https://github.com/google/sanitizers),这个项目包含了AddressSanitizer,MemorySanitizer,ThreadSanitizer 和 LeakSanitizer等工具.这些工具可以检测用户空间的内存问题.通过在编译时加入指定的选项,就可以给用户程序加入 Address Sanitizer 功能. 其中Address Sanitizer(AS…
ptrace (process trace) #include <sys/ptrace.h> long ptrace(enum __ptrace_request request, pid_t pid, void *addr, void *data); ptrace系统调用运行tracer进程监视和控制tracee进程的执行过程,检查和修改tracee进程的内存和寄存器值.ptrace主要用来实现端点调试和跟踪系统调用. tracee进程首先需要attach在tracer进程上,attach和接…
背景介绍 Linux分为内核态和用户态,用户态通过系统调用(syscall)进入内核态执行. 用户空间的glibc库将Linux内核系统调用封装成GNU C Library库文件(兼容ANSI & POSIX C语言标准),同时提供了其他特性的支持. 应用程序通常不是直接调用Linux内核的系统调用接口,而是通过glibc库封装的接口间接调用Linux内核系统调用. 信号量机制 关于Linux信号量机制的原理,建议阅读<Unix环境高级编程>第10章,本博客只是简单介绍其原理. 信号量…
Linux内核源码 Documentation/sysctl/kernel.txt core_pattern: core_pattern: core_pattern is used to specify a core dumpfile pattern name. . max length characters; default value is "core" . core_pattern is used as a pattern template for the output file…
进程管理 进程和文件是Linux操作系统的两个最基本的抽象. 进程是处于执行期的程序,进程不仅仅局限于一段可执行程序代码,通常还包含其他资源,如打开的文件.挂起的信号.内核内部数据.处理器状态.进程地址空间及一个或者多个执行线程(thread of execution).当然还包括用来存放全局变量的数据段等. 线程(thread)是内核调度的对象,每个线程都拥有一个独立的程序计数器(PC指针).函数调用栈和一组寄存器值.在Linux内核中,线程只不过是一种特殊的进程,线程仅仅被视为一个与其他进程…
linux驱动调试--段错误之oops信息分析 http://blog.chinaunix.net/xmlrpc.php?r=blog/article&uid=29401328&id=4923447 1. 分析coredump打印信息 2. 确定发生错误的函数 看发生错误的地方的函数和pc PC is at segment_test_open+0x14/0x1c [segdrv] 看pc值: pc : [<7f000014>]    lr : [<800d958c>…
由于 C 和 C++ 程序中完全由程序员自主申请和释放内存,稍不注意,就会在系统中导入内存错误.同时,内存错误往往非常严重,一般会带来诸如系统崩溃,内存耗尽这样严重的后果.本文将从静态分析和动态检测两个角度介绍在 Linux 环境进行内存泄漏检测的方法,并重点介绍静态分析工具 BEAM.动态监测工具 Valgrind 和 rational purify 的使用方法.相信通过本文的介绍,能给大家对处理其它产品或项目内存泄漏相关的问题时提供借鉴.   由于 C 和 C++ 程序中完全由程序员自主申请…
1为什么要做性能优化? 手机性能越来越好,不用纠结这些细微的性能? Android每一个应用都是运行的独立的Dalivk虚拟机,根据不同的手机分配的可用内存可能只有(32M.64M等),所谓的4GB.6GB运行内存其实对于我们的应用不是可以任意索取 详情:http://10.158.0.33/bbs/forum.php?mod=viewthread&tid=122&extra= 优秀的算法与效率低下的算法之间的运行效率要远远超过计算机硬件的的发展,虽然手机单核.双核到4核.8核的发展,但性…
对于内存泄漏,在Android中如果不注意的话,还是很容易出现的,尤其是在Activity中,比较容易出现,下面我就说下自己是如何查找内存泄露的. 首先什么是内存泄漏? 内存泄漏就是一些已经不使用的对象还存在于内存之中且垃圾回收机制无法回收它们,导致它们常驻内存,会使内存消耗越来越大,最终导致程序性能变差. 其中在Android虚拟机中采用的是根节点搜索算法枚举根节点判断是否是垃圾,虚拟机会从GC Roots开始遍历,如果一个节点找不到一条到达GC Roots的路线,也就是没和GC Roots…
转自:http://blog.csdn.net/a910626/article/details/50849760 一.什么是内存泄漏 在Java程序中,如果一个对象没有利用价值了,正常情况下gc是会对其进行回收的,但是此时仍然有其他引用指向这个活在堆内存中的对象,那么gc就不会认为这个对象是一个垃圾,那么就不会对其进行回收,所以它会一直活在堆内存中占用内存,这就导致了内存泄漏. 总结一下,导致内存泄漏的原因就是有一些我们永远不会使用的对象,仍然有引用指向它(当然这是在强引用的情况下),那么就不满…
尽管iOS 5.0加入版本号之后ARC机制,由于相互引用关系是复杂的.内存泄漏可能仍然存在.于是,懂原理是非常重要的. 这里讲述在没有ARC的情况下,怎样使用Instruments来查找程序中的内存泄露.以及NSZombieEnabled设置的使用. 本文如果你已经比較熟悉Obj-C的内存管理机制. 实验的开发环境:XCode 4.5.2 1.执行Demo. 先下载一个实现准备好的内存泄露的Demo吧:leak app 下载下来.打开执行,程序是一个寿司的列表,列出各种寿司卷.试着选择里面的几行…
1.安装 valgrind yum install valgrind 2.测试用例 main.cpp #include <iostream> using namespace std; struct StockInfo { int iMarket; string sCode; StockInfo() : iMarket(0) { } }; int main() { StockInfo *pStockInfo = new StockInfo; pStockInfo->iMarket = 1;…
在分析前可以阅读下这篇文章,很多内容就都知道了https://www.jianshu.com/p/738b4f3bc44b,下面我来分析上一篇文章内存泄漏的为问题 1.上一篇中已经生成了hprf的文件了,现在我们就对他进行分析,确认电脑已经安装了MAT工具,在MAT直接打开文件,就看到如下图,在点击 Leak Suspects 这个链接,查看内存泄漏 2.问题显示,查看详情 3.详细信息中 这一步就很看到其实arraylist这里的占用的实际堆有些多,需堆,和保留堆,在链接中有解释, t表示GC…
ELK 从发布5.0之后加入了beats套件之后,就改名叫做elastic stack了.beats是一组轻量级的软件,给我们提供了简便,快捷的方式来实时收集.丰富更多的数据用以支撑我们的分析.但由于beats都需要安装在ELK集群之外,在宿主机之上,其对宿主机的性能的影响往往成为了考量其是否能被使用的关键,而不是它到底提供了什么样的功能.因为业务的稳定运行才是核心KPI,而其他因运维而生的数据永远是更低的优先级.影响宿主机性能的方面可能有很多,比如CPU占用率,网络吞吐占用率,磁盘IO,内存等…
对于内存泄漏,首先想到的是C语言,其实不然,java中也有各种的内存泄漏.对于java程序员,在虚拟即中,不需要为每一个新建对象去delete/free内存,不容易出现内存泄漏.但是,正 是由于这种机制,java中如果出现了内存泄漏将是一个很麻烦的事情,所以,对java虚拟机的内存使用的掌握能很好的帮助你排除问题. java内存有几种:程序计数器,虚拟机栈,方法常量区,堆,本地方法栈,直接内存.既然分析内存泄漏,那就从这几种内存逐一分析. 1,程序计数器:是一个较小的内存空间,是但钱线程的字节码…
前言部分这次泄漏是自己代码写的太随意引起的,讲道理,代码写的太为所欲为了,导致有些问题根本就很难发现. 泄漏产生的原因,由于activity未被回收导致.这里给我们提出的一个警示,在使用上下文的时候,我们要特别注意,尤其是一些实例的上下文,如:activity.fragment等. 这次的错误原因就是我把activity作为上下文传给了Glide使用,结果后期我做夜间模式,需要重启activity让夜间模式生效的时候忘记Glide还在持有activity的引用导致了泄漏. 内容部分产生了泄漏的时…
现象 在跑 edu_ocr_img 表的归档时,每跑几万个数据,都会报一次内存耗尽 PHP Fatal error:  Allowed memory size of 134217728 bytesexhausted (tried toallocate 135168 bytes) 跟踪代码发现,是在插入时以下代码造成的: EduOCRTaskBackup::getDb()->createCommand()->batchInsert(EduOCRTaskBackup::tableName(), $…
首先贴一段内存泄漏的代码并且执行.(内存泄漏:GC回收不掉的实例对象) package com.example.demo.memoryLeakDemo; import com.example.demo.dto.ResponseDTO; import org.junit.Test; import org.springframework.boot.test.context.SpringBootTest; @SpringBootTest public class memoryLeakTest { @T…
  虽然iOS 5.0版本之后加入了ARC机制,由于相互引用关系比较复杂时,内存泄露还是可能存在.所以了解原理很重要. 这里讲述在没有ARC的情况下,如何使用Instruments来查找程序中的内存泄露,以及NSZombieEnabled设置的使用. 本文假设你已经比较熟悉Obj-C的内存管理机制. 实验的开发环境:XCode 4.5.2 1.运行Demo 先下载一个实现准备好的内存泄露的Demo吧:leak app 下载下来,打开运行,程序是一个寿司的列表,列出各种寿司卷.试着选择里面的几行,…
这里讲述在没有ARC的情况下,如何使用Instruments来查找程序中的内存泄露,以及NSZombieEnabled设置的使用. 本文假设你已经比较熟悉Obj-C的内存管理机制. 实验的开发环境:XCode 4.5.2 1.运行Demo 先下载一个实现准备好的内存泄露的Demo吧:leak app 下载下来,打开运行,程序是一个寿司的列表,列出各种寿司卷.试着选择里面的几行,应该是选第二行的时候就崩溃了.崩溃截图: 在崩溃的地方断住了,知道crash的地方了,但是不知道具体crash的原因.…
hazelcast 提供了3中方法调用startCleanup: 第一种是在ConcuurentMapManager的构造函数中,通过调用node的executorManager中的ScheduledExecutorService来创建每秒运行一次cleanup操作的线程(代码例如以下). 因为这是ConcuurentMapManager构造函数的代码,所以这样的调用startCleanup的操作是默认就会有的. node.executorManager.getScheduledExecutor…
前言: 之前分享过一篇Linux开发coredump文件分析实战分享 ,今天再来分享一篇实战文章. 在我们嵌入式linux开发过程中,开发过程中我们经常会使用多进程.多线程开发.那么多线程使用过程中,我们大概率会遇到某线程长时间占用cpu,导致设备执行异常. 通常只有四五个线程,我们可以通过一个个线程调试捕捉到异常线程,如果你开发的设备上面运行了大概三四十个线程,我们一下子不好看到对应哪个线程出问题,也不好使用列举法进行搜索,这个时候我们需要配合一些工具进行监控以及检查我们执行的进程下面的线程.…
死锁问题分析 死锁就是多个进程(线程)因为等待别的进程已占有的自己所需要的资源而陷入阻塞的一种状态,死锁状态一旦形成,进程本身是解决不了的,需要外在的推动,才能解决,最重要的是死锁不仅仅影响进程业务,而且还会占用系统资源,影响其他进程.所以内核中设计了内核死锁检测机制,一旦发现死锁进程,就重启OS,快刀斩乱麻解决问题.之所以使用重启招数,还是在于分布式系统中可以容忍单点崩溃,不能容忍单点进程计算异常,否则进行死锁检测重启OS就得不偿失了. 内核提供自旋锁.信号量等锁形式的工具,具体不再赘述. L…
自从进入一家创业公司以后,逐渐忙成狗,却无所收获,感觉自身的技术能力用武之地很少,工作生活都在业务逻辑中颠倒. 前些天线上服务内存吃紧,让运维把DUMP拿下来,分析一下聊以自慰. 先来统计一下大对象信息 0:000> !dumpheap -min 85000 -stat Statistics: MT Count TotalSize Class Name 000007feec34c168 7 57734750 System.Char[] 000007feec34aee0 14 115469904…
在一次上线过程中iis内存飙升,随后跟运维要到站点的dump文件,使用windbg分析了clr的内存分配,找到了问题的症结,先记录如下: 使用windbg加载dump文件 1.打开windbg,File->Open Crush Dump,打开dump文件: 2.设置符号路径和站点发布文件路径 .sympath C:\MyCodesSymbols*SRV*C:\MyLocalSymbols*http://msdl.microsoft.com/download/symbols:C:\Users\Ad…