排查 “Detected Tx Unit Hang”问题

实现功能: 使用自己已经分配的内存让skb->data指向,而不是使用alloc_malloc(). 部分代码如下: /* * build a new sk_buff */ //struct sk_buff *send_skb = kmem_cache_alloc_node(skbuff_head_cache, GFP_ATOMIC & ~__GFP_DMA, NUMA_NO_NODE); struct sk_buff *send_skb = kmem_cache_alloc(skbuff_…

Intel 82599网卡异常挂死原因

前提背景: 生产环境上,服务器网络突然断链,ssh连接失败. 问题初步定位: 查找内核日志,得到网卡异常信息 Jan 24 11:52:43 localhost kernel: ixgbe 0000:84:00.0: eth0: RXDCTL.ENABLE on Rx queue 14 not cleared within the polling period Jan 24 11:52:43 localhost kernel: ixgbe 0000:84:00.0: eth0: RXDCTL.E…

intel的网卡故障

现象: 机器键盘接入,敲入无反应:机器无法ping通,整台机器假死状态. 查看message的日志,日志为如下内容: Aug :: TSMIS-CF kernel: ::19.0: eth0: Detected Hardware Unit Hang: Aug :: TSMIS-CF kernel: TDH <> Aug :: TSMIS-CF kernel: TDT <> Aug :: TSMIS-CF kernel: next_to_use <> Aug :: TSM…

无线电源传输 Wireless Power Consortium (WPC) Communication

Universally Compatible Wireless Power Using the Qi Protocol Wireless charging of portable electronic devices is here now. It will become ubiquitous when all such devices adhere to the same standard. By Upal Sengupta and Bill Johns, Texas Instruments…

Class loading in JBoss AS 7--官方文档

Class loading in AS7 is considerably different to previous versions of JBoss AS. Class loading is based on the JBoss Modules project. Instead of the more familiar hierarchical class loading environment, AS7's class loading is based on modules that ha…

linux内存管理之DMA

说起DMA我们并不陌生,但是实际编程中去用的人不多吧,最多就是网卡驱动里的环形buffer,再有就是设备的dma,下面我们就分析分析. DMA用来在设备内存和内存之间直接数据交互.而无需cpu干预内核为了方便驱动的开发,已经提供了几个dma 函数接口.dma跟硬件架构相关,所以linux关于硬件部分已经给屏蔽了,有兴趣的可以深入跟踪学习. 按照linux内核对dma层的架构设计,各平台dma缓冲区映射之间的差异由内核定义的一个dma操作集 include/linux/dma-mappin…

教你如何用AST语法树对代码“动手脚”

个推安卓工程师,负责公司移动端项目的架构和开发,主导移动端日志管理平台系统架构和开发工作,熟悉前后端的技术线,参与个推SDK主要业务研发工作,善于解决项目中遇到的痛点问题. 作为程序猿,每天都在写代码,但是有没有想过通过代码对写好的代码"动点手脚"呢?今天就与大家分享--如何通过用AST语法树改写Java代码. 先抛一个问题:如何将图一代码改写为图二? void someMethod(){ String rst=callAnotherMethod(); LogUtil.log(TAG,…

appium日志

2020-10-02 00:44:10:672 [Appium] Welcome to Appium v1.16.0 2020-10-02 00:44:10:673 [Appium] Non-default server args: 2020-10-02 00:44:10:674 [Appium] logFile: Desktop/appium.log 2020-10-02 00:44:10:703 [Appium] Appium REST http interface listener sta…

内核futex的BUG导致程序hang死问题排查

https://mp.weixin.qq.com/s/sGS-Kw18sDnGEMfQrbPbVw 内核futex的BUG导致程序hang死问题排查原创: 王领先 58架构师今天近日,Hadoop的同学反映,新上的几台机器上的java程序出现hang死的现象,查看系统的message记录,发现一些内存方面的错误输出,怀疑是内存不足导致java程序hang死在gc的过程中.经排查发现即使是在内存充足的情况下也会出现程序hang死的现象. 我们又发现只有这批新上的机器才出现hang死的问题…

Java SDK夯住(Hang)问题排查

夯住(Hang)是指程序仍在运行,卡在某个方法调用上,没有返回也没有异常抛出:卡住时间从几秒到几小时不等. Java程序发生Hang时,应该首先使用 jstack 把java进程的堆栈信息保存下来 ,供后继分析使用. 调用OSS Java SDK的程序Hang,有以下可能的情况及原因. 说明: jstack -l <pid> > js.txt可以把pid的堆栈信息保存到文件js.txt中.pid可以通过jps命令查找到. 抓包工具,Windows系统下推荐使用Wireshark.捕获筛选…

Windbg在.net性能问题排查hang情况的应用思路

1.使用~*kb 2000 查看本地锁的callstack情况,有sleep的线程关注是否占用锁,有wait等待的线程可能是正在等待锁资源. 2.使用~*e!clrstack 查看.net的callstack.出现..threading.monitor.Enter--->表示该线程可能在等待锁:...threadsleepInternal--->该线程在sleep可能正占用锁: 3.使用!syncblk查看线程中锁的信息.info列表示占用锁的线程ID; 4.使用!ip2md [方法对应的ei…

Linux系统排查4——网络篇

用于排查Linux系统的网络故障. 网络排查一般是有一定的思路和顺序的,其实排查的思路就是根据具体的问题逐段排除故障可能发生的地方,最终确定问题. 所以首先要问一问,网络问题是什么,是不通,还是慢? 1. 如果是网络不通,要定位具体的问题,一般是不断尝试排除不可能故障的地方,最终定位问题根源.一般需要查看是否接入到链路是否启用了相应的网卡本地网络是否连接 DNS故障能否路由到目标主机远程端口是否开放 2. 如果是网络速度慢,一般有以下几个方式定位问题源: DNS是否是问题的源头查看路…

(转)Linux系统排查4——网络篇

原文:http://www.cnblogs.com/Security-Darren/p/4700387.html 用于排查Linux系统的网络故障. 网络排查一般是有一定的思路和顺序的,其实排查的思路就是根据具体的问题逐段排除故障可能发生的地方,最终确定问题. 所以首先要问一问,网络问题是什么,是不通,还是慢? 1. 如果是网络不通,要定位具体的问题,一般是不断尝试排除不可能故障的地方,最终定位问题根源.一般需要查看是否接入到链路是否启用了相应的网卡本地网络是否连接 DNS故障能否路由到…

记一则update 发生enq: TX - row lock contention 的处理方法

根据事后在虚拟机中复现客户现场发生的情况,做一次记录(简化部分过程,原理不变) 客户端1执行update语句 SQL> select * from test; ID NAME ---------- -------------------------------- b c b SQL where name = 'c'; row updated. 客户端2执行另外一条update语句 SQL where name = 'c'; 这个时候第二条update卡住了,证明发生了hanganalyze,查询…

erlang 故障排查工具

系统级别perf top, dstat -tam, vtune 都能很好分析beam 瓶颈,本文主要erlang 级别排查: 1. 反编译确认线上运行代码是否正确,reltools没掌握好,升级偶尔出现问题 decompile(Mod) -> {ok,{_,[{abstract_code,{_,AC}}]}} = beam_lib:chunks(code:which(Mod), [abstract_code]), io:format("~s~n", [erl_prettypr:…

Oracle Hang分析--转载

1. 数据库hang的几种可能性 oracle 死锁或者系统负载非常高比如cpu使用或其他一些锁等待很高都可能导致系统hang住,比如大量的DX锁. 通常来说,我们所指的系统hang住,是指应用无响应,普通的sqlplus几乎无法操作等等. 2. 如何进行hang分析?hang分析有哪些level?如何选择level? hanganalyze有如下几种level: 10 Dump all processes (IGN state)5 Level 4 + Dump all pr…

* glibc detected * malloc(): memory corruption 分类： C/C++ Linux 2015-05-14 09:22 37人阅读评论(0) 收藏

*** glibc detected *** malloc(): memory corruption: 0x09eab988 *** 发现是由于memset越界写引起的. 在Linux Server上不好模拟出来:不过若是先malloc,再越界memset,再free此内存块,然后malloc新内存块就会出现类似错误. #include<stdio.h> #include<stdlib.h> #include<string.h> int main() { char *p…

Linux服务器Cache占用过多内存导致系统内存不足问题的排查解决（续）

作者: 大圆那些事 | 文章可以转载,请以超链接形式标明文章原始出处和作者信息网址: http://www.cnblogs.com/panfeng412/archive/2013/12/17/drop-caches-under-linux-system-2.html 前一篇文章里已经描述了具体遇到的问题及一些解决方法.但是还有些疑问点没有搞清楚,进一步学习了Linux系统下内存的分配使用机制,这里有两个资料讲的比较全面: Where is the memory going? Memory wa…

MySQL复制延时排查

今天收到报警,提示从库延时,首先当然是上去查看情况,首先查看机器负载,如下: 可以看到使用cpu已经100%,io没有等待.那么查看mysql是什么情况,执行show processlist没有发现任何异常,执行show slave status查看延时,发现延时一直在增加,且卡在了某个pos点不动了,已经hang住了.这个从库没有跑任何业务的. 继续查下去,执行show engine innodb status查看一下有没有异常: 我擦,还真发现了问题,怎么会提示锁住了23张表?继续排查,根据…

Oracle Hang Manager

名词术语1.Cross Boundary Hang 交叉边界hang.在12.1.0.1中,hang manager可以检测database和asm之间的hang.2.Deadlock or Closed Chain 死锁或关闭链条.打破死锁链条的唯一方法是让其中某些会话完成其工作或被终止.3.Hang or Open Chain hang或开放链条.从hang manager角度讲,hang就是一些会话无法进一步处理工作,这不是死锁或循环链条.hang or open chain有一个根本阻塞…

MySQL redo lock 死锁问题排查 & 解决过程

版权声明:本文由张青林原创文章,转载请注明出处: 文章原文链接:https://www.qcloud.com/community/article/181 来源:腾云阁 https://www.qcloud.com/community 周一上班,首先向同事了解了一下上周的测试情况,被告知在多实例场景下 MySQL Server hang 住,无法测试下去,原生版本不存在这个问题,而新版本上出现了这个问题,不禁心头一颤,心中不禁感到奇怪,好在现场环境还在,为排查问题提供了一个好的环境,随投入到紧张的…

[转]Oracle hang分析

hanganalyze是ORACLE的一款性能诊断工具,这个款工具是从oracle 8.0.6开始可用,在oracle数据库出现严重的性能问题的时候它可以帮助你定位问题所在. 1.首先说说hanganalyze工具的用法对于单实例数据库语法如下 alter session set events 'immediate trace name hanganalyze level '; 或则使用oradebug进行hanganalyze conn /as sysdba SQLPLUS>oradebug…

Linux系统及应用问题分析排查工具

linux 阿里技术协会摘要: Linux服务器上经常遇到一些系统和应用上的问题,如何分析排查,需要利器,下面总结列表了一些常用工具.trace tool:最后也列举了最近hadoop社区在开发发展的分布式系统的trace tool. 概览: 引用linux-performance-analysis-and-tools中图片, Linux服务器上经常遇到一些系统和应用上的问题,如何分析排查,需要利器,下面总结列表了一些常用工具.trace tool:最后也列举了最近hadoop社区在开发发展的…

如何诊断oracle数据库运行缓慢或hang住的问题

为了诊断oracle运行缓慢的问题首先要决定收集哪些论断信息,可以采取下面的诊断方法:1.数据库运行缓慢这个问题是常见还是在特定时间出现如果数据库运行缓慢是一个常见的问题那么可以在问题出现的时候收集这个时期的awr或者statspack报告(通常收集时间间隔是一个小时).生成awr报告的方法如下:awr是通过sys用户来收集持久系统性能统计信息并且这些信息保存在sysaux表空间.缺省情况下快照是一个小时生成一次并且保留7天.awr报告输出了基于指定快照之间的一系列的统计信息用于性能分析和调查其…

windows 下面的内存泄漏排查.

内存泄漏排查一下本人只是简单的介绍一个实用, 如果读者很感兴趣, 可以查阅msdn自己去深入调查相关的API和原理. API 介绍 1. 马上打印泄漏信息:_CrtDumpMemoryLeaks(); 一般用于局部跟踪内存泄漏问题,使用的方法很简单,你怀疑在某一个时刻有内存泄漏了,就执行这个函数调用,然后在 vs 调试器的 "output" 窗口会马上会打印出当前所有没有释放的内存的申请明细(包括文件名,行号, 第几次内存分配). 双击就可以定位到源文件内存申请的地方, 很方便.…

Troubleshooting "Global Enqueue Services Deadlock detected" (Doc ID 1443482.1)

In this Document _afrLoop=1021148011984950&id=1443482.1&displayIndex=1&_afrWindowMode=0&_adf.ctrl-state=m3p452ml4_194#PURPOSE">Purpose Troubleshooting Steps 1. TX deadlock in Exclusive(X) mode 2. TX deadlock in Share(S) mod…

SQL Server 2008性能故障排查（二）——CPU

原文:SQL Server 2008性能故障排查(二)--CPU 承接上一篇:SQL Server 2008性能故障排查(一)--概论说明一下,CSDN的博客编辑非常不人性化,我在word里面都排好了版,贴上来就乱得不成样了.建议CSDN改进这部分.也请大家关注内容不要关注排版.同时在翻译的过程中本人也整理了一次思路,所以还似乎非常愿意翻译,虽然有点自娱自乐,但是分享给大家也是件好事 CPU 瓶颈: CPU瓶颈可能因为某个负载所需的硬件资源不足而引起.但是过多的CPU使用通常可以通过查询优化(…

内存排查 valgrind

内存问题排查工具 --- valgrind 1. 概述 2. Valgrind 3. 内存泄漏监测 3.1. 示例代码 3.2. 编译它 3.3. 用Valgrind监测进程的内存泄漏 4. 悬挂指针 4.1. 示例代码 4.2. Valgrind运行结果 5. 多次释放同一个指针 5.1. 示例代码 5.2. Valgrind 监测 6. Valgrind的优缺点 6.1. Advantages 6.2. Disadvantages 7. Valgrind的其他工具 7.1. Cachegri…

docker.service启动失败：Unit not found

docker.service启动失败:Unit not found 版权声明:本文为博主原创文章,未经博主允许不得转载. 背景因为最近一直在折腾Kubernetes集群版本升级.Docker版本升级,所以不停的把测试环境安装.还原.升级.降级,简直乱的不行.终于,在测试Docker版本升级后,启动Docker时,遇到了docker.service: Unit not found.问题虽然不大,但是却折磨了我几个小时,所以在此mark一下. 操作系统:Red Hat Enterprise Lin…

linux学习（二）linux配置网卡以及常见网络问题排查

实验环境环境:mac,vmware fusion 一.常用的虚拟机网络连接模式. NAT:推荐方式.它可以使你在切换网络环境(比如在工作中和家里)时,不需要修改虚拟主机的配置,而维持正常的上网功能. 桥接:相当于虚拟机和主机连在同一个路由器上. 二.选择NAT模式三.具体配置方法. 3.1 使用dhclient命令动态的获取ip地址,进而联网这个命令是动态分配ip使用的. 分配完ip后可以使用ifconfig命令来查看你的Ip: [root@localhost ~]# ifconfig en…

【排查 “Detected Tx Unit Hang”问题】的更多相关文章