一个非常easy的问题,之所以让我对这个问题进行总结。一是由于没我想象的简单,在处理的过程中遇到了一些磕磕碰碰,甚至绕了一些弯路。二是引发了我对故障处理时的一些思考。

6月19日,下午5点左右。数据库出现了大量的enq: TX - row lock contention等待事件,依照以往的经验,这类等待一般与业务逻辑有关。DBA可以做的事情。一般就是将锁等待着的连接信息,等待锁的SQL语句。甚至等待的详细数据行,还有就是锁持有者的连接信息,造成锁等待的SQL语句等一些基本信息提交给开发者,改动业务逻辑。

注意
  • 非常多情况下,改动业务逻辑不是一时半会能够马上解决的事,有时候假设锁持有或者锁等待业务不是特别重要。能够与应用维护人员协商,先停掉这部分业务,让其他业务正常执行
  • 非常多时候。数据库仅仅有一个锁持有者。并且这个锁持有的连接也没有活动,能够与应用维护人员协商,尝试kill锁持有者,看看兴许锁等待是否能自己主动解决。

    这样的情况通常是一个单独的连接出现僵死导致。kill掉持有者以后,问题自然就攻克了

  • 第二种情况就是,前天晚上上线后,平时执行好好的业务,也没出现锁等待。有一天出现了这类问题。并且kill掉锁持有者以后。问题无法得到解决(业务逻辑问题,kill掉以后,兴许还会发生)。这通常是前天晚上上线引起。

本来认为数据库层提供信息非常easy。结果与想象的有点差别,来看一下详细的过程
(1)查询锁信息。例如以下
SESS LMODE LMODE REQUEST TYPE EVENT SQL_TEXT
Holder: 4266 exclusive 6 0 TX SQL*Net message from client  
Waiter: 3136 none 0 4 TX enq: TX - row lock contention insert into xxxxx(ID,xxx,xxxx,xxx,….) values(seq_xxx.nextval,:"SYS_B_0",:"SYS_B_1",:"SYS_B_2",:"SYS_B_3",:"SYS_B_4",:"SYS_B_5")
Holder: 2276 exclusive 6 0 TX SQL*Net message from client  
Waiter: 1716 none 0 4 TX enq: TX - row lock contention insert into xxxxx(ID,xxx,xxxx,xxx,….) values(seq_xxx.nextval,:"SYS_B_0",:"SYS_B_1",:"SYS_B_2",:"SYS_B_3",:"SYS_B_4",:"SYS_B_5")
Holder: 1288 exclusive 6 0 TX SQL*Net message from client  
Waiter: 1565 none 0 4 TX enq: TX - row lock contention insert into xxxxx(ID,xxx,xxxx,xxx,….) values(seq_xxx.nextval,:"SYS_B_0",:"SYS_B_1",:"SYS_B_2",:"SYS_B_3",:"SYS_B_4",:"SYS_B_5")
Holder: 1000 exclusive 6 0 TX SQL*Net message from client  
Waiter: 1147 none 0 4 TX enq: TX - row lock contention insert into xxxxx(ID,xxx,xxxx,xxx,….) values(seq_xxx.nextval,:"SYS_B_0",:"SYS_B_1",:"SYS_B_2",:"SYS_B_3",:"SYS_B_4",:"SYS_B_5")
Holder: 2989 exclusive 6 0 TX SQL*Net message from client  
Waiter: 862 none 0 4 TX enq: TX - row lock contention insert into xxxxx(ID,xxx,xxxx,xxx,….) values(seq_xxx.nextval,:"SYS_B_0",:"SYS_B_1",:"SYS_B_2",:"SYS_B_3",:"SYS_B_4",:"SYS_B_5")
备注:表名和列名做了模糊化
能够看到,锁等待语句正在等待Insert条记录
(2)通过查看锁持有者,已经运行的语句,来推断究竟是那个语句造成了锁等待,查询语句例如以下:
select b.sql_text ,a.* from v$open_cursor a,v$sql b  where a.sql_id=b.sql_id and a.sid=4266 and  upper(b.sql_text) like '%xxxxx%';
(3)
依据经验insert一条语句被堵塞,通常是因为主键约束引起(还有一个连接也插入了同一条语句或者删除了一条语句,可是没有提交)
可是我通过上面的语句查询的时候。发现怎么也找不到锁持有者有运行过这个表的不论什么DML,并且询问开发者,他们也说没有对这张表的DML操作
当中open_cursor为1000,v$open_cursor中的记录也远远没有达到这个数,才100条不到。

session_cached_cursors设置为200。没有道理这个连接运行的语句游标已经被刷新出去

(4)还真没有遇到过类似的问题。怎么也找不到。这时我换了一个想法。抛开那些经验。我在想,是不是有一种可能不正确Insert插入语句进行不论什么DML操作,也会造成一条插入语句被锁掉??
我考虑了这张表的依赖对象是不是会造成种类等待,比如触发器、外键引用等等。

细致考虑一番,发现触发器,审计什么的,数据库应该能定位到详细的语句,而不是发生在这个insert语句本身(就算是递归语句。Oracle也能捕获到才对),因此,最让我怀疑的就是外键引用。通过以下这个查询。推断是否这个表通过外键引用了其它对象,例如以下
select a.table_name,
       a.owner,
       a.constraint_name,
       a.constraint_type,
       a.r_owner,
       a.r_constraint_name,--被外键引用的约束名
       b.table_name  --被外键引用的表名
  from dba_constraints a, dba_constraints b
 where a.constraint_type = 'R'
   and a.r_constraint_name = b.constraint_name
   and a.r_owner = b.owner
   and b.table_name = 'xxxxx'
   and b.owner='';
查询发现,确实有一张表引用这个插入等待的表,这时,顿时感觉希望非常大。

(5)通过一个简单的測试,我验证我的猜測。例如以下
create table t3 (id number primary key,name varchar2(20),product_id number);
create table t2 (id number primary key,name varchar2(20));
alter table t3 add constraint FK_PRODUCTSTAT_PRODUCTID foreign key (PRODUCT_id) references t2 (ID);
SQL> insert into t2 values(1,'dh');
1 row inserted
SQL>  insert into t2 values(2,'cc');
1 row inserted
SQL> insert into t2 values(3,'cc');

1 row inserted

SQL> commit;
Commit complete
session 1运行例如以下操作:
SQL> select * from t2;
        ID NAME
---------- --------------------
         1 dh
         2 cc
         3 cc
SQL> select * from t3;
        ID NAME                 PRODUCT_ID
---------- -------------------- ----------    --能够看到,这时t3表有不论什么记录
SQL>  insert into t2 values(4,'cc');    --对父表运行一条插入

1 row inserted、

session2 t2表运行一条插入操作,例如以下
 insert into t3 values(1,'tt',4);  
令人惊喜的是,确实发生了锁等待。与我们遇到的锁等待类型一模一样。
(6)查询锁持有者。是否有对锁等待表的父表有进行DML操作。例如以下
select b.sql_text ,a.* from v$open_cursor a,v$sql b  where a.sql_id=b.sql_id and a.sid=4266 and  upper(b.sql_text) like '%xxxxx_ref%';
检查结果与我们预期的一致,确实有非常多对主表的插入操作!

(7)基本我们已经确定是什么语句导致锁阻塞,将语句提交给开发者。改动代码后,问题解决!


问题总结
事实上这个问题本身不难。值得思考的是,为什么一个这么简单的问题,无法马上找到原因。说究竟。非常多时候都是经验束缚了我们,在遇到这类问题时。我们须要抛开已有的那些经验。通过数据库的原理来发现根本原因。因此,理论知识再怎么强调都只是分,它真的非常重要。理解了原理,你才干够举一反三。游刃有余,而不是每次一碰到没见过的问题都战战兢兢!

enq: TX - row lock contention故障处理一则的更多相关文章

  1. 解决一则enq: TX – row lock contention的性能故障

    上周二早上,收到项目组的一封邮件: 早上联代以下时间点用户有反馈EDI导入"假死",我们跟踪了EDI导入服务,服务是正常在跑,可能是处理的慢所以用户感觉是"假死" ...

  2. ORACLE等待事件:enq: TX - row lock contention

    enq: TX - row lock contention等待事件,这个是数据库里面一个比较常见的等待事件.enq是enqueue的缩写,它是一种保护共享资源的锁定机制,一个排队机制,先进先出(FIF ...

  3. ORACLE AWR结合ASH诊断分析enq: TX - row lock contention

    公司用户反馈一系统在14:00~15:00(2016-08-16)这个时间段反应比较慢,于是生成了这个时间段的AWR报告, 如上所示,通过Elapsed Time和DB Time对比分析,可以看出在这 ...

  4. Tuning “enq:TX – row lock contention” events

    enq是一种保护共享资源的锁定机制,一个排队机制 排它机制从一个事务的第一次改变直到rollback or commit 结束这个事务, TX等待mode是6,当一个session 在一个表的行级锁定 ...

  5. 大表建立索引引发enq: TX - row lock contention等待

    今天要给一张日志表(6000w数据)建立索引,导致生产系统行锁部分功能卡住 create index idx_tb_cid on tb_login_log(user_id); 开始执行后大概花费了20 ...

  6. enq: TX - row lock contention 参数P1,P2,P3说明

    enq: TX - row lock contention三个参数,例如,下面的等待事件 * P1 = name|mode          <<<<<<< ...

  7. 记录一则enq: TX - row lock contention的分析过程

    故障描述:与客户沟通,初步确认故障范围大概是在上午的8:30-10:30之间,反应故障现象是Tomcat的连接数满导致应用无法连接,数据库alert中无明显报错,需要协助排查原因. 1.导入包含故障时 ...

  8. AWR之-enq TX - row lock contention的性能故障-转

    1 对这一个小时进行AWR的收集和分析,首先,从报告头中看到DB Time达到近500分钟,(DB Time)/Elapsed=8,这个比值偏高:   Snap Id Snap Time Sessio ...

  9. [Oracle] enq: TX - row lock contention 优化案例

    依据开发反馈.近期每天早上7:30应用会报警.应用的日志显示数据库连接池满了.新的连接被拒绝. 首先.我做了ASH报告(报告区间:7:25 ~ 7:35),从ASH的等待事件发现enq: TX - r ...

随机推荐

  1. BZOJ 3236 莫队+树状数组

    思路: 莫队+树状数组 (据说此题卡常数) yzy写了一天(偷笑) 复杂度有点儿爆炸 O(msqrt(n)logn) //By SiriusRen #include <cmath> #in ...

  2. HDU 4359 Easy Tree DP? 组合数学+动归

    题意:定义一种树,每个节点的权值都是20到2n-1,每个权值出现一次,每个节点的左子树的权值和小于右子树,除非只有一个子树.给你n和d,问有n个节点且恰好深度是d的这种树有多少种. 比赛的时候我没有做 ...

  3. 打开文件对话框在xp和win7上的实现文件任意多选

    作者:朱金灿 来源:http://blog.csdn.net/clever101 在xp系统上进行文件多选,实际上其文件字符串数组的缓冲区是有限,并不能支持选择任意多个文件,为此以前我还写过一篇文章: ...

  4. ES6学习笔记(二)变量的解构与赋值

    1.数组的解构赋值 1.1基本用法 ES6 允许按照一定模式,从数组和对象中提取值,对变量进行赋值,这被称为解构(Destructuring). 以前,为变量赋值,只能直接指定值. let a = 1 ...

  5. Vue常见面试题汇总

    Vue框架常见面试题   1.active-class是哪个组件的属性?嵌套路由怎么定义? 答:vue-router模块的router-link组件. 2.怎么定义vue-router的动态路由?怎么 ...

  6. js sort()函数 排序问题 var arr =['A-1-5-1','A-1-10-2','A-1-5-5','B-2-3-1','C-4-10-1'], 对这个数组进行排序,想达到的效果是["A-1-5-1", "A-1-5-5", "A-4-10-1", "A-1-10-2", "A-2-3-1"]

    先介绍个方法 charCodeAt() 方法可返回指定位置的字符的 Unicode 编码.这个返回值是 0 - 65535 之间的整数. stringObject.charCodeAt(index) ...

  7. 【Redis哨兵集群】

    目录 开始配置主从复制 开始配置Redis Sentinel @ *** 在开始之前,我们先来看看Redis的主从复制 主从复制原理: 从服务器向主服务器发送SYNC命令. 主服务器接到SYNC命令后 ...

  8. Web测试要点 做移动端的测试,也做web端的测试,甚至后面桌面端的测试和后台的测试也做了,基本上把我们产品各个端都玩了一轮

    Web测试要点 一.功能测试 1.链接测试 (1).测试所有链接是否按指示的那样确实链接到了该链接的页面:  (2).测试所链接的页面是否存在:  (3).保证Web应用系统上没有孤立的页面(所谓孤立 ...

  9. SpringBoot结合Mybatis 使用 mapper*.xml 进行数据库增删改查操作

    什么是 MyBatis? MyBatis 是支持普通 SQL 查询,存储过程和高级映射的优秀持久层框架. MyBatis 消除了几乎所有的 JDBC 代码和参数的手工设置以及对结果集的检索. MyBa ...

  10. 【剑指offer】Q25:二叉树中和为某一值的路径

    说明:最烦的就是看别人的博客,题解里直接上代码,一行分析都没有.只是这个题... class BTNode(): def __init__(self, val = -1): self.val = va ...