在MySQL数据库中出现了阻塞问题,如何快速查找定位问题根源?在实验开始前,我们先梳理一下有什么工具或命令查看MySQL的阻塞,另外,我们也要一一对比其优劣,因为有些命令可能在实际环境下可能并不适用。

1:  show engine innodb status

2:  Innotop工具

3:  INNODB_TRX 等系统表

下面我们理论联系实际,通过实验来测试总结一下这个问题。首先构造测试环境,数据库测试环境为( 5.7.21 MySQL Community Server 和5.6.20-enterprise-commercial,这两个测试环境我都测试验证过)

  1. mysql> use MyDB;

  1. Reading table information for completion of table and column names

  1. You can turn off this feature to get a quicker startup with -A

  1.  

  1. Database changed

  1. mysql> create table test_blocking(id int primary key, name varchar(12));

  1. Query OK, 0 rows affected (0.05 sec)

  1.  

  1. mysql> insert into test_blocking

  1.     -> select 1, 'kerry' from dual;

  1. Query OK, 1 row affected (0.00 sec)

  1. Records: 1  Duplicates: 0  Warnings: 0

  1.  

  1. mysql> insert into test_blocking

  1.     -> select 2, 'jimmy' from dual;

  1. Query OK, 1 row affected (0.00 sec)

  1. Records: 1  Duplicates: 0  Warnings: 0

  1.  

  1. mysql> insert into test_blocking

  1.     -> select 3, 'kkk' from dual;

  1. Query OK, 1 row affected (0.00 sec)

  1. Records: 1  Duplicates: 0  Warnings: 0

准备好测试环境数据后,那么我们接下来开始实验,为了实验效果,我们先将参数innodb_lock_wait_timeout设置为100。

  1. mysql> show variables like 'innodb_lock_wait_timeout';

  1. +--------------------------+-------+

  1. | Variable_name            | Value |

  1. +--------------------------+-------+

  1. | innodb_lock_wait_timeout | 50    |

  1. +--------------------------+-------+

  1. 1 row in set (0.00 sec)

  1.  

  1. mysql> set global innodb_lock_wait_timeout=100 ;

  1. Query OK, 0 rows affected (0.00 sec)

  1.  

  1.  

  1. mysql> select connection_id() from dual;

  1. +-----------------+

  1. | connection_id() |

  1. +-----------------+

  1. |               8 |

  1. +-----------------+

  1. 1 row in set (0.00 sec)

  1.  

  1. mysql> set session autocommit=0;

  1. Query OK, 0 rows affected (0.00 sec)

  1.  

  1. mysql> select * from test_blocking where id=1 for update;

  1. +----+-------+

  1. | id | name  |

  1. +----+-------+

  1. |  1 | kerry |

  1. +----+-------+

  1. 1 row in set (0.00 sec)

然后在第二个连接会话中执行更新脚本,构造被阻塞的案例

  1. mysql> select connection_id() from dual;

  1. +-----------------+

  1. | connection_id() |

  1. +-----------------+

  1. |               9 |

  1. +-----------------+

  1. 1 row in set (0.00 sec)

  1.  

  1. mysql> update test_blocking set name='kk' where id=1;

在第三个连接会话执行下面命令,查看TRANSACTIONS相关信息:

mysql> show engine innodb status\G;

使用show engine innodb status命令后,可以查看其输出的TRANSACTIONS部分信息,如上截图所示,找到类似TRX HAS BEEN WATING ...部分的信息,

通过那部分信息,我们可以看到update test_blocking set name='kk' where id=1这个SQL语句被阻塞了14秒,一直在等待获取X Lock。

TRANSACTIONS

------------

Trx id counter 148281  #下一个事务ID

Purge done for trx's n:o < 148273 undo n:o < 0 state: running but idle

History list length 552

LIST OF TRANSACTIONS FOR EACH SESSION:

---TRANSACTION 0, not started

MySQL thread id 15, OS thread handle 0x4cc64940, query id 261 localhost root cleaning up

---TRANSACTION 0, not started

MySQL thread id 14, OS thread handle 0x4cbe2940, query id 278 localhost root init

show engine innodb status

---TRANSACTION 148280, ACTIVE 24 sec

2 lock struct(s), heap size 360, 1 row lock(s)

MySQL thread id 8, OS thread handle 0x4cba1940, query id 276 localhost root cleaning up

---TRANSACTION 148279, ACTIVE 313 sec starting index read

mysql tables in use 1, locked 1

LOCK WAIT 2 lock struct(s), heap size 360, 1 row lock(s)

MySQL thread id 9, OS thread handle 0x4cc23940, query id 277 localhost root updating  #线程ID为9, 操作系统线程句柄为0x4cc23940, 查询ID为277,账号为root的UPDATE操作

update test_blocking set name='kk' where id=1  #具体SQL语句

------- TRX HAS BEEN WAITING 14 SEC FOR THIS LOCK TO BE GRANTED:  #TRX等待授予锁已经有14秒了

RECORD LOCKS space id 337 page no 3 n bits 72 index `PRIMARY` of table `MyDB`.`test_blocking` trx id 148279 lock_mode X locks rec but not gap waiting

#在space id=337(test_blocking表的表空间),page no=3的页上,表test_blocking上的主键索引在等待X锁

Record lock, heap no 2 PHYSICAL RECORD: n_fields 4; compact format; info bits 0

0: len 4; hex 80000001; asc     ;;            #第一个字段是主键,制度按长为4,值为1

1: len 6; hex 000000024322; asc     C";;      #该字段为6个字节的事务id,这个id表示最近一次被更新的事务id(对应十进制为148258)

2: len 7; hex 9a000001f20110; asc        ;;   #该字段为7个字节的回滚指针,用于mvcc

3: len 5; hex 6b65727279; asc kerry;;         #该字段表示的是此记录的第二个字段,长度为5,值为kerry(如果表有多个字段,那么此处后面还有记录)

  1. mysql> select * from information_schema.INNODB_SYS_DATAFILES where space=337;

  1. +-------+--------------------------+

  1. | SPACE | PATH                     |

  1. +-------+--------------------------+

  1. |   337 | ./MyDB/test_blocking.ibd |

  1. +-------+--------------------------+

  1. 1 row in set (0.00 sec)

  1.  

  1. mysql>

但是这种方式也有一些弊端,例如生产环境很复杂,尤其是有大量事务的情况下。诸多信息根本无法清晰判断知道谁阻塞了谁;其次一点也不直观; 另外,这个也无法定位blocker 的SQL语句。这种方式只能作为辅助分析用途,通过查看取锁的详细信息,帮助进一步诊断问题。

2: Innotop工具

如下所示,Innotop工具很多情况下也不能定位到阻塞的语句(Blocking Query), 也仅仅能获取一些锁相关信息

3:通过查询information_schema数据库下与事务相关的几个系统表

还是构造之前的测试案例,在第一个会话中使用SELECT FOR UPDATE锁定其中一行记录

  1. mysql> use MyDB;

  1. Database changed

  1. mysql>  set session autocommit=0;

  1. Query OK, 0 rows affected (0.00 sec)

  1. mysql> select connection_id() from dual;

  1. +-----------------+

  1. | connection_id() |

  1. +-----------------+

  1. |              17 |

  1. +-----------------+

  1. 1 row in set (0.00 sec)

  1.  

  1. mysql> select * from test_blocking where id=1 for update;

  1. +----+-------+

  1. | id | name  |

  1. +----+-------+

  1. |  1 | kerry |

  1. +----+-------+

  1. 1 row in set (0.00 sec)

  1.  

  1. mysql>

然后在第二个连接会话中执行更新脚本,构造被阻塞的案例

  1. mysql> use MyDB;

  1. Database changed

  1. mysql> select connection_id() from dual;

  1. +-----------------+

  1. | connection_id() |

  1. +-----------------+

  1. |              19 |

  1. +-----------------+

  1. 1 row in set (0.00 sec)

  1.  

  1. mysql> update test_blocking set name='kk' where id=1;

  1.  

此时阻我们在第三个连接会话查找谁被阻塞了

  1. SELECT b.trx_mysql_thread_id             AS 'blocked_thread_id' 

  1.       ,b.trx_query                      AS 'blocked_sql_text' 

  1.       ,c.trx_mysql_thread_id             AS 'blocker_thread_id'

  1.       ,c.trx_query                       AS 'blocker_sql_text'

  1.       ,( Unix_timestamp() - Unix_timestamp(c.trx_started) )

  1.                               AS 'blocked_time' 

  1. FROM   information_schema.innodb_lock_waits a

  1.     INNER JOIN information_schema.innodb_trx b

  1.          ON a.requesting_trx_id = b.trx_id

  1.     INNER JOIN information_schema.innodb_trx c

  1.          ON a.blocking_trx_id = c.trx_id

  1. WHERE  ( Unix_timestamp() - Unix_timestamp(c.trx_started) ) > 4;

  1.  

  1. SELECT a.sql_text,

  1.        c.id,

  1.        d.trx_started

  1. FROM   performance_schema.events_statements_current a

  1.        join performance_schema.threads b

  1.          ON a.thread_id = b.thread_id

  1.        join information_schema.processlist c

  1.          ON b.processlist_id = c.id

  1.        join information_schema.innodb_trx d

  1.          ON c.id = d.trx_mysql_thread_id

  1. where c.id=17

  1. ORDER  BY d.trx_started\G;

如下截图所示,第一个SQL语句能够查到线程19 被线程 17阻塞了, 被阻塞的SQL语句为“update test_blocking set name='kk' where id=1;”, 能够查到被阻塞了多长时间,但是无法查到源头SQL语句。此时就需要第二个SQL语句登场,找到源头语句。

但是不要太天真的认为第二个SQL语句能够获取所有场景下的阻塞源头SQL语句,实际业务场景,会话可能在执行一个存储过程或复杂的业务,有可能它执行完阻塞源头SQL后,继续在执行其它SQL语句,此时,你抓取的是这个连接会话最后执行的SQL语句,如下所示,我简单构造了一个例子。就能构造这样的一个场景。这个我曾经写过一篇博客“为什么数据库有时候不能定位阻塞(Blocker)源头的SQL语句”,分析SQL Server和ORACLE 定位查找阻塞源头SQL语句,现在看来真是大道同源,殊途同归。

  1. mysql> select * from test_blocking where id=1 for update;

  1. +----+-------+

  1. | id | name  |

  1. +----+-------+

  1. |  1 | kerry |

  1. +----+-------+

  1. 1 row in set (0.00 sec)

  1.  

  1. mysql> delete from student where stu_id=1001;

  1. Query OK, 1 row affected (0.00 sec)

  1.  

  1. mysql>

总结: 最简单、方便的还是上面两个SQL查询定位blocker的SQL语句,但是需要注意:有时候它也查不到真正阻塞的源头SQL语句。所以还需结合应用程序代码与上下文环境进行整体分析、判断!

MySQL Innodb如何找出阻塞事务源头SQL的更多相关文章

  1. SQLServer找出执行慢的SQL语句

      SELECT (total_elapsed_time / execution_count)/1000 N'平均时间ms' ,total_elapsed_time/1000 N'总花费时间ms' , ...

  2. 在百万数据中找出重复的数据sql

    select * from (select count(name) as isone, name from tbl_org_departments group by name) t where t.i ...

  3. 怎么找出解析失败的sql

    本文由我和公司同事问心共同测试分析完成. 很多时候我们会有这样一个误区,语法错误或者对象不存在应该在语法语义检查这个步骤就结束了,怎么还会存在共享池里面呢?带着这个几个问题我们做几个简单的测试. 我们 ...

  4. Oracle阻塞会话源头查找-单机和RAC环境

    在写 Oracle session相关数据字典(一)  这篇文章时,提到使用v$session视图的树形查询可以得到Oracle锁树,这样就便于我们找出阻塞会话的源头,但是仅仅可以在单机环境中使用.今 ...

  5. 在 Linux 上找出并解决程序错误的主要方法【转】

    转自:https://www.ibm.com/developerworks/cn/linux/sdk/l-debug/index.html 本文讨论了四种调试 Linux 程序的情况.在第 1 种情况 ...

  6. MySQL如何找出未提交事务信息

    前阵子,我写了一篇博客"ORACLE中能否找到未提交事务的SQL语句", 那么在MySQL数据库中,我们能否找出未提交事务执行的SQL语句或未提交事务的相关信息呢? 实验验证了一下 ...

  7. MySQL InnoDB中的事务隔离级别和锁的关系

    前言: 我们都知道事务的几种性质,数据库为了维护这些性质,尤其是一致性和隔离性,一般使用加锁这种方式.同时数据库又是个高并发的应用,同一时间会有大量的并发访问,如果加锁过度,会极大的降低并发处理能力. ...

  8. MySQL InnoDB四个事务级别 与 脏读、不反复读、幻读

    MySQL InnoDB事务隔离级别脏读.可反复读.幻读 希望通过本文.能够加深读者对ySQL InnoDB的四个事务隔离级别.以及脏读.不反复读.幻读的理解. MySQL InnoDB事务的隔离级别 ...

  9. 搞懂MySQL InnoDB事务ACID实现原理

    前言 说到数据库事务,想到的就是要么都做修改,要么都不做.或者是ACID的概念.其实事务的本质就是锁和并发和重做日志的结合体.那么,这一篇主要讲一下InnoDB中的事务到底是如何实现ACID的. 原子 ...

随机推荐

  1. AngularJS1.X学习笔记11-服务

    如果我没记错的话,spring里边有个service层.什么是服务呢?个人理解就是很多地方要用的,可以跨越控制器甚至是跨越模块的工具.AngularJS也为我们提供了服务这种机制,这让我们可以将一些不 ...

  2. 帧动画的创建方式 - 纯Java代码方式

    废话不多说,先看东西 帧动画的创建方式主要以下2种: * 用xml创建动画: * 纯Java代码创建动画:   本文内容主要关注 纯java代码创建帧动画 的方式: 用xml创建帧动画:http:// ...

  3. python 内置函数之lambda-filter-reduce-apply-map

    (1)lambda lambda是Python中一个很有用的语法,它允许你快速定义单行最小函数.类似于C语言中的宏,可以用在任何需要函数的地方. 基本语法如下: 函数名 = lambda args1, ...

  4. Python内置函数(56)——locals

     英文文档: locals() Update and return a dictionary representing the current local symbol table. Free var ...

  5. 20165230 2017-2018-2 《Java程序设计》第4周学习总结

    20165230 2017-2018-2 <Java程序设计>第4周学习总结 教材学习内容总结 子类与继承 通过class 子类名 extends 父类名定义子类.子类只能继承一个父类,关 ...

  6. JMeter入门(01)概念和样例

    一.概念 JMeter 是一款专门用于功能测试和压力测试的轻量级测试开发平台,实现了许多和互联网相关的网络测试组件,同时还保留着很强的扩展性. JMeter可以用来测试诸如:静态文件,Java Ser ...

  7. python学习之路01

    python自己也自学过一段时间了,看过视频,也买过几本基础的书来看,目前为止对于一些简单的代码还是可以看懂,但是自己总是觉得缺少些什么,可能是缺少系统化的学习,也可能是缺少实际项目经验,对于这些缺少 ...

  8. Python中使用hashlib进行加密的简单使用

    import hashlib ''' 原文= '字符串' 哈希加密对象 = hashlib.加密算法( 原文.encode('utf-8') ) 密文 = 哈希加密对象.hexdigest() #密文 ...

  9. android 加速度传感器 ---摇一摇

    package com.eboy.testyaoyiyao;import java.text.SimpleDateFormat;import java.util.Date;import android ...

  10. uvalive 3213 Ancient Cipher

    https://vjudge.net/problem/UVALive-3213 题意: 输入两个字符串,问是否可以由第一个字符串的每个字符一一映射得到第二个字符串,字符是可以随意移动的. 思路: 统计 ...