linux xfs的一次io异常导致的crash

8556395.925003] XFS (sdi): xfs_log_force: error - returned.

[8556407.425047] INFO: task umount: blocked for more than  seconds.----这个默认是120，该环境上是被人为设置1200

[8556407.425653] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.

[8556407.426050] umount          D ffff881fffdd47c0         0x00000080------------------------19286是pid，19283是ppid

[8556407.426056]  ffff883e39587d80  ffff883e39587fd8 ffff883e39587fd8

[8556407.426066]  ffff883e39587fd8 00000000000147c0 ffff881fd3260000 ffff881f860fec80

[8556407.426072]  ffff883ed79e1a20 ffff881f860fecc0 ffff881f860fece8 ffff881f860fec90------------这12个64位的值为栈里的值

[8556407.426078] Call Trace:

[8556407.426092]  [<ffffffff8163e879>] schedule+0x29/0x70

[8556407.426137]  [<ffffffffa07c6cd1>] xfs_ail_push_all_sync+0xc1/0x110 [xfs]

[8556407.426143]  [<ffffffff810a7610>] ? wake_up_atomic_t+0x30/0x30

[8556407.426165]  [<ffffffffa07b1b98>] xfs_unmountfs+0x68/0x190 [xfs]

[8556407.426186]  [<ffffffffa07b267b>] ? xfs_mru_cache_destroy+0x6b/0x90 [xfs]

[8556407.426204]  [<ffffffffa07b4a52>] xfs_fs_put_super+0x32/0x90 [xfs]

[8556407.426211]  [<ffffffff811e3026>] generic_shutdown_super+0x56/0xe0-------已经执行完fsnotify_umount_inodes

[8556407.426215]  [<ffffffff811e3477>] kill_block_super+0x27/0x70

[8556407.426218]  [<ffffffff811e37b9>] deactivate_locked_super+0x49/0x60

[8556407.426222]  [<ffffffff811e3db6>] deactivate_super+0x46/0x60

[8556407.426229]  [<ffffffff81200d25>] mntput_no_expire+0xc5/0x120

[8556407.426234]  [<ffffffff812025cb>] SyS_umount+0x15b/0x5b0

[8556407.426239]  [<ffffffff81649909>] system_call_fastpath+0x16/0x1b

[8556407.426242] sending NMI to all CPUs:

对应的函数为：

/*

 * Push out all items in the AIL immediately and wait until the AIL is empty.

 */

void

xfs_ail_push_all_sync(

    struct xfs_ail  *ailp)

{

    struct xfs_log_item    *lip;

    DEFINE_WAIT(wait);

    spin_lock(&ailp->xa_lock);

    while ((lip = xfs_ail_max(ailp)) != NULL) {

        prepare_to_wait(&ailp->xa_empty, &wait, TASK_UNINTERRUPTIBLE);

        ailp->xa_target = lip->li_lsn;

        wake_up_process(ailp->xa_task);

        spin_unlock(&ailp->xa_lock);

        schedule();

        spin_lock(&ailp->xa_lock);

    }

    spin_unlock(&ailp->xa_lock);

    finish_wait(&ailp->xa_empty, &wait);

}

排查的时候走了弯路，因为看的是：

crash> dis -l xfs_ail_push_all_sync+0xc1

/usr/src/debug/kernel-3.10.-327.22..el7/linux-3.10.-327.22..el7.x86_64/include/linux/spinlock.h:

0xffffffffa07c6cd1 <xfs_ail_push_all_sync+>: mov    %r13,%rdi

所以想当然地认为在第一个获取spinlock的地方，

spin_lock(&ailp->xa_lock);---------以为在这hung住

    while ((lip = xfs_ail_max(ailp)) != NULL) {

然后查找这把锁：

  crash>  struct super_block.s_fs_info ffff883f7fe67800

  s_fs_info = 0xffff883f7fe67000

crash> mod -s xfs

     MODULE       NAME                   SIZE  OBJECT FILE

ffffffffa0803d40  xfs                    /lib/modules/3.10.-327.22..el7.x86_64/kernel/fs/xfs/xfs.ko

crash> struct -xo  xfs_mount.m_ail 0xffff883f7fe67000

struct xfs_mount {

  [ffff883f7fe67010] struct xfs_ail *m_ail;

}

 struct   xfs_mount.m_ail 0xffff883f7fe67000

  m_ail = 0xffff881f860fec80

crash> struct -xo  xfs_ail.xa_lock 0xffff881f860fec80

struct xfs_ail {

  [ffff881f860fecc0] spinlock_t xa_lock;

}

而且这把锁的值是：

crash> struct   xfs_ail.xa_lock 0xffff881f860fec80

  xa_lock = {

    {

      rlock = {

        raw_lock = {

          {

            head_tail = ,

            tickets = {

              head = ,

              tail =

            }

          }

        }

      }

    }

  }

我一看到这个是非0值，想当然认为是被持有了，为了验证我的想法，我甚至随便找了一把锁查看它的值，点背的时候，喝凉水都塞牙，我随手选择的锁是：

crash> p gc_lock

gc_lock = $ = {

  {

    rlock = {

      raw_lock = {

        {

          head_tail = ,

          tickets = {

            head = ,

            tail =

          }

        }

      }

    }

  }

}

后来仔细看了在没有开启 CONFIG_QUEUED_SPINLOCKS 的情况下，锁的定义才是如此，否则的话，是如下：

#ifndef __GENKSYMS__

typedef struct qspinlock {

    atomic_t    val;

} arch_spinlock_t;

#else

typedef u32 __ticketpair_t;

typedef struct arch_spinlock {

    union {

        __ticketpair_t    head_tail;

        struct __raw_tickets {

            __ticket_t head, tail;

        } tickets;

    };

} arch_spinlock_t;

#endif

所以要么0，要么1的情况只适合于第一种定义，以前因为业务默认配置的config问题，查的锁相关的crash，大多是第一种定义，但是当时没注意到这个细节，只是简单扫了一眼，浪费我两个小时，所以下盘不稳总会摔。

查看running状态的都没有持有这把锁，（其实按照第二种定义，是正常的，因为此时本就没人持有这把锁，因为head和tail相等）比较奇怪，后来找同事讨论，同事认为是while循环没跳出，所以获取锁的那行是schedule下面那行，还没有执行。

想起来自己曾经写过的博客《https://www.cnblogs.com/10087622blog/p/9558024.html》,应该是如此

void

xfs_ail_push_all_sync(

    struct xfs_ail  *ailp)

{

    struct xfs_log_item    *lip;

    DEFINE_WAIT(wait);

    spin_lock(&ailp->xa_lock);

    while ((lip = xfs_ail_max(ailp)) != NULL) {

        prepare_to_wait(&ailp->xa_empty, &wait, TASK_UNINTERRUPTIBLE);

        ailp->xa_target = lip->li_lsn;

        wake_up_process(ailp->xa_task);

        spin_unlock(&ailp->xa_lock);

        schedule();--------------------这个和while循环一直跳不出去，

        spin_lock(&ailp->xa_lock);

    }

    spin_unlock(&ailp->xa_lock);

    finish_wait(&ailp->xa_empty, &wait);

}

跳不出去的原因跟io相关，也就是wake_up 相关的内核线程之后，内核线程还是没有完成对应的任务：

crash> struct xfs_ail.xa_task 0xffff881f860fec80

  xa_task = 0xffff883f8901dc00

crash> task_struct.pid 0xffff883f8901dc00

  pid = 

crash> set

    PID:

COMMAND: "xfsaild/sdi"

   TASK: ffff883f8901dc00  [THREAD_INFO: ffff881f3d828000]

    CPU:

  STATE: TASK_INTERRUPTIBLE

crash> bt

PID:   TASK: ffff883f8901dc00  CPU:   COMMAND: "xfsaild/sdi"

 # [ffff881f3d82bcd0] __schedule at ffffffff8163df9b

 # [ffff881f3d82bd38] schedule at ffffffff8163e879

 # [ffff881f3d82bd48] schedule_timeout at ffffffff8163c295

 # [ffff881f3d82bdf8] xfsaild at ffffffffa07c6a4f [xfs]

 # [ffff881f3d82bec8] kthread at ffffffff810a661f

 # [ffff881f3d82bf50] ret_from_fork at ffffffff81649858

xfsaild 无法完成的原因也是因为IO异常:

附部分相关io异常的message日志：

kernel: sd :::: [sdi] CDB: Read()        4c b0

kernel: sd :::: [sdi] CDB: Read()         8a

kernel: blk_update_request: I/O error, dev sdi, sector

kernel: sd :::: rejecting I/O to offline device

kernel: XFS (sdi): metadata I/O error: block 0xee173de0 ("xfs_trans_read_buf_map") error  numblks

kernel: XFS (sdi): metadata I/O error: block 0x15da29d90 ("xfs_trans_read_buf_map") error  numblks

kernel: sd :::: rejecting I/O to offline device

kernel: XFS (sdi): xfs_imap_to_bp: xfs_trans_read_buf() returned error -.

kernel: XFS (sdi): metadata I/O error: block 0xeca8a480 ("xfs_trans_read_buf_map") error  numblks

kernel: sd :::: rejecting I/O to offline device

kernel: sd :::: rejecting I/O to offline device

对应的bug解决可以参照：https://bugzilla.redhat.com/show_bug.cgi?id=1267042

linux xfs的一次io异常导致的crash的更多相关文章

捉虫日记 | MySQL 5.7.20 try_acquire_lock_impl 异常导致mysql crash
背景近期线上MySQL 5.7.20集群不定期(多则三周,短则一两天)出现主库mysql crash.触发主从切换问题,堆栈信息如下: 从堆栈信息可以明显看出,在调用 try_acquire_loc ...
物理机异常断电，linux虚拟机系统磁盘mount失败，导致无法启动; kubectl 连接失败
虚拟机 CentOS 7 挂载文件系统失败上周五下班前没有关闭虚拟机和物理机, 今天周一开了虚拟机之后,发现操作系统启动失败. 原因跟这篇文章描述的一模一样. 解决操作系统的文件系统挂载的问题之后 ...
java.sql.SQLException: Io 异常: Connection reset
当数据库连接池中的连接被创建而长时间不使用的情况下,该连接会自动回收并失效,但客户端并不知道,在进行数据库操作时仍然使用的是无效的数据库连接,这样,就导致客户端程序报“ java.sql.SQLExc ...
Linux 下的五种 IO 模型
概念说明用户空间与内核空间现在操作系统都是采用虚拟存储器,那么对32位操作系统而言,它的寻址空间(虚拟存储空间)为4G(2的32次方).操作系统的核心是内核,独立于普通的应用程序,可以访问受保护的 ...
spring+ibatis问题1—— 程序报错：java.sql.SQLException: Io 异常: Connection reset by peer, socket write error; ”或“java.sql.SQLException 关闭的连接”异常
转自:http://blog.sina.com.cn/s/blog_1549fb0710102whz2.html spring+ibatis程序测试时报错:java.sql.SQLException: ...
linux性能优化cpu 磁盘IO MEM
系统优化是一项复杂.繁琐.长期的工作,优化前需要监测.采集.测试.评估,优化后也需要测试.采集.评估.监测,而且是一个长期和持续的过程,不是说现在优化了,测试了,以后就可以一劳永逸了,也不是说书本上 ...
Io 异常: The Network Adapter could not establish the connection
新接触一个项目,导入源码,在本地启动的时候后台报了一个错误: Could not discover the dialect to use. java.sql.SQLException: Io 异常: ...
oracle 数据库io 异常，错误代码17002 解决办法
数据库使用一个月了,突然挂掉:错误代码17002 io异常:read timeout 解决: 1.登陆sql命令窗口 [oracle@hostname ~]$ sqlplus /nolog SQL*P ...
【Android开发】 HttpURLConnection.getOutputStream() IO异常
HttpURLConnection.getOutputStream() IO异常百度下,没找到想要的答案.网上的解决方案几乎都是从权限考虑的~最后找到个国外网站上找到答案~ http://stack ...

随机推荐

转载一篇阿里云Terraform 开发指南
连接:https://www.jianshu.com/p/0aebea117cae 是一个比较详细的开发指南
ActiveMQ (三)—持久化消息
ActiveMQ的另一个问题就是只要是软件就有可能挂掉,挂掉不可怕,怕的是挂掉之后把信息给丢了,所以本节分析一下几种持久化方式: 一.持久化为文件 ActiveMQ默认就支持这种方式,只要在发消息时设 ...
Teamviewer远程控制
设置无人值守的固定密码,不使用随机码进行远程控制访问设置好密码之后,以后只要通过Teamviewer生成的固定ID,再加上你设置的密码就可以随时进行远程访问了,而不需要使用生成的随机码.
javax.el.PropertyNotFoundException: Property 'XXX' not found on type bean.XXXXX
javax.el.PropertyNotFoundException: Property 'XXX' not found on type bean.XXXXX 先检查页面语法是否有问题,后在页面的el ...
Jquery Mobile 让错误提示可在后台控制显示内容
在jquery.mobile-1.4.5.min.js的5254行找到下面代码 return $.proxy(function( xhr, textStatus, errorThrown ) { 然后 ...
数据库乐观锁和悲观锁的理解和实现（转载&总结）
数据的锁定分为两种,第一种叫作悲观锁,第二种叫作乐观锁. 1.悲观锁,就是对数据的冲突采取一种悲观的态度,也就是说假设数据肯定会冲突,所以在数据开始读取的时候就把数据锁定住.[数据锁定:数据将暂时不会 ...
MYSQL使用PMM进行性能监控
简介Percona监视和管理(PMM)是一个用于管理和监视MySQL和MongoDB性能的开源平台.它是由Percona与托管数据库服务.支持和咨询领域的专家合作开发的. PMM是一个免费的开源解决方 ...
atom插件
1.Sync Settings 搭配github,同步你的atom插件信息,配置信息,让你轻松实现一台电脑配置,多台电脑共享. 2.Emmet 能够基于Emmet语法产生HTML,做过前段开发的不会不 ...
Linux常用的命令以及配置
cat /etc/group nobody:x:500:用户组 : 口令 : 用户组编号 #查看用户信息 stunnel4:x:118:123::/var/run/stunnel4:/usr/sbin ...
Layout-1相关代码
<!doctype html> <html> <head> <meta charset="utf-8"> <title> ...

linux xfs的一次io异常导致的crash

linux xfs的一次io异常导致的crash的更多相关文章

随机推荐

热门专题