linux操作系统故障处理-ext4文件系统超级块损坏修复

 

背景

前天外面出差大数据测试环境平台有7台服务器挂了,同事重启好了五台服务器,但是还有两台服务器启动不起来,第二天回来后我和同事再次去机房检查,发现两台服务器都显示superblock的报错,经过一番处理后两台服务器都正常进系统了,现决定重现superblock故障并将此类问题故障处理思路写下来方便后面新同事参考。

硬盘的结构

硬盘的物理结构侧视图和俯视图,这两张图传递出来的比较重要的信息如下:

磁盘划分为磁头(Head),柱面(Cylinder),扇区(Sector)

磁头:每个磁片正反两面各有一个磁头,磁头固定在可移动的机械臂上,用于读写数据

磁道:当硬盘盘片旋转时,磁头若保持在一个位置上,则磁头会在盘片表面划出一个圆形轨迹,这些圆形轨迹就叫做磁道,磁道由外向内从0开始编号。

柱面:磁片中半径相同的同心磁道(Track)构成柱面。在实际应用中经常用到的磁盘分区就是用它作为范围划分的(重要)。

扇区:每个磁道上的一个弧段被成为一个扇区,它是硬盘的最小组成单元,一般扇区的大小是512字节。

了解了这几个概念就能算出一个分区的大小

硬盘容量:磁头数*柱面数*扇区数*512

磁盘sda的容量是: 255 * 2610 * 63 * 512 = 21467980800 ,算出的容量跟系统显示的基本一致。

[root@server1 ~]# fdisk -l

Disk /dev/sda: 21.5 GB, 21474836480 bytes
255 heads, 63 sectors/track, 2610 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disk identifier: 0x000205e3 Device Boot Start End Blocks Id System
/dev/sda1 * 1 26 204800 83 Linux
Partition 1 does not end on cylinder boundary.
/dev/sda2 26 2611 20765696 8e Linux LVM Disk /dev/sdb: 10.7 GB, 10737418240 bytes
255 heads, 63 sectors/track, 1305 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disk identifier: 0x00000000

ext4文件系统

由于Linux系统是多用户多的。从ext2开始,将磁盘分区格式化后是将文件属性和文件内容分开存储的,分别由inode和block来负责。

inode

用于存储文件的各属性,包括:

- 所有者信息:文件的owner,group;

- 权限信息:read、write和excite;

-时间信息:建立或改变时间(ctime)、最后读取时间(atime)、最后修改时间(mtime);

- 标志信息:一些flags;

- 内容信息:type,size,以及相应的block的位置信息。

注意:不记录文件名或目录名,文件名或目录名记录在文件所在目录对应的block里。

inode的大小一般是12Bytes,也可能是256 Bytes.

block

用于存储文件的内容,它的大小一般是1K,2K,4K,一般在磁盘格式化的时候就默认了。

因为现在的磁盘都比较大,对其进行格式化后inode和block的个数将会非常大,为了便于管理,ext4文件系统在格式化的时候基本上是区分为多个区块群组(block group),这个跟军队里层级划分很像哦.
ext4文件系统格式化后的划分是下面这样的。

 

Boot Sector 是用于引导分区上的操作系统的,这个一般用在双系统上,这里就直接忽略了。

Block Group 为了便于管理,文件系统格式化的时候划分为了多个区块群组,它里面保存了以下内容:

超级块(Superblock):

Superblock 是记录整个 filesystem 相关信息的地方.为了系统的健壮性,最初每个块组都有超级块和组描述符表的一个拷贝,但是当文件系统很大时,这样浪费了很多块(尤其是组描述符表占用的块多),后来采用了一种稀疏的方式来存储这些拷贝,只有块组号是3, 5 ,7的幂的块组(譬如说1,3,5,7,9,25,49…)才备份这个拷贝。通常情况下,只有主拷贝(第0块块组)的超级块信息被文件系统使用,其它拷贝只有在主拷贝被破坏的情况下才使用,他记录的信息主要有:

block 与 inode 的总量;

  • 未使用与已使用的 inode / block 数量;
  • block 与 inode 的大小 (block 为 1, 2, 4K,inode 为 128 ,256bytes);
  • filesystem 的挂载时间、最近一次写入数据的时间、最近一次检验磁盘 (fsck) 的时间等文件系统的相关信息;
  • 一个 valid bit 数值,若此文件系统已被挂载,则 valid bit 为 0 ,若未被挂载,则 valid bit 为 1 。

档案系统描述(Filesystem Description):

这个区段可以描述每个 block group 的开始与结束的 block 号码,以及说明每个区段 (superblock, bitmap, inodemap, data block) 分别介于哪一个 block 号码之间.

区块位图(block bitmap)

区块对应表用于描述该块组所管理的块的分配状态。如果某个块对应的位未置位,那么代表该块未分配,可以用于存储数据;否则,代表该块已经用于存储数据或者该块不能够使用(譬如该块物理上不存在)。由于区块位图仅占一个块,因此这也就决定了块组的大小。

Inode位图(Inode bitmap)

Inode位图用于描述该块组所管理的inode的分配状态。我们知道inode是用于描述文件的元数据,每个inode对应文件系统中唯一的一个号,如果inode位图中相应位置位,那么代表该inode已经分配出去;否则可以使用。由于其仅占用一个块,因此这也限制了一个块组中所能够使用的最大inode数量。

Inode table(Inode表)

Inode表用于存储inode信息。它占用一个或多个块(为了有效的利用空间,多个inode存储在一个块中),其大小取决于文件系统创建时的参数,由于inode位图的限制,决定了其最大所占用的空间。

Data block(数据块)

数据块存放真正的文件数据

模拟文件系统故障和故障处理解决

模拟superblock超级块故障

现在回过头来观察自己的文件系统,每个区段与superblock的信息都可以使用dumpe2fs这个命令来查询

[root@server1 ~]# dumpe2fs /dev/sdb|more
dumpe2fs 1.41.12 (17-May-2010)
Filesystem volume name: <none> ---------->> 文件系统的名称
Last mounted on: <not available> -------------------------------->> 分区挂载,当前没有挂载,所以显示不可用
Filesystem UUID: c6421bf7-8497-45c0-86b0-dfac1b21989a
Filesystem magic number: 0xEF53
Filesystem revision #: 1 (dynamic)
Filesystem features: has_journal ext_attr resize_inode dir_index filetype extent flex_bg sparse_super large_file huge_file
uninit_bg dir_nlink extra_isize ----------->> 文件系统的一些特性
Filesystem flags: signed_directory_hash
Default mount options: (none)
Filesystem state: clean ----------->> 文件系统当前是好的(clean)
Errors behavior: Continue
Filesystem OS type: Linux
Inode count: 655360 -------->> Inode 总的个数
Block count: 2621440 --------->> Block 总的个数
Reserved block count: 131072
Free blocks: 2541777 --------->> 空闲的block个数
Free inodes: 655349 ----------->> 空闲的inode个数
First block: 0 ------------->>第一个block的编号
Block size: 4096 --------------->> block的大小,这里是4K
Fragment size: 4096
Reserved GDT blocks: 639
Blocks per group: 32768 ------------------->> 每个块组block的个数
Fragments per group: 32768
Inodes per group: 8192 ------------>> 每个块组inode的个数
Inode blocks per group: 512
Flex block group size: 16
Filesystem created: Sat Nov 11 13:23:30 2017
Last mount time: n/a
Last write time: Sat Nov 11 13:23:32 2017
Mount count: 0
Maximum mount count: 33
Last checked: Sat Nov 11 13:23:30 2017
Check interval: 15552000 (6 months)
Next check after: Thu May 10 13:23:30 2018
Lifetime writes: 291 MB
Reserved blocks uid: 0 (user root)
Reserved blocks gid: 0 (group root)
First inode: 11
Inode size: 256 ------------>> inode的大小
Required extra isize: 28
Desired extra isize: 28
Journal inode: 8
Default directory hash: half_md4
Directory Hash Seed: 2fd3813e-6245-4a62-bc28-34c1534c919d
Journal backup: inode blocks
Journal features: (none)
日志大小: 128M
Journal length: 32768
Journal sequence: 0x00000001
Journal start: 0 Group 0: (Blocks 0-32767) [ITABLE_ZEROED]
校验和 0xee7f,8181个未使用的inode
主 superblock at 0, Group descriptors at 1-1 -------------->> 主superblock的位置在编号为0的block中
保留的GDT块位于 2-640
Block bitmap at 641 (+641), Inode bitmap at 657 (+657)
Inode表位于 673-1184 (+673)
23897 free blocks, 8181 free inodes, 2 directories, 8181个未使用的inodes
可用块数: 8871-32767
可用inode数: 12-8192
Group 1: (Blocks 32768-65535) [INODE_UNINIT, ITABLE_ZEROED]
校验和 0x1ae3,8192个未使用的inode
备份 superblock at 32768, Group descriptors at 32769-32769 ------------->> 备份superblock的位置在编号为 32768 的block中
保留的GDT块位于 32770-33408
Block bitmap at 642 (+4294935170), Inode bitmap at 658 (+4294935186)
Inode表位于 1185-1696 (+4294935713)
32127 free blocks, 8192 free inodes, 0 directories, 8192个未使用的inodes
可用块数: 33409-65535
可用inode数: 8193-16384
Group 2: (Blocks 65536-98303) [INODE_UNINIT, BLOCK_UNINIT, ITABLE_ZEROED]
校验和 0x8b39,8192个未使用的inode
Block bitmap at 643 (+4294902403), Inode bitmap at 659 (+4294902419)
Inode表位于 1697-2208 (+4294903457)
32768 free blocks, 8192 free inodes, 0 directories, 8192个未使用的inodes
可用块数: 65536-98303
可用inode数: 16385-24576
Group 3: (Blocks 98304-131071) [INODE_UNINIT, ITABLE_ZEROED]
校验和 0x6c3d,8192个未使用的inode
备份 superblock at 98304, Group descriptors at 98305-98305
保留的GDT块位于 98306-98944
Block bitmap at 644 (+4294869636), Inode bitmap at 660 (+4294869652)
Inode表位于 2209-2720 (+4294871201)
32127 free blocks, 8192 free inodes, 0 directories, 8192个未使用的inodes
可用块数: 98945-131071
可用inode数: 24577-32768

说到这里心里大概有谱了,原来superblock在文件系统上是有备份的,那我们模拟下主superblock出问题,看如何恢复

这里直接利用dd命令将sdb磁盘第一个block的内容抹除

[root@server1 ~]# dd if=/dev/zero of=/dev/sdb bs=1 count=4096
记录了4096+0 的读入
记录了4096+0 的写出
4096字节(4.1 kB)已复制,0.019493 秒,210 kB/秒
[root@server1 ~]# dumpe2fs /dev/sdb
dumpe2fs 1.41.12 (17-May-2010)
dumpe2fs: Bad magic number in super-block 当尝试打开 /dev/sdb 时
找不到有效的文件系统超级块.
[root@server1 ~]# tune2fs -l /dev/sdb
tune2fs 1.41.12 (17-May-2010)
tune2fs: Bad magic number in super-block 当尝试打开 /dev/sdb 时
找不到有效的文件系统超级块.
[root@server1 ~]#

这时候我们根本无法从dumpe2fs和tune2fs看到Backup superblock的位置,都找不到superblock备份的位置该怎么恢复主superblock呢

注意下面的命令都是针对ext类文件系统的,其它文件系统不适用

首先要找到superblock备份的几个位置,这需要利用mke2fs这个命令

mke2fs:create an ext2/ext3/ext4 filesystem

利用mke2fs这个命令 mke2fs  -n  设备名,为了不引起歧义,所以这里直接复制了原文解释。

-n     Causes mke2fs to not actually create a filesystem, but display what it would do if it were to create
               a filesystem.  This can be used to determine the location of the backup superblocks for a particular
               filesystem,  so  long  as  the mke2fs parameters that were passed when the filesystem was originally
               created are used again.  (With the -n option added, of course!)

简单来说就是接了-n 参数 ,mke2fs 不是真的在设备上创建文件系统,它只是模拟这个过程并显示给你看。让你明白它究竟做了那些事。

[root@server1 ~]# mke2fs -n /dev/sdb
mke2fs 1.41.12 (17-May-2010)
/dev/sdb is entire device, not just one partition!
无论如何也要继续? (y,n) y
文件系统标签=
操作系统:Linux
块大小=4096 (log=2)
分块大小=4096 (log=2)
Stride=0 blocks, Stripe width=0 blocks
655360 inodes, 2621440 blocks
131072 blocks (5.00%) reserved for the super user
第一个数据块=0
Maximum filesystem blocks=2684354560
80 block groups
32768 blocks per group, 32768 fragments per group
8192 inodes per group
Superblock backups stored on blocks:
32768, 98304, 163840, 229376, 294912, 819200, 884736, 1605632 --------------->>> 超级块的备份位置就在这里 [root@server1 ~]#

利用上面的命令就可以找到超级块的备份位置了。然后我们就可以再利用系统提供的另一个磁盘命令e2fsck命令进行恢复,它有一个-b选项,由于我的操作系统是ext4格式的,也可以用fsck.ext4 -b 32768 /dev/sdb,效果一样。

恢复的命令格式:  e2fsck –b superblock   device

-b superblock
               Instead of using the normal superblock, use an alternative superblock specified by superblock.  This
               option is normally used when the primary superblock has been corrupted.  The location of the  backup
               superblock is dependent on the filesystem’s blocksize.  For filesystems with 1k blocksizes, a backup
               superblock can be found at block 8193; for filesystems with 2k blocksizes, at block 16384;  and  for
               4k blocksizes, at block 32768.

Additional  backup  superblocks can be determined by using the mke2fs program using the -n option to
               print out where the superblocks were created.   The -b option to mke2fs, which  specifies  blocksize
               of the filesystem must be specified in order for the superblock locations that are printed out to be
               accurate.

If an alternative superblock is specified and the filesystem is not opened  read-only,  e2fsck  will
               make  sure  that  the  primary superblock is updated appropriately upon completion of the filesystem
               check.

[root@server1 ~]# e2fsck -b 32768 /dev/sdb
e2fsck 1.41.12 (17-May-2010)
/dev/sdb was not cleanly unmounted, 强制检查.
第一步: 检查inode,块,和大小
第二步: 检查目录结构
第3步: 检查目录连接性
Pass 4: Checking reference counts
第5步: 检查簇概要信息 /dev/sdb: ***** 文件系统已修改 *****
/dev/sdb: 11/655360 files (0.0% non-contiguous), 79663/2621440 blocks
[root@server1 ~]# dumpe2fs /dev/sdb|more
dumpe2fs 1.41.12 (17-May-2010)
Filesystem volume name: <none>
Last mounted on: <not available>
Filesystem UUID: c6421bf7-8497-45c0-86b0-dfac1b21989a
Filesystem magic number: 0xEF53
Filesystem revision #: 1 (dynamic)
Filesystem features: has_journal ext_attr resize_inode dir_index filetype extent flex_bg sparse_super large_file huge_file
uninit_bg dir_nlink extra_isize
Filesystem flags: signed_directory_hash
Default mount options: (none)
Filesystem state: clean
Errors behavior: Continue
Filesystem OS type: Linux
Inode count: 655360
Block count: 2621440
Reserved block count: 131072
Free blocks: 2541777
Free inodes: 655349
First block: 0
Block size: 4096
Fragment size: 4096
Reserved GDT blocks: 639
Blocks per group: 32768
Fragments per group: 32768
Inodes per group: 8192
Inode blocks per group: 512
Flex block group size: 16
Filesystem created: Sat Nov 11 13:23:30 2017
Last mount time: n/a
Last write time: Sat Nov 11 16:57:39 2017
Mount count: 0
Maximum mount count: 33
Last checked: Sat Nov 11 16:57:39 2017

现在主超级块已经恢复了,系统可以正常使用。

模拟组描述错误故障和解决故障

那如果档案系统描述(GDT)损坏了怎么办,这里也可以试验下:

这里块组1的组描述符是在第二个块的,直接利用dd覆盖第二个块,可以看到现在磁盘已经无法进行挂载了。并且系统提示组块0有错误。

[root@server1 /]# dd if=/dev/zero of=/dev/sdb bs=1 count=4096 seek=4096
记录了4096+0 的读入
记录了4096+0 的写出
4096字节(4.1 kB)已复制,0.0795117 秒,51.5 kB/秒
[root@server1 /]# mount /dev/sdb /data/
mount: wrong fs type, bad option, bad superblock on /dev/sdb,
missing codepage or helper program, or other error
In some cases useful info is found in syslog - try
dmesg | tail or so
[root@server1 /]# dmesg |tail -5
EXT4-fs (sdb): mounted filesystem with ordered data mode. Opts:
EXT4-fs (sdb): ext4_check_descriptors: Checksum for group 0 failed (43116!=0)
EXT4-fs (sdb): group descriptors corrupted!
EXT4-fs (sdb): ext4_check_descriptors: Checksum for group 0 failed (43116!=0)
EXT4-fs (sdb): group descriptors corrupted!
[root@server1 /]#

组描述错误可以直接利用fsck –y  device设备名来进行修复,修复好后就能正常挂载 。

[root@server1 /]# fsck -y /dev/sdb
fsck from util-linux-ng 2.17.2
e2fsck 1.41.12 (17-May-2010)
fsck.ext4: Group descriptors look bad... trying backup blocks...
/dev/sdb was not cleanly unmounted, 强制检查.
第一步: 检查inode,块,和大小
第二步: 检查目录结构
第3步: 检查目录连接性
Pass 4: Checking reference counts
第5步: 检查簇概要信息
Free 块s count wrong for 簇 #48 (24544, counted=24543).
处理? 是 Free 块s count wrong (2541777, counted=2541776).
处理? 是 Free inodes count wrong for 簇 #48 (8192, counted=8191).
处理? 是 Directories count wrong for 簇 #48 (0, counted=1).
处理? 是 Free inodes count wrong (655349, counted=655348).
处理? 是 /dev/sdb: ***** 文件系统已修改 *****
/dev/sdb: 12/655360 files (0.0% non-contiguous), 79664/2621440 blocks
[root@server1 /]# mount /dev/sdb /data/
[root@server1 /]# df -lh
Filesystem Size Used Avail Use% Mounted on
/dev/mapper/VolGroup-LogVol01_root 9.9G 4.3G 5.1G 46% /
tmpfs 491M 32K 491M 1% /dev/shm
/dev/sda1 194M 35M 150M 19% /boot
/dev/mapper/VolGroup-LogVol02_home 7.7G 149M 7.2G 2% /home
/dev/sdb 9.9G 151M 9.2G 2% /data
[root@server1 /]#

linux操作系统故障处理-ext4文件系统超级块损坏修复的更多相关文章

  1. 一例Ext4文件系统fsck后损坏的修复过程

    1.故障发生背景 Ext4文件系统没有umount下来,之后做了fsck操作检查一致性,结果导致Ext4文件mount不上(有时也会表现为导致目录变成了文件). 报错提示信息:mount: wrong ...

  2. linux超级块和inode 详解 和 df 、du 命令详解与环境变量

    一.inode块,Unix文件的核心. 首先需要明白的是,在Unix操作系统中的任何资源都被当作文件来管理.如目录.光驱.终端设备等等,都被当作是一种文件.从这方面来说,Unix操作系统中的所有的目录 ...

  3. Linux 文件系统错误的修复方法 ddrescue替代dd的恢复软件 备用超级块

    Linux 文件系统错误的修复方法  ddrescue替代dd的恢复软件  备用超级块 最近处理的一件 linux 服务器断电导致文件系统启动后文件系统不可读写,数据不可用的案例,现总结下 Linux ...

  4. 使用 /proc 文件系统来访问 linux操作系统 内核的内容 && 虚拟文件系统vfs及proc详解

    http://blog.163.com/he_junwei/blog/static/19793764620152743325659/ http://www.01yun.com/other/201304 ...

  5. Ext4文件系统修复

    Ext4文件系统修复 目录 一. super block........................................................................ ...

  6. 如何在Linux上实现文件系统的自动检查和修复?

    Linux文件系统有可能在各种各样的情况下受到损坏,比如系统崩溃.突然断电.磁盘断开,或者文件节点 (i-node)不小心被覆盖等等,因此需要定期检查文件系统,而说到检查和修复Linux文件系统,fs ...

  7. Ext4文件系统架构分析(二)

    接着上一篇博文,继续分析Ext4磁盘布局中的元数据. 1.7 超级块 超级块记录整个文件系统的大量信息,如数据块个数.inode个数.支持的特性.管理信息,等待. 如果设置sparse_super特性 ...

  8. Ext4文件系统架构分析(三) ——目录哈希、扩展属性与日志

    struct dx_root Htree的内部节点: struct dx_node Htree 树根和节点中都存在的 Hash map: struct dx_entry 1.20 扩展属性EA 扩展属 ...

  9. ext4文件系统由文件的inode号定位其inode Table

    在ubuntu中(以16.06为例),stat filename 可以查看文件的inode数值,但是如何确定该inode项具体在哪个块组下的inode Table中不是那么容易,接下来通过一步步计算来 ...

随机推荐

  1. 手摸手教你阅读和调试大型开源项目 ZooKeeper

    本文作者:HelloGitHub-老荀 Hi,这里是 HelloGitHub 推出的 HelloZooKeeper 系列,免费开源.有趣.入门级的 ZooKeeper 教程,面向有编程基础的新手. 项 ...

  2. maven setting.xml 阿里云镜像 没有一句废话

    <?xml version="1.0" encoding="UTF-8"?> <!-- Licensed to the Apache Soft ...

  3. 201871030102-崔红梅 实验二 个人项目—— D{0-1}KP 项目报告

    项目 内容 课程班级博客链接 班级博客 这个作业要求链接 实验二作业链接 我的课程学习目标 1.熟练掌握将本地代码保存至GitHub中2.掌握折扣背包问题3.回顾动态规划算法和回溯算法4.对java语 ...

  4. 还在使用MyBatis Generator?试试这个工具

    代码生成 在企业软件开发过程中,大多数时间都是面向数据库表的增删改查开发.通过通用的增删改查代码生成器,可以有效的提高效率,降低成本:把有规则的重复性劳动让机器完成,解放开发人员. MyBatis G ...

  5. Nginx/Apache + acme.sh 实现https访问

    1 概述 acme.sh实现了acme协议,可以从Let's Encrypt生成免费的ssl证书用于实现https,本文介绍了常见的两种服务器Apache与Nginx上利用acme.sh配置https ...

  6. IDEA - 返回上一步,回到下一步 代码 快捷键

    回到上一步 ctrl + alt + < 回到下一步 ctrl + alt + >

  7. 9. resultMap 结果映射集

    @Data public class CreditCard extends BankCard { /** * 消费额度 */ private String creditLine; } @Data pu ...

  8. Azure data studio 跨平台数据库管理工具试用

    最近折腾 azure sql database 的时候发现了微软的一款新的数据库管理工具: azure data studio.从名字上看 azure data studio 好像是专门为 azure ...

  9. Go之Zap日志库集成Gin

    简介 在许多Go语言项目中,我们需要一个好的日志记录器能够提供下面这些功能: 1 . 能够将事件记录到文件中,而不是应用程序控制台; 2 . 日志切割-能够根据文件大小.时间或间隔等来切割日志文件; ...

  10. @valid和自定义异常

    @valid和自定义异常 问题的产生: 当有很多参数需要校验时,比如name,age,email等很多参数都需要判空,或者有长度限制时,如果后端写很多if-else就有很多代码,不美观,不优雅.前端每 ...