【服务器数据恢复】VSAN节点容量盘故障离线的数据恢复案例
VSAN简介:
VSAN是以vSphere内核为基础开发,可以扩展使用的分布式存储架构。该架构在vSphere集群主机中安硬盘及闪存构建VSAN存储层,通过存储进行管理与控制,最终形成一个共享存储层。
VSAN数据存储是一个对象存储,以文件系统的形式呈现给vSphere主机。这个对象存储服务会从VSAN集群中的每台主机上加载卷,然后展现为单一的、在所有节点上可见的分布式共享数据存储。
VSAN简化了存储配置,对于虚拟机来说就只有一个数据存储。这个分布式数据存储来自VSAN集群中每台vSphere主机上的存储空间,通过磁盘组进行配置,在单独的存储实体中存储所有的虚拟机文件。如果闪存盘或者容量盘出现故障的时候,数据会向其他节点转移,虽然这种存储方式相对安全,但是在转移的过程中也有可能出现其他故障。
服务器数据恢复环境:
四台服务器节点组成的VSAN集群;
每台服务器节点上有两个磁盘组;每个磁盘组由一块SSD硬盘+5块SAS硬盘组成,SSD做闪存,SAS做容量盘。
服务器故障:
其中一个服务器节点上的一个磁盘组中的容量盘出现故障离线,这个时候VSAN开始数据重构&迁移,在迁移还没有完成的时候机房停电。来电重启设备后发现该服务器节点上另外一个磁盘组中有两块容量盘故障离线,数据存储出现故障。虽然可以登陆VSAN管理控制台,但是所有的虚拟机都无法访问了。
服务器数据恢复过程:
1、把四个服务器节点的所有硬盘以只读方式做镜像备份,后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始数据造成二次破坏。
2、基于镜像文件分析底层数据的存储结构,确认虚拟机所在硬盘的分布信息。北亚企安数据恢复工程师根据分析出来的数据存储结构开发相应的程序来测试数据分布信息的准确性。
3、单独分析每个服务器节点上的两个磁盘组,搞清楚磁盘组内的闪存盘和容量盘之间的对应关系,每块硬盘都有一个唯一标识进行磁盘间的对应。
a、获取每块磁盘的UUID和磁盘组的UUID
b、获取每个磁盘组中的容量盘的组件信息。
c、根据容量盘的组件信息中记录的组件的MAP位置提取组件位图。
d、根据组件位图提取组件数据和缓存数据。
e、根据组件的描述信息获取组件所属对象和组件顺序,把组件合并成对象。
f、根据对象提取数据。
可以将对象看成一个卷,也可以把对象看做一个逻辑卷,每个数据存储上的VSAN对象都是由多个组件构成,这些组件分布于集群主机上配置的磁盘组中。在恢复VSAN数据过程中,组件信息的提取是关键。本案例故障组件损坏比较少,恢复出来的虚拟机都能正常启动。
【服务器数据恢复】VSAN节点容量盘故障离线的数据恢复案例的更多相关文章
- Redis07-Redis单节点容量问题,twemproxy,predixy的使用
Redis单节点容量问题 一.单节点容量问题 我们在实际场景中,往往遇上一个单节点容量问题. 1.进行业务拆分,数据分类 2.到了数据不能拆分的时候,可以进行数据分片 进行哈希取模(影响分布式下的扩展 ...
- ubuntu服务器 安装 seafile 个人网盘
目录 ubuntu服务器 安装 seafile 个人网盘 一.实验环境: 二.实验流程介绍 三.网盘搭建 1.安装依赖环境 2.安装seafile 三.配置QQ域名邮箱 四.配置seafile邮件服务 ...
- UVALive-3972 March of the Penguins (最大流:节点容量)
题目大意:有n个带有裂缝的冰块.已知每个冰块的坐标和已经站在上面的企鹅数目,每当一个企鹅从一个冰块a跳到另一个冰块b上的时候,冰块a上的裂缝便增大一点,还知道每个冰块上最多能被跳跃的次数.所有的企鹅都 ...
- Mongodb 5节点异地两中心故障转移恢复测试案例
Mongodb5节点异地两中心故障转移恢复测试案例 架构方式:5节点,主中心(2数据1仲裁),备中心(1数据1仲裁) 1基本情况 操作系统:Red Hat Enterprise Linux Serve ...
- 【故障公告】数据库服务器 CPU 近 100% 引发的故障
抱歉,今天上午 10:48 ~ 10:33 期间,我们所使用的数据库服务(阿里云 RDS 实例 SQL Server 2016 标准版)又出现了 CPU 近 100% 问题,由此给您带来麻烦,请您谅解 ...
- Yarn 容量调度器多队列提交案例
目录 Yarn 容量调度器多队列提交案例 需求 配置多队列的容量调度器 1 修改如下配置 SecureCRT的上传和下载 2 上传到集群并分发 3 重启Yarn或yarn rmadmin -refre ...
- 服务器数据恢复方法_存储raid硬盘离线数据恢复案例
[故障描述]某法院的一台HP-P4500的存储系统,底层是12块1TB的硬盘组的RAID.其中每6个1TB的盘一组,第一组的前面一部分组了一个RAID0+1,是存放HP-P4500嵌入式系统,接着组了 ...
- RAC OCR盘故障导致的集群重启恢复
一.事故说明 最近出现了一次OCR盘的故障导致Oracle集群件宕机的事故,后以独占模式启动集群,并使用ocr备份恢复了OCR文件以及重新设置了vote disk,然后关闭集群,重启成功. 因此在此处 ...
- 【故障公告】数据库服务器 CPU 近 100% 引发的故障(源于 .NET Core 3.0 的一个 bug)
非常抱歉,这次故障给您带来麻烦了,请您谅解. 今天早上 10:54 左右,我们所使用的数据库服务(阿里云 RDS 实例 SQL Server 2016 标准版)CPU 突然飙升至 90% 以上,应用日 ...
- 【故障公告】10:30-10:45 左右 docker swarm 集群节点问题引发故障
非常抱歉,今天 10:30-10:45 左右由于 docker swarm 集群节点出现问题,造成除博客之外的站点出现访问异常,由此给您带来很大的麻烦,请您谅解. 故障开始时出现有时访问正常有时访问出 ...
随机推荐
- Redis 源码解读之 Rehash 的调用时机
Redis 源码解读之 Rehash 的调用时机 背景和问题 本文想要解决的问题 什么时机触发 Rehash 操作? 什么时机实际执行 Rehash 函数? 结论 什么时机触发 Rehash 操作? ...
- 李超树学习笔记 & JZOJ 5039. 【NOI2017模拟4.2】查询题解
李超树 它本质上是线段树的拓展运用 解决的问题:平面直角坐标系中,支持插入线段,问 \(x = x_0\) 这条直线上最大的 \(y\) 值 它维护的东西很奇特:优势线段 何为"优势线段&q ...
- JZOJ 3479. 工作安排
\(\text{solution}\) 比较显然的 \(dp\) 顺序既然无所谓,那为了方便处理贡献,就先排个序 然后设 \(f_i\) 表示分到前 \(i\) 个的最小工资 则 \(f_i=C+f_ ...
- Windows下小狼毫配置五笔拼音方案
Windows下小狼毫配置五笔拼音方案 目录 Windows下小狼毫配置五笔拼音方案 1 下载并安装小狼毫rime 2 配置五笔.五笔拼音方案 3 安装设置五笔拼音混合输入 4 设置输入方案 1 下载 ...
- “堆内存持续占用高 且 ygc回收效果不佳” 排查处理实践
作者:京东零售 王江波 说明:部分素材来源于网络,数据分析全为真实数据. 一. 问题背景 自建的两套工具,运行一段时间后均出现 内存占用高触发报警,频繁young gc且效果不佳.曾经尝试多次解决,因 ...
- 利用自定义ref实现防抖
1. debounce.js import { customRef } from 'vue'; export function debounceRef(value, delay = 1000) { l ...
- 通过docker 安装部署sentry
一.下载项目 git clone https://github.com/getsentry/self-hosted 二.安装 1.安装docker和docker-compose 2.运行sentry ...
- 关于winform 调用本地html页面路径不正确问题
//为了使网页能够与winform交互 将com的可访问性设置为真 [System.Security.Permissions.PermissionSet(System.Security.Permiss ...
- the default discovery settings are unsuitable for production use at least one of...的解决办法
解决办法 elasticsearch.yml加上 discovery.type: single-node
- k8s之pod的生命周期
pod生命周期 和一个个独立的应用容器一样,Pod 也被认为是相对临时性(而不是长期存在)的实体. Pod 会被创建.赋予一个唯一的 ID(UID),并被调度到节点,并在终止(根据重启策略)或删除之前 ...