hdfs 的存储空间扩展

问题：之前集群上每个节点的的大小为50G，但是硬盘容量是160G的，不明白为什么才50个G；

后来发现是因为dfs.data.dir设置的问题，该目录下挂载的磁盘空间的大小就会作为该节点的容量。。

所以想到了挂两个目录，一个在 / 下面，一个在 /home下面，因为我的集群上这两个目录是挂在不同分区上的

但是随之而来的问题就是：

/************************************************************

STARTUP_MSG: Starting DataNode

STARTUP_MSG:   host = cdfsrv6.mit.edu/18.77.0.180

STARTUP_MSG:   args = []

STARTUP_MSG:   version = 0.19.2-dev

STARTUP_MSG:   build = http://svn.apache.org/repos/asf/hadoop/core/tags/release-0.19.1 -r 748415; compiled by 'wart' on Mon Mar 23 15:21:37 PDT 2009

************************************************************/

2010-03-30 16:46:18,456 ERROR datanode.DataNode (DataNode.java:main(1331)) - org.apache.hadoop.hdfs.server.common.InconsistentFSStateException: Directory /export/06a/hadoop/data is in an inconsistent state: has incompatible storage Id.

        at org.apache.hadoop.hdfs.server.datanode.DataStorage.getFields(DataStorage.java:183)

        at org.apache.hadoop.hdfs.server.common.Storage$StorageDirectory.read(Storage.java:227)

        at org.apache.hadoop.hdfs.server.common.Storage$StorageDirectory.read(Storage.java:216)

        at org.apache.hadoop.hdfs.server.datanode.DataStorage.doTransition(DataStorage.java:228)

        at org.apache.hadoop.hdfs.server.datanode.DataStorage.recoverTransitionRead(DataStorage.java:148)

        at org.apache.hadoop.hdfs.server.datanode.DataNode.startDataNode(DataNode.java:291)

        at org.apache.hadoop.hdfs.server.datanode.DataNode.<init>(DataNode.java:209)

        at org.apache.hadoop.hdfs.server.datanode.DataNode.makeInstance(DataNode.java:1242)

        at org.apache.hadoop.hdfs.server.datanode.DataNode.instantiateDataNode(DataNode.java:1197)

        at org.apache.hadoop.hdfs.server.datanode.DataNode.createDataNode(DataNode.java:1205)

        at org.apache.hadoop.hdfs.server.datanode.DataNode.main(DataNode.java:1327)

This is caused if one of the data directories gets reformatted. This causes the VERSION file (i.e., /path/to/hadoop/data/current/VERSION) to get regenerated. If there are multiple data directories, and at least one has a different VERSION file, you will get this message.

Solution

Take the following actions:

Verify there is no datanode java process on the node currently running.
Create a backup of all the VERSION files.
Copy one of the VERSION files into all the data directories in the correct place ($PREFIX/current/VERSION).
Start the data node. If the error does not go away, contact osg-hadoop support.

参考文献：https://twiki.grid.iu.edu/bin/view/Storage/HadoopDebug#Incompatible_Storage_IDs_on_the

hdfs 的存储空间扩展的更多相关文章

Centos7 根目录存储空间扩展方法
Centos7 根目录存储空间扩展方法一.首先通过 df -hl 命令查看磁盘占用情况,其中根目录已经被占满,此时需要对其进行扩容二.针对虚拟机环境的centos7系统根存储空间扩容,可利 ...
都2022年了，HDFS为何还如此能战！
摘要:HDFS也许不是最好的大数据存储技术,但依然是最重要的大数据存储技术. 本文分享自华为云社区<HDFS为何在大数据领域经久不衰?>,作者: JavaEdge. 1.概述 1.1 简介 ...
大数据技术hadoop入门理论系列之二—HDFS架构简介
HDFS简单介绍 HDFS全称是Hadoop Distribute File System,是一个能运行在普通商用硬件上的分布式文件系统. 与其他分布式文件系统显著不同的特点是: HDFS是一个高容错 ...
Hadoop学习笔记一（HDFS架构）
介绍 Hadoop分布式文件系统(HDFS)设计的运行环境是商用的硬件系统.他和现存的其他分布式文件系统存在很多相似点.不过HDFS和其他分布式文件系统的区别才是他的最大亮点,HDFS具有高容错的特性 ...
Hadoop的体系结构之HDFS的体系结构
Hadoop的体系结构 Hadoop不仅是一个用于分布式存储的分布式文件系统,而是设计用来在由通用计算设备组成的大型集群上执行分布式应用的框架. HDFS和MapReduce是Hadoop中的两个最基 ...
构建高可靠hadoop集群之1-理解hdfs架构
本文主要参考 http://hadoop.apache.org/docs/r2.8.0/hadoop-project-dist/hadoop-hdfs/HdfsDesign.html 主要内容是对该文 ...
（MySQL里的数据）通过Sqoop Import HDFS 里和通过Sqoop Export HDFS 里的数据到（MySQL）（五）
下面我们结合 HDFS,介绍 Sqoop 从关系型数据库的导入和导出一.MySQL里的数据通过Sqoop import HDFS 它的功能是将数据从关系型数据库导入 HDFS 中,其流程图如下所示. ...
HDFS 10 - HDFS 的联邦机制（Federation 机制）
目录 1 - 为什么需要联邦 2 - Federation 架构设计 3 HDFS Federation 的不足版权声明 1 - 为什么需要联邦单 NameNode 的架构存在的问题:当集群中数据 ...
我眼中的大数据（二）——HDFS
Hadoop的第一个产品是HDFS,可以说分布式文件存储是分布式计算的基础,也可见分布式文件存储的重要性.如果我们将大数据计算比作烹饪,那么数据就是食材,而Hadoop分布式文件系统HDFS就是烧菜的 ...

随机推荐

PAT甲级——A1077 Kuchiguse
The Japanese language is notorious for its sentence ending particles. Personal preference of such pa ...
PAT甲级——A1073 Scientific Notation
Scientific notation is the way that scientists easily handle very large numbers or very small number ...
PageBarHelper分页显示类
一共有两个分页类,都可以使用(单独使用) using System;using System.Collections.Generic;using System.Linq;using System.Te ...
自动生成DTO（EF框架）
[0]安装相关工具包 PostgreSQL版本: Npgsql.EntityFrameworkCore.PostgreSQL Npgsql.EntityFrameworkCore.PostgreSQL ...
Ubuntu安装QQ、微信、微信开发者工具、搜狗输入法
wine 待补充……
[Bzoj3743][Coci2015] Kamp【换根Dp】
Online Judge:Bzoj3743 Label:换根Dp,维护最长/次长链题目描述一颗树n个点,n-1条边,经过每条边都要花费一定的时间,任意两个点都是联通的. 有K个人(分布在K个不同的 ...
No context type was found in the assembly
如果解决方法中有多个项目存在,记住要在默认项目中选择你需要的项目进行 enable-migrations add-migration 以及updatebase
WINDOWS选择目录SHBrowseForFolder使用方法介绍
首先介绍一个兼容Unicode和多字节的方法,定义如下头文件: // TString.h; #pragma once #include <string> #ifdef UNICODE ty ...
使用git命令将本地项目推送到远程仓库
将本地项目推送到远程仓库这里先放一张图, 有助于理解git命令 1. 在GitHub上新建一个仓库注意不要勾选自动生成README.md文件, 否则会产生某些问题, README.md文件到时可以 ...
nginx配置虚拟主机的两种方式
一. 通过端口区分不同的虚拟主机二. 通过域名区分不同的虚拟主机备注: 1)hosts文件路径:

hdfs 的存储空间扩展

hdfs 的存储空间扩展的更多相关文章

随机推荐

热门专题