hadoop hdfs空间满后重新启动不了

server检查的时候，发现存在HDFS上的文件无法同步。再发现hadoop停掉了。

进行重新启动，重新启动不成功。

查看hadoop日志：

2014-07-30 14:15:42,025 INFO org.apache.hadoop.hdfs.server.namenode.FSNamesystem: Roll Edit Log from 192.168.206.133

<span style="color:#ff0000;">2014-07-30 14:15:42,026 WARN org.apache.hadoop.hdfs.server.namenode.FSNamesystem: Cannot roll edit log, edits.new files already exists in all healthy directories:

  /home/hadoop/hdfs/name/current/edits.new</span>

<span style="color:#ff0000;">2014-07-30 14:17:17,853 ERROR org.apache.hadoop.hdfs.server.namenode.FSNamesystem: Unable to sync edit log.

java.io.IOException: No space left on device</span>

	at sun.nio.ch.FileChannelImpl.force0(Native Method)

	at sun.nio.ch.FileChannelImpl.force(FileChannelImpl.java:348)

	at org.apache.hadoop.hdfs.server.namenode.FSEditLog$EditLogFileOutputStream.flushAndSync(FSEditLog.java:215)

	at org.apache.hadoop.hdfs.server.namenode.EditLogOutputStream.flush(EditLogOutputStream.java:89)

	at org.apache.hadoop.hdfs.server.namenode.FSEditLog.logSync(FSEditLog.java:1017)

	at org.apache.hadoop.hdfs.server.namenode.FSNamesystem.startFile(FSNamesystem.java:1190)

	at org.apache.hadoop.hdfs.server.namenode.NameNode.create(NameNode.java:628)

	at sun.reflect.GeneratedMethodAccessor300.invoke(Unknown Source)

	at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:25)

	at java.lang.reflect.Method.invoke(Method.java:597)

	at org.apache.hadoop.ipc.RPC$Server.call(RPC.java:563)

	at org.apache.hadoop.ipc.Server$Handler$1.run(Server.java:1388)

	at org.apache.hadoop.ipc.Server$Handler$1.run(Server.java:1384)

	at java.security.AccessController.doPrivileged(Native Method)

	at javax.security.auth.Subject.doAs(Subject.java:396)

	at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1121)

	at org.apache.hadoop.ipc.Server$Handler.run(Server.java:1382)

2014-07-30 14:17:17,853 FATAL org.apache.hadoop.hdfs.server.namenode.FSNamesystem: No edit streams are accessible

java.lang.Exception: No edit streams are accessible

	at org.apache.hadoop.hdfs.server.namenode.FSEditLog.fatalExit(FSEditLog.java:388)

	at org.apache.hadoop.hdfs.server.namenode.FSEditLog.exitIfNoStreams(FSEditLog.java:407)

	at org.apache.hadoop.hdfs.server.namenode.FSEditLog.removeEditsAndStorageDir(FSEditLog.java:432)

	at org.apache.hadoop.hdfs.server.namenode.FSEditLog.removeEditsStreamsAndStorageDirs(FSEditLog.java:470)

	at org.apache.hadoop.hdfs.server.namenode.FSEditLog.logSync(FSEditLog.java:1030)

	at org.apache.hadoop.hdfs.server.namenode.FSNamesystem.startFile(FSNamesystem.java:1190)

	at org.apache.hadoop.hdfs.server.namenode.NameNode.create(NameNode.java:628)

	at sun.reflect.GeneratedMethodAccessor300.invoke(Unknown Source)

	at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:25)

	at java.lang.reflect.Method.invoke(Method.java:597)

	at org.apache.hadoop.ipc.RPC$Server.call(RPC.java:563)

	at org.apache.hadoop.ipc.Server$Handler$1.run(Server.java:1388)

	at org.apache.hadoop.ipc.Server$Handler$1.run(Server.java:1384)

	at java.security.AccessController.doPrivileged(Native Method)

	at javax.security.auth.Subject.doAs(Subject.java:396)

	at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1121)

	at org.apache.hadoop.ipc.Server$Handler.run(Server.java:1382)

空间满了。

使用命令df -h查看当中一个datanode。果然

但使用du -s查看，但显示仅仅使用几百G，并没有满

这个实候确实让人费解，仅仅好重新启动datanode所在的server，并又一次挂载。回复原样，容量显示正常。

可是这个时候hadoop集群依旧无法重新启动，一直报错：

014-07-30 16:27:46,610 ERROR org.apache.hadoop.hdfs.server.namenode.FSNamesystem: FSNamesystem initialization failed.

java.io.IOException: Incorrect data format. logVersion is -32 but writables.length is 0.

	at org.apache.hadoop.hdfs.server.namenode.FSEditLog.loadFSEdits(FSEditLog.java:560)

	at org.apache.hadoop.hdfs.server.namenode.FSImage.loadFSEdits(FSImage.java:1026)

	at org.apache.hadoop.hdfs.server.namenode.FSImage.loadFSImage(FSImage.java:839)

	at org.apache.hadoop.hdfs.server.namenode.FSImage.recoverTransitionRead(FSImage.java:377)

	at org.apache.hadoop.hdfs.server.namenode.FSDirectory.loadFSImage(FSDirectory.java:100)

	at org.apache.hadoop.hdfs.server.namenode.FSNamesystem.initialize(FSNamesystem.java:388)

	at org.apache.hadoop.hdfs.server.namenode.FSNamesystem.<init>(FSNamesystem.java:362)

	at org.apache.hadoop.hdfs.server.namenode.NameNode.initialize(NameNode.java:276)

	at org.apache.hadoop.hdfs.server.namenode.NameNode.<init>(NameNode.java:496)

	at org.apache.hadoop.hdfs.server.namenode.NameNode.createNameNode(NameNode.java:1279)

	at org.apache.hadoop.hdfs.server.namenode.NameNode.main(NameNode.java:1288)

2014-07-30 16:27:46,612 ERROR org.apache.hadoop.hdfs.server.namenode.NameNode: java.io.IOException: Incorrect data format. logVersion is -32 but writables.length is 0.

	at org.apache.hadoop.hdfs.server.namenode.FSEditLog.loadFSEdits(FSEditLog.java:560)

	at org.apache.hadoop.hdfs.server.namenode.FSImage.loadFSEdits(FSImage.java:1026)

	at org.apache.hadoop.hdfs.server.namenode.FSImage.loadFSImage(FSImage.java:839)

	at org.apache.hadoop.hdfs.server.namenode.FSImage.recoverTransitionRead(FSImage.java:377)

	at org.apache.hadoop.hdfs.server.namenode.FSDirectory.loadFSImage(FSDirectory.java:100)

	at org.apache.hadoop.hdfs.server.namenode.FSNamesystem.initialize(FSNamesystem.java:388)

	at org.apache.hadoop.hdfs.server.namenode.FSNamesystem.<init>(FSNamesystem.java:362)

	at org.apache.hadoop.hdfs.server.namenode.NameNode.initialize(NameNode.java:276)

	at org.apache.hadoop.hdfs.server.namenode.NameNode.<init>(NameNode.java:496)

	at org.apache.hadoop.hdfs.server.namenode.NameNode.createNameNode(NameNode.java:1279)

	at org.apache.hadoop.hdfs.server.namenode.NameNode.main(NameNode.java:1288)

不得解，仅仅好从secondrynamenode尝试恢复

1. 先备份namenode和secondrynamenode的数据

2. 运行checkpoint数据：hadoop namenode –importCheckpoint

失败……

最后查了网上的方法(有一个是改动代码并又一次编译的。就算了)：

printf "\xff\xff\xff\xee\xff" > edits

重新启动失败。继续：

printf "\xff\xff\xff\xee\xff" > edits.new

重新启动成功。

可是问题来了。数据丢失，由于清空了edits文件最新的日志内容。

一般来说。到这份上是没有办法了。

可是，幸好我们有两地同步和备份。将别一个数据中心HDFS集群的数据同步过来，恢复成功。

假设没有异地备份的话。上面的操作我也会慎之又慎的。

hadoop hdfs空间满后重新启动不了的更多相关文章

ORACLE_11G归档空间满，由于数据库装完后使用的是默认空间是闪回区
1.首先根据alert跟踪日志发现归档空间满,路径大致如下:cd $ORACLE_BASE/diag/rdbms/jsswgsjk/jsswgsjk1/tracetail -f alert_jsswg ...
hadoop hdfs 有内网、公网ip后，本地调试访问不了集群解决
问题背景: 使用云上的虚拟环境搭建测试集群,导入一些数据,在本地idea做些debug调试,但是发现本地idea连接不上测试环境集群内部配置hosts映射是内网映射(内网ip与主机名映射),本地只能 ...
最通熟易懂的Hadoop HDFS实践攻略
HDFS是用来解决什么问题?怎么解决的? 如何在命令行下操作HDFS? 如何使用Java API来操作HDFS? 在了解基本思路和操作方法后,进一步深究HDFS具体的读写数据流程学习并实践本文教程后 ...
Hadoop hdfs副本存储和纠删码(Erasure Coding)存储优缺点
body { margin: 0 auto; font: 13px / 1 Helvetica, Arial, sans-serif; color: rgba(68, 68, 68, 1); padd ...
Hadoop HDFS分布式文件系统设计要点与架构
Hadoop HDFS分布式文件系统设计要点与架构 Hadoop简介:一个分布式系统基础架构,由Apache基金会开发.用户可以在不了解分布式底层细节的情况下,开发分布式程序.充分利用集群 ...
启动HDFS之后一直处于安全模式org.apache.hadoop.hdfs.server.namenode.SafeModeException: Log not rolled. Name node is in safe mode.
一.现象三台机器 crxy99,crxy98,crxy97(crxy99是NameNode+DataNode,crxy98和crxy97是DataNode) 按正常命令启动HDFS之后,HDFS一直 ...
Hadoop HDFS分布式文件系统常用命令汇总
引言:我们维护hadoop系统的时候,必不可少需要对HDFS分布式文件系统做操作,例如拷贝一个文件/目录,查看HDFS文件系统目录下的内容,删除HDFS文件系统中的内容(文件/目录),还有HDFS管理 ...
ERROR org.apache.hadoop.hdfs.server.datanode.DataNode: Incompatible namespaceIDs
用三台centos操作系统的机器搭建了一个hadoop的分布式集群.启动服务后失败,查看datanode的日志,提示错误:ERROR org.apache.hadoop.hdfs.server.dat ...
Hadoop HDFS 中的一些常用命令
转载自:hadoop HDFS常用文件操作命令命令基本格式: hadoop fs -cmd < args > 1.ls hadoop fs -ls / 列出hdfs文件系统根目录下的目录 ...

随机推荐

C语言将十六进制字符串转为十六进制数（二进制、十进制都适用）
主要利用 long int strtol(const char *nptr,char **endptr,int base); 函数函数说明: 参数base范围从2至36,或0.参数base代表采用的 ...
js获取当地时间并且拼接时间格式的三种方式
js获取当地时间并且拼接时间格式,在stackoverflow上有人在问,查了资料,各种方法将时间格式改成任意自己想要的样式. 1. var date = new Date(+new Date()+8 ...
maven也是Apache开发的，也是java开发的。maven需要你本地系统JDK的支持
1. 3. 添加 M2_HOME 和 MAVEN_HOME 添加 M2_HOME 和 MAVEN_HOME 环境变量到 Windows 环境变量,并将其指向你的 Maven 文件夹. M2_HOME ...
求第K大的数字
除了用最大堆(求最小的K个数)或最小堆(求最大的K个数) 可以用partition,然后直到返回index为k为止.参数可以是实际下标.然后返回index,就是partition的pivot的位置.
[Python Test] Use pytest fixtures to reduce duplicated code across unit tests
In this lesson, you will learn how to implement pytest fixtures. Many unit tests have the same resou ...
Linux - Redmine使用方式 | SVN提交代码
Redmine使用方式 | SVN提交代码本文地址:http://blog.csdn.net/caroline_wendy RbTools 1. 安装: svn co https://dev.cxx ...
SQL语句将某字段查询出以逗号隔开
MySQL的sql语句有好多能够省去server端的复杂处理 1.group_concat 这玩意儿能够实现将一个字段如id查询出来成为这种格式:121,122,123,124,125,12 ...
归并排序(Python)
一.采用分治策略:将原问题划分成n个规模较小的但结构和原问题相同的子问题,递归解决这些子问题后合并各个结果从而得到原问题的解. 二.分治策略的步骤: 分解:将原问题分解成一系列子问题解决:子问题粒度 ...
Java数据库连接——PreparedStatement的使用
首先了解Statement和PreparedStatement的区别: 由此可见,一般使用PreparedStatement. 操作数据库SU(Course表),其中Course属性有Cno,Cnam ...
Java数据库连接——jdbc-odbc桥连接方式及汉字乱码问题
jdbc-odbc桥连接方式操作数据库SU(Course),其中Course属性有Cno,Cname,Cpno,Ccredit. 步骤: 1.配置数据源控制面板下搜索管理工具->ODBC数据源 ...

hadoop hdfs空间满后重新启动不了

hadoop hdfs空间满后重新启动不了的更多相关文章

随机推荐

热门专题