手动合并hadoop namenode editlog

一. 基本概念

1.NN恢复实际上是由fsimage开始(这个相当于数据的base)，如果有多个fsimage，会自动选择最大的fsimage，然后按照editlog序列日志开始执行日志

2.seen_txid文件里的值是当前的最大editlog值。如果nn正在运行，则是edits_inprogress_0000000003336594610 中的3336594610 ；如果NN已经挂了，则是序列最大的那个edits_0000000003332374206-0000000003334396028的下一个值：3334396029

3.在secondnn模式(冷备)和ha（热备）的standby模式下都是由nn的备份节点定期做checkpoint进行merge

4.NameNode：存储元数据，元数据存在内存和磁盘，保存文件—block DataNode之间的映射关系；

5.DataNode：存文件内容，磁盘上，维护block id 到datanode本地文件的映射

6.SecondaryNameNode：将NameNode的fsimage与edit log从NameNode复制到临时目录将fsimage同edit log合并并产生新的fsimage 将产生的新的fsimage上传给NameNode 清除NameNode中的edit log

7.NameNode是单点，SecondaryNameNode可以认为是NameNode的备份，不是热切，可能会丢数据。

二. 手动恢复：

1.sudo su - 进入root用户，cd ${dfs.namenode.name.dir}目录下（可以在hadoop的conf下的hdfs-site.xml文件查看配置）

2. hadoop dfsadmin -safemode enter（进入安全模式）

3. hadoop dfsadmin -saveNamespace（保存内存信息到磁盘）

4. sudo /sbin/stop hadoop-hdfs-namenode（关闭NN）

5. cd /mnt/namenode/current/

6. rm /mnt/namenode/current/edits*（删除editlog）

7. sudo /sbin/start hadoop-hdfs-namenode（重启NN）

三.常用命令：

hadoop fs命令

ls（显示一层） lsr（递归）

du（显示所有文件及大小） dus（文件夹大小） count（多少个文件、大小）

hadoop fs –help mv 帮助

mv（移动）

cp（复制）

rm（删除） rmr(递归删除)

mkdir（新文件夹）

put（从本地文件复制到hdfs）

get（从hdfs复制到本地）

getmerge（合并目录中到多个文件到本地系统）

copyFromLocal（从本地拷贝到hdfs）

movelFromLocal（从本地移动到hdfs）

copyToLocal（从hdfs拷贝到本地）

text（允许压缩包）

cat（输出到控制台）

stat（分析，如修改时间块大小复制）

setrep（指定备份几份）

touchz（往文件写一个时间戳内容是yyyy-MM-dd HH:mm:ss（文件必须零长度））

tail

chmod chowm chgrp

关于hadoop fs -setrep（命令修改副本数）

setrep

Usage: hadoop fs -setrep [-R] [-w] <numReplicas> <path>

Changes the replication factor of a file. If path is a directory then the command recursively

changes the replication factor of all files under the directory tree rooted at path.

Options:

The -w flag requests that the command wait for the replication to complete. This can potentially take a very long time.

The -R flag is accepted for backwards compatibility. It has no effect.

Example:

hadoop fs -setrep -w 3 /user/hadoop/dir1

Exit Code:

Returns 0 on success and -1 on error.

hdfs dfsadmin –report dfs信息

hdfs dfsadmin –savemode enter 进入 leave 离开 get得到当前状态 wait等待结束

hdfs dfsadmin –saveNamespace 保存内存信息到磁盘

hdfs dfsadmin –saveNamespace 保存内存信息到磁盘（必须安全模式）

hdfs dfsadmin –refreshNodes 比如新加节点重新通信

hdfs dfsadmin –upgradeProgress status 升级信息

hdfs dfsadmin –finalizeUpgrade 停止升级

hdfs dfsadmin –metasave filename 存meta到本地文件

hdfs dfsadmin –setQuota 2 path 最多放几个文件（从现在开始的）

hdfs dfsadmin –clrQuota 2 path 清除

hdfs dfsadmin –setSpaceQuota 2 path （包含当前的）

hdfs dfsadmin –clrSpaceQuota 2 path （包含当前的）

hdfs dfsadmin –setBalancerBandwidth [byte per second] 负载均衡带宽

手动合并hadoop namenode editlog的更多相关文章

Hadoop记录-Hadoop NameNode 高可用 (High Availability) 实现解析
Hadoop NameNode 高可用 (High Availability) 实现解析 NameNode 高可用整体架构概述在 Hadoop 1.0 时代,Hadoop 的两大核心组件 HDF ...
Hadoop namenode无法启动
最近遇到了一个问题,执行start-all.sh的时候发现JPS一下namenode没有启动每次开机都得重新格式化一下namenode才可以其实问题就出在tmp文件,默 ...
Hadoop NameNode is not formatted.
2014-08-26 20:27:22,712 WARN org.apache.hadoop.hdfs.server.namenode.FSNamesystem: Encountered except ...
hadoop namenode多次格式化后，导致datanode启动不了
jps hadoop namenode -format dfs directory : /home/hadoop/dfs --data --current/VERSION #Wed Jul :: CS ...
hadoop namenode -format Couldn'tload main class "-Djava.library.path=.home.hadoop.hadoop-2.5.2.lib"
<pre name="code" class="sql">[hadoop@MasterHadoop50 ~]$ hadoop namenode -f ...
hdfs格式化hadoop namenode -format错误
在对HDFS格式化,执行hadoop namenode -format命令时,出现未知的主机名的问题,异常信息如下所示: [shirdrn@localhost bin]$ hadoop namenod ...
hadoop namenode格式化问题汇总
hadoop namenode格式化问题汇总 (持续更新) 0 Hadoop集群环境 3台rhel6.4,2个namenode+2个zkfc, 3个journalnode+zookeeper-serv ...
对hadoop namenode -format执行过程的探究
引言本文出于一个疑问:hadoop namenode -format到底在我的linux系统里面做了些什么? 步骤第1个文件bin/hadoop Hadoop脚本位于hadoop根目录下的bi ...
通过tarball形式安装HBASE Cluster（CDH5.0.2）——Hadoop NameNode HA 切换引起的Hbase错误，以及Hbase如何基于NameNode的HA进行配置
通过tarball形式安装HBASE Cluster(CDH5.0.2)——Hadoop NameNode HA 切换引起的Hbase错误,以及Hbase如何基于NameNode的HA进行配置配置H ...

随机推荐

【C++】《C++ Primer 》第四章
第四章表达式一.基础重载运算符:当运算符作用在类类型的运算对象时,用户可以自行定义其含义. 左值和右值: C中:左值可以在表达式左边,右值不能. C++中:当一个对象被用作右值的时候,用的是对象 ...
python学习笔记 | 递归思想
1.引子大师 L. Peter Deutsch 说过: To Iterate is Human, to Recurse, Divine. 中文译为:人理解迭代,神理解递归 2.什么是递归简单理解: ...
【UML】Use Case Diagrams
文章目录 Use Case Diagrams Introduction Use case Diagram Use Case Diagrams - Actors Use Case Diagrams – ...
目录遍历 - Pikachu
概述: 在web功能设计中,很多时候我们会要将需要访问的文件定义成变量,从而让前端的功能便的更加灵活. 当用户发起一个前端的请求时,便会将请求的这个文件的值(比如文件名称)传递到后台,后台再执行其对应 ...
用其他主机docker login登录Harbor仓库报错
做微服务的时候,我准备把编译好的jar包,部署到我的Harbor仓库上,却登录不上去,出现以下报错: [root@k8s-master ~]# docker login 192.168.30.24Us ...
2.4V升3.3V，2.4V升3V，1A大电流升压芯片
两节镍氢电池串联就是1.2V+1.2V=2.4V的供电电压了,2.4V升3V, 2.4V升3.3V的话,就能稳压稳定给模块供电了,镍氢电池是会随着使用的电池电量减少的话,电池的电压也是跟着变化的,导致 ...
Kubernetes之GlusterFS集群文件系统高可用安装，提供动态卷存储
GlusterFS高可用安装一. 准备工作安装好的k8s集群,提供其中三个节点给GFS,这三个节点都至少有一个可用的裸块设备在k8s所有节点安装所需要的组件 # ubuntu16.04 add- ...
关于Vue v-model你需要知道的一切
v-model是Vue的一个指令,它提供了input和form数据之间或两个组件之间的双向数据绑定. 这在Vue开发中是一个简单的概念,但是v-model的真正威力需要一些时间才能理解. 到本教程结 ...
IGXE搬砖项目
主要的赚钱方式和倒爷其实是差不多的,自动检测igxe平台上价格与buff相差8.5%以上的饰品,按照历史价格进行一定的过滤,防止翻车,然后自动购买. 2019年经历了十几次的改进以对抗同行的脚本,到1 ...
(SqlServe)关于字符串长度被截断的问题
1. 问题描述在同步数据时常常会发现一个错误:将截断字符串或二进制数据. 2. 问题原因这个问题出现的原因是:要插入的数值字段的长度超出了数据库中字段的长度.比如:插入的字符串字节长度是40,数据 ...

手动合并hadoop namenode editlog

手动合并hadoop namenode editlog的更多相关文章

随机推荐

热门专题