HADOOP HA 踩坑 - org.apache.hadoop.hdfs.qjournal.protocol.JournalNotFormattedException: Journal Storage Directory /mnt/data1/hadoop/dfs/journal/hdfscluster not formatted

报错:在journalnode的log中: org.apache.hadoop.hdfs.qjournal.protocol.JournalNotFormattedException: Journal Storage Directory /mnt/data1/hadoop/dfs/journal/hdfscluster not formatted 状况: 大多数情况是namenode起不来方案: 情况一:只有部分journalnode报这个错,原因是这些journalnode的journal数…

HADOOP HA 踩坑 - 所有 namenode 都是standby

报错: 无明显报错状况: 所有namenode都是standby,即ZK服务未生效尝试一:手动强制转化某个namenode为active 操作:在某台namenode上,执行 hdfs haadmin -transitionToActive --forcemanual nn1 (nn1是你的某台nameservice-id) 结果:nn1被成功转为active.但是在stop-dfs.sh后再一次start-dfs.sh后,所有namenode仍然都是standby 结论:果然因该是ZK的问…

Hadoop编程踩坑

Hadoop踩坑在hadoop所有组件编程中,遇到在Windows下运行程序出现 java.io.IOException: Could not locate executable null\bin\winutils.exe in the Hadoop binaries. at org.apache.hadoop.util.Shell.getQualifiedBinPath(Shell.java:356) at org.apache.hadoop.util.Shell.getWinUtilsPa…

Hadoop错误集：Journal Storage Directory not formatted

类型一: 当你从异常信息中看到JournalNode not formatted,如果在异常中看到三个节点都提示需要格式化JournalNode. 如果你是新建集群,你可以重新格式化NameNode,同时你会发现,JournalNode的目录被格式化… 类型二: 如果只是其中一个JournalNode没有被格式化,那么首先检查你的JournalNode目录权限是否存在问题,然后从其他JournalNode复制一份到没有格式化的JournalNode. 类型三: 如果你从一个no-HA更新到HA,…

Hadoop EC 踩坑：data block 缺失导致的 HDFS 传输速率下降

环境:hadoop-3.0.2 + 11 机集群 + RS-6-3-1024K 的EC策略状况:某天,往 HDFS 上日常 put 业务数据时,发现传输速率严重下降分析: 检查集群发现,在之前的传输中,发生过个别 datanode 临时不可用的状况. 而由于 hadoop EC 机制,当失效 datanode 小于容忍值 (这里是3),put 等传输任务仍然成功.但 hadoop 当时会报错,用于提示程序员,这个报错不会影响当此传输任务,故 put 等传输请求会返回成功.然后,缺失的 dat…

Ubuntu搭建Hadoop的踩坑之旅（一）

本文将介绍如何使用虚拟机一步步从安装Ubuntu到搭建Hadoop伪分布式集群. 本文主要参考:在VMware下安装Ubuntu并部署Hadoop1.2.1分布式环境 - CSDN博客一.所需的环境和软件:(以下是我们的环境,仅供参考) 1. 操作系统:Windows 10 64位 2. 内存:4G以上(4G 可以搭建,不过虚拟机的运行可能会比较慢,这种情况可以考虑双系统) 3. VMware Workstation 12:VMware-workstation-full-12.5.7-5813…

hadoop系列第一坑： hdfs JournalNode Sync Status

今天早上来公司发现cloudera manager出现了hdfs的警告,如下图: 解决的思路是: 1.首先解决简单的问题,查看警告提示的设置的阀值时多少,这样就可以快速定位到问题在哪了,果然JournalNode Sync Status提示最先消去: 2.然后解决Sync Status问题,首先找到提示语的解释,在官网上可见.然后查看配置参数有无问题,没问题就看log,果然在log中看到了报错信息: 3.最后可定位到该提示是由于JournalNode节点间同步文件没有保持一致,那么使用修复(优雅…

基于zookeeper的高可用Hadoop HA集群安装

(1)hadoop2.7.1源码编译 http://aperise.iteye.com/blog/2246856 (2)hadoop2.7.1安装准备 http://aperise.iteye.com/blog/2253544 (3)1.x和2.x都支持的集群安装 http://aperise.iteye.com/blog/2245547 (4)hbase安装准备 http://aperise.iteye.com/blog/2254451 (5)hbase安装 http://aperise.it…

Hadoop 配置及hadoop HA 的配置

注:本文中提到的ochadoop 不要感到奇怪,是亚信公司内部自己合成的一个包.把全部的组件都放在一个包内了.免去了组件的下载过程和解决兼容问题.事实上也能够自己下载的.不要受到影响. 另,转载请注明出处,谢谢改动静态IP和hostname 在 /etc/sysconfig/network-scripts/ifcfg-eth0配置IPADDR地址执行下面命令生效 service network restart 在/etc/sysconfig/network中配置hostname配置完毕后重新…

Hadoop 学习之路（六）—— HDFS 常用 Shell 命令

1. 显示当前目录结构 # 显示当前目录结构 hadoop fs -ls <path> # 递归显示当前目录结构 hadoop fs -ls -R <path> # 显示根目录下内容 hadoop fs -ls / 2. 创建目录 # 创建目录 hadoop fs -mkdir <path> # 递归创建目录 hadoop fs -mkdir -p <path> 3. 删除操作 # 删除文件 hadoop fs -rm <path> # 递归删除…

Yarn 踩坑： Could not find or load main class org.apache.hadoop.mapreduce.v2.app.MRAppMaster

原因:yarn-site.xml 中,yarn.application.classpath 未配置解决:其中 hadoop 版本对应更改 <property> <name>yarn.application.classpath</name> <value> /opt/hadoop-3.1.0/etc/hadoop, /opt/hadoop-3.1.0/share/hadoop/common/*, /opt/hadoop-3.1.0/share/hadoop/…

org.apache.hadoop.hdfs.server.namenode.SafeModeException: Cannot create directory /user/hive/warehouse/page_view. Name node is in safe mode

FAILED: Error in metadata: MetaException(message:Got exception: org.apache.hadoop.ipc.RemoteException org.apache.hadoop.hdfs.server.namenode.SafeModeException: Cannot create directory /user/hive/warehouse/page_view. Name node is in safe mode. 在安装hive…

hadoop ha zkfc 异常自动切换机制和hdfs 没有空间问题解决

在我搭建hadoop ha 后,我启动了各个功能,但是发现hadoop hdfs 没法使用,在web 页面也显示hdfs 可用空间为零,并且自动备份机制无法使用,本人也不理解,然后就是指定hdfs tmp 目录删除了,重新hadoop namenode -format 后完成所有步骤,发现hdfs 可用了,zkfc 也能够启动了这个原因可能是因为hdfs 无法使用导致的吧,具体原因目前也不知道.但是此法处理完成后,系统正常启动.…

【Hadoop高级】Hadoop HA、hdfs安全模式

Hadoop HA Safemode(安全模式) During start up the NameNode loads the file system state from the fsimage and the edits log file. It then waits for DataNodes to report their blocks so that it does not prematurely start replicating the blocks though enough r…

Hadoop 3.1.2报错：xception in thread "main" org.apache.hadoop.fs.UnsupportedFileSystemException: No FileSystem for scheme "hdfs"

报错内容如下: Exception in thread "main" org.apache.hadoop.fs.UnsupportedFileSystemException: No FileSystem for scheme "hdfs"at org.apache.hadoop.fs.FileSystem.getFileSystemClass(FileSystem.java:3332)at org.apache.hadoop.fs.FileSystem.create…

Hadoop ha CDH5.15.1-hadoop集群启动后，两个namenode都是standby模式

Hadoop ha CDH5.15.1-hadoop集群启动后,两个namenode都是standby模式作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一说起周五,想必大家都特别开心对吧?其实我也很开心呀-眼看还剩下一个小时就下班了.然而在这一个小时内,我都心里活动真的是跌宕起伏呀-不是因为放假,而是身为一名大数据运维技术人员需要替公司大数据生态圈中面临都各种问题. 这不,遇到了一个奇葩的问题,让我花了接近一个小时才处理完呢!深感惭愧啊,要是有小伙伴遇到跟我同样的问题,别慌…

全网最详细的Hadoop HA集群启动后，两个namenode都是standby的解决办法（图文详解）

不多说,直接上干货! 解决办法因为,如下,我的Hadoop HA集群. 1.首先在hdfs-site.xml中添加下面的参数,该参数的值默认为false: <property> <name>dfs.ha.automatic-failover.enabled.ns</name> <value>true</value> </property> 2.在core-site.xml文件中添加下面的参数,该参数的值为ZooKeeper服务器的地…

zookeeper集群的搭建以及hadoop ha的相关配置

1.环境 centos7 hadoop2.6.5 zookeeper3.4.9 jdk1.8 master作为active主机,data1作为standby备用机,三台机器均作为数据节点,yarn资源管理器在master上开启,在data1上备用,data1上开启历史服务器主要参考见下表 master 192.168.1.215 Namenode DataNode QuorumPeerMain ZKFC JournalNode ResourceManager NodeManager data1…

Hadoop HA高可用性架构和演进分析（转）

1.概况截至目前,Apache Hadoop版本分为两代,我们将第一代Hadoop称为Hadoop 1.0,第二代Hadoop称为Hadoop 2.0.前者主要有如下几种实现方式:1)社区版本基于Secondary namenode机制来定时备份HDFS metadata元数据信息:2)Avatar在Secondarynamenode的基础上实现了基于NFS共享存储方式的热备方案.3)Backup Node通过提供备用节点同步Namenode中的Matadata数据实现.后者基于NFS或者Jo…

Hadoop HA的搭建

1.首先添加hosts文件 vim /etc/hosts 192.168.0.1 MSJTVL-DSJC-H01 192.168.0.2 MSJTVL-DSJC-H03 192.168.0.3 MSJTVL-DSJC-H05 192.168.0.4 MSJTVL-DSJC-H02 192.168.0.5 MSJTVL-DSJC-H04 2.几台机器做互信 Setup passphraseless ssh Now check that you can ssh to the localhost wi…

Hadoop HA高可用集群搭建（Hadoop+Zookeeper+HBase）

声明:作者原创,转载注明出处. 作者:帅气陈吃苹果一.服务器环境主机名 IP 用户名密码安装目录 master188 192.168.29.188 hadoop hadoop /home/hadoop/ master189 192.168.29.189 hadoop hadoop /home/hadoop/ slave190 192.168.29.190 hadoop hadoop /home/hadoop/ 二.集群规划 master188 master189 slave190 Nam…

hadoop ha 读取 activce状态的活动节点

方式一 package com.xxx.hadoop; import com.sun.demo.jvmti.hprof.Tracker; import com.sun.xml.bind.util.Which; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FSDataInputStream; import org.apache.hadoop.fs.FileStatus; import org.ap…

虚拟机centos7系统下安装hadoop ha和yarn ha（详细）

一:基础环境准备 (一):虚拟机新建五个centos7系统(复制文件夹的方式) (二):角色分配 (三)按照角色分配表配置 (1)更改主机ip(自行查找),如果只是个人搭建玩一玩,可选择安装centos7图形界面操作比较简单 (2)更改主机名方法, vim /etc/hostname文件,修改成对应的主机名,保存(比如在192.168.254.2这台主机上,就修改成master).再执行hostname 主机名,进行设置. (3)在五个虚拟机系统中修改/etc/hosts文件,添加如下内容 19…

hadoop HA 配置 + zookeeper 服务注册

环境测试 6台机器 centos6.7 x64 master ( namenode/cluster ) 10.10.100.101 namenode1 10.10.100.105 namenode2 ResourceManager manager datanode (datanode,NodeManager,JournalNnode,QuprumPeerMain) 10.10.100.102 datanode1 + zk1 10.10.100.103 datanode2 + zk2 10.10.…

Hadoop HA方案调研

原文成文于去年(2012.7.30),已然过去了一年,很多信息也许已经过时,不保证正确,与Hadoop学习笔记系列一样仅为留做提醒. ----- 针对现有的所有Hadoop HA方案进行调研,以时间为线,总结如下: 1. BackupNode方案: 08年时开源社区已经开始着手解决Namenode单点问题,随之出来的第一个方案是BackupNode方案.基于0.20版,并合并进入0.21版:参见Apache JIRA HADOOP-4539 [1] 该方案思路为:将NameNode产生的edit…

hadoop HA分布式集群搭建

概述 hadoop2中NameNode可以有多个(目前只支持2个).每一个都有相同的职能.一个是active状态的,一个是standby状态的.当集群运行时,只有active状态的NameNode是正常工作的,standby状态的NameNode是处于待命状态的,时刻同步active状态NameNode的数据.一旦active状态的NameNode不能工作,standby状态的NameNode就可以转变为active状态的,就可以继续工作了. 2个NameNode的数据其实是实时共享的.新HDF…

Spark 在Hadoop HA下配置HistoryServer问题

我的Spark机群是部署在Yarn上的,因为之前Yarn的部署只是简单的完全分布式,但是后来升级到HA模式,一个主NN,一个备NN,那么Spark HistoryServer的配置也需要相应的做修改,因为不做修改会报错 Exception in thread "main" java.lang.reflect.InvocationTargetException at sun.reflect.NativeConstructorAccessorImpl.newInstance0(Native…

hadoop ha环境下的datanode启动报错java.lang.NumberFormatException: For input string: "10m"

hadoop ha环境启动start-dfs.sh的时候datanode启动不了,并且报错. [hadoop@datanode2 ~]$ cat /home/hadoop/hadoop-2.7.3/logs/hadoop-hadoop-datanode-datanode2.log 2019-03-24 18:40:46,422 FATAL org.apache.hadoop.hdfs.server.datanode.DataNode: Exception in secureMainjava.la…

Hadoop(HA)分布式集群部署

Hadoop(HA)分布式集群部署和单节点namenode部署其实一样,只是配置文件的不同罢了. 这篇就讲解hadoop双namenode的部署,实现高可用. 系统环境: OS: CentOS 6.8 内存:2G CPU:1核 Software:jdk-8u151-linux-x64.rpm hadoop-2.7.4.tar.gz zookeeper-3.3.6.tar.gz 下载地址: wget http://mirrors.hust.edu.cn/apache/hadoop/common/h…

hadoop HA架构安装部署（QJM HA）

###################HDFS High Availability Using the Quorum Journal Manager################################ 规划集群 db01 db02 db03 db04 db05 namenode namenode journalnode journalnode journa…

【HADOOP HA 踩坑 - org.apache.hadoop.hdfs.qjournal.protocol.JournalNotFormattedException: Journal Storage Directory /mnt/data1/hadoop/dfs/journal/hdfscluster not formatted】的更多相关文章