解决方案

Hive 的配置文件 hive-site.xml 中的 hive.exec.scratchdir 的目录地址要放在 HDFS 上。

问题现象

本人在使用 Hive 执行 MapReduce 作业时，突然发现所有作业均无法执行。下达 HQL 命令的控制台只有短短几行输出。控制台输出内容如下：

 WARNING: Hive-on-MR is deprecated in Hive  and may not be available in the future versions. Consider using a different execution engine (i.e. spark, tez) or using Hive .X releases.

 Query ID = chorm_20190310001344_e4ed74d8---aa6f-d3a1a2a60698

 Total jobs =

 Launching Job  out of

 Number of reduce tasks determined at compile time:

 In order to change the average load for a reducer (in bytes):

   set hive.exec.reducers.bytes.per.reducer=<number>

 In order to limit the maximum number of reducers:

   set hive.exec.reducers.max=<number>

 In order to set a constant number of reducers:

   set mapreduce.job.reduces=<number>

 Starting Job = job_1552147755103_0003, Tracking URL = http://m254:8088/proxy/application_1552147755103_0003/

 Kill Command = /usr/bigdata/hadoop/bin/hadoop job  -kill job_1552147755103_0003

 Hadoop job information for Stage-: number of mappers: ; number of reducers:

 -- ::, Stage- map = %,  reduce = %

 Ended Job = job_1552147755103_0003 with errors

 Error during job, obtaining debugging information...

 FAILED: Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask

 MapReduce Jobs Launched:

 Stage-Stage-:  HDFS Read:  HDFS Write:  FAIL

 Total MapReduce CPU Time Spent:  msec

开始时感觉很莫名其妙，因为之前还好好的，突然就出现这种现象。在网上似乎也搜索不到这个问题的解决方案。所幸经过一番折腾后，找到了问题原因所在。

探索过程

首先基本可以确定，在控制台上打印的信息无法帮助定位问题原因与作出解决方案假设。所以要另寻它法。

1. 检查 Hadoop 与 YARN 是否正常工作。

Hadoop 好检查。直接通过网页 UI 与 CLI 来检查即可。本人这里确认了 Hadoop 没有问题。

随后是 YARN ，也是通过网页 UI 来检查。同时不要忘记检查集群中各机器的对应进程是否在正常运行。本人这块经检查也没有问题。

最后再检查一下 MapReduce ，我这里直接通过 Hadoop 自带的 example.jar 来跑一个 wordcount 例子来检查。经检查也 OK 。

经过上面 3 步的检查，排除了 Hadoop 的问题。

2. 检查 Hive

说实话，这个检查不出什么来。也不知道该怎么来检查。

3. 查看 YARN 中这个作业的日志

老实说，出现问题的时候应该第一时刻就来查看日志的，但是在这里不知怎么犯傻了。

打开 http://yarn-host:8080 网页，找到那条错误的作业记录，点进去，发现有如下错误信息：

 Diagnostics:

 Application application_1552147755103_0003 failed  times due to AM Container for appattempt_1552147755103_0003_000002 exited with exitCode: -

 For more detailed output, check application tracking page:http://m254:8088/cluster/app/application_1552147755103_0003Then, click on links to logs of each attempt.

 Diagnostics: File file:/var/bigdata/hive/scratchdir/chorm/46b600b8--48c8--a2f6b649bcae/hive_2019--10_00--44_741_6711852286526745896-/-mr-/cd1fe621-e494-4ddd-b8f8-a9c80e052c6c/reduce.xml does not exist

 java.io.FileNotFoundException: File file:/var/bigdata/hive/scratchdir/chorm/46b600b8--48c8--a2f6b649bcae/hive_2019--10_00--44_741_6711852286526745896-/-mr-/cd1fe621-e494-4ddd-b8f8-a9c80e052c6c/reduce.xml does not exist

 at org.apache.hadoop.fs.RawLocalFileSystem.deprecatedGetFileStatus(RawLocalFileSystem.java:)

 at org.apache.hadoop.fs.RawLocalFileSystem.getFileLinkStatusInternal(RawLocalFileSystem.java:)

 at org.apache.hadoop.fs.RawLocalFileSystem.getFileStatus(RawLocalFileSystem.java:)

 at org.apache.hadoop.fs.FilterFileSystem.getFileStatus(FilterFileSystem.java:)

 at org.apache.hadoop.yarn.util.FSDownload.copy(FSDownload.java:)

 at org.apache.hadoop.yarn.util.FSDownload.access$(FSDownload.java:)

 at org.apache.hadoop.yarn.util.FSDownload$.run(FSDownload.java:)

 at org.apache.hadoop.yarn.util.FSDownload$.run(FSDownload.java:)

 at java.security.AccessController.doPrivileged(Native Method)

 at javax.security.auth.Subject.doAs(Subject.java:)

 at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:)

 at org.apache.hadoop.yarn.util.FSDownload.call(FSDownload.java:)

 at org.apache.hadoop.yarn.util.FSDownload.call(FSDownload.java:)

 at java.util.concurrent.FutureTask.run(FutureTask.java:)

 at java.util.concurrent.Executors$RunnableAdapter.call(Executors.java:)

 at java.util.concurrent.FutureTask.run(FutureTask.java:)

 at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:)

 at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:)

 at java.lang.Thread.run(Thread.java:) 

 Failing this attempt. Failing the application.

从上面日志中发现一条重要信息 reduce.xml does not exists! 。reduce.xml 似乎是 MapReduce 作业相关的文件，所以判断可能是某个或某些和作业执行相关的配置文件缺失，导致作业无法进行下去。然后猛然想起之前自己有改动过 Hive 的配置信息，将属性 hive.exec.scratchdir 指向的目录从 HDFS 上改到了本地文件系统中。然后这条属性就是和 Hive 的作业执行相关的。这条属性指向的目录专门用于存储 Hive 的 MapReduce 作业的阶段执行计划和中间产物的。 Hive 的作业一般都会在集群中执行，现在我将它指向某台机器的本地目录，导致作业中间文件无法在集群中共享，所以作业肯定是不能正常执行的。

在将 hive.exec.scratchdir 属性指向的目录重新设定到 HDFS 中以后，Hive 的 MapReduce 作业就能正常执行了。

Hive 执行作业时报错 [ Diagnostics: File file:/ *** reduce.xml does not exist FileNotFoundException: File file:/ ]的更多相关文章

Hadoop执行作业时报错：java.lang.OutOfMemoryError: Java heap space
常常被一些用户问到,说“为什么我的mapreduce作业总是运行到某个阶段就报出如下错误,然后失败呢?以前同一个作业没出现过的呀?” 10/01/10 12:48:01 INFO mapred.Job ...
mysql启动时报错：Starting MySQL... ERROR! The server quit without updating PID file (/opt/mysql/data/mysql.pid)
mysql启动报错Starting MySQL... ERROR! The server quit without updating PID file (/opt/mysql/data/mysql.p ...
执行automake时报错 error while making link: Operation not supported
执行automake时报错: [root@localhost project]# automake --add-missingconfigure.in: installing `./install-s ...
启动azkaban时出现User xml file conf/azkaban-users.xml doesn't exist问题解决（图文详解）
问题详情 [hadoop@master azkaban]$ ll total drwxrwxr-x hadoop hadoop May : azkaban- drwxrwxr-x hadoop h ...
npm安装socket.io时报错的解决方法（npm WARN enoent ENOENT: no such file or directory, open '/usr/local/nodejs/bin/package.json'）
执行 npm install socket.io安装时报错: [root@WEB node_modules]# npm install socket.ionpm WARN enoent ENOENT: ...
编译gd-2.0.35.tar.gz时报错：gd_png.c:16:53: error: png.h: No such file or directory
编译gd-2.0.35.tar.gz时报错: gcc -DHAVE_CONFIG_H -I. -I. -I. -I/usr/local/freetype/include/freetype2 -I/us ...
RHEL 6.5----apr-util1.6执行make时报错
报错信息 ]: Entering directory `/usr/local/src/apr-util-' /bin//build-/libtool --silent --mode=compile / ...
登录用户执行sudo时报错
场景: 以普通用户登录,登陆后切换至root或其他用户时报错(sudo su -或sudo -i) 报错信息: -bash: /bin/logger: Argument list too long 根 ...
IIS导入.pfx证书时报错："A specified logon session does not exist. It may already have been terminated."
在IIS中可以直接导入.pfx文件来给站点绑定https协议: 如果在导入.pfx文件时,不选择"Allow this certificate to be exported"的话 ...

随机推荐

使用ArcGIS Earth矢量化高精度的数据(kml转图层转shp/要素类)
大家好,这次来分享干货.做地理分析的同学,或者需要使用地图却不知道哪里有精度较高矢量数据(如校园图)的时候,怎么办呢? 我们知道ArcGIS提供了精度较高的全球影像图,基于此,可以自己进行矢量化,然后 ...
从.Net到Java学习第九篇——SpringBoot下Thymeleaf
从.Net到Java学习系列目录 Thymeleaf概述 Thymeleaf 是一个流行的模板引擎,该模板引擎采用java语言开发.模板引擎是一个技术名称,是跨领域平台的概念,在java语言体系下有模 ...
mininet安装过程记录
参考文档: http://www.brianlinkletter.com/set-up-mininet/ https://github.com/mininet/mininet/wiki/FAQ#x11 ...
如何为 .NET Core CLI 启用 TAB 自动补全功能
如何为 .NET Core CLI 启用 TAB 自动补全功能 Intro 在 Linux 下经常可以发现有些目录/文件名,以及有些工具可以命令输入几个字母之后按 TAB 自动补全,最近发现其实 do ...
监控 redis 执行命令
监控 redis 执行命令 Intro 最近在用 redis 的时候想看看执行了哪些命令,于是发现了 redis-cli 提供的 Monitor 命令,直接使用这个就可以监控执行的大部分 redis ...
MongoDB 常用的数据备份梳理汇总
1.基于数据文件的备份直接将原始的数据文件Copy至备份的地方,这个方法的优点是比较快,因为备份和恢复都不需要转换数据格式.缺点就是需要锁住数据库服务器,但是此方案通常备份是在从节点上进行,备份过程 ...
Python第五天文件访问 for循环访问文件 while循环访问文件字符串的startswith函数和split函数 linecache模块
Python第五天文件访问 for循环访问文件 while循环访问文件字符串的startswith函数和split函数 linecache模块目录 Pycharm使用技巧( ...
高版本Sqlserver数据库导入低版本Sqlserver
今天想跑一个关于java网站的demo,结果在附加数据库项这一块出现问题,例程的数据库用的是sqlserver2014,而我的是2008,添加数据库出现错误.经过一番查找,也找到某人写的一些博客上的解 ...
基于TCP 协议的RPC
前言: 环境: windown 10 Eclipse JDK 1.8 RPC的概念: RPC 是远程过程调用,是分布式网站的基础. 实验 SayHelloService.java 接口类,用于规范 S ...
【原】Java学习笔记001 - JAVA开发环境搭建
1.JDK下载并安装,以jdk-7u45-windows-i586.exe为例(注意JDK的安装和JRE的安装是分开的) 2.“我的电脑”右键属性,找到“高级系统设置”,找到“高级”tab下的“环境变 ...

Hive 执行作业时报错 [ Diagnostics: File file:/ *** reduce.xml does not exist FileNotFoundException: File file:/ ]

解决方案

问题现象

探索过程

Hive 执行作业时报错 [ Diagnostics: File file:/ *** reduce.xml does not exist FileNotFoundException: File file:/ ]的更多相关文章

随机推荐

热门专题