CM记录-配置Hive on Spark

默认hive on spark是禁用的，需要在Cloudera Manager中启用。
1.登录CM界面，打开hive服务。
2.单击配置标签，查找enable hive on spark属性。
3.勾选Enbale Hive on Spark(Unsupported)，并保存更改。
4.查找Spark on YARN 服务，并勾选保存。
5.保存后，重新部署下客户端使其生效。

在Spark上配置Hive

最低要求角色： 配置器（也由群集管理员提供，完全管理员）要配置Hive在Spark上运行，请执行以下两个步骤：

配置Hive客户端中所述使用Spark执行引擎配置单元执行引擎。
set hive.execution.engine=spark;
set hive.execution.engine;
确定Hive使用的Spark服务。Cloudera Manager自动将其设置为已配置的MapReduce或YARN服务以及已配置的Spark服务。请参阅配置Spark服务的Hive依赖关系。

配置Spark服务的Hive依赖关系

默认情况下，如果Spark服务可用，则配置Spark服务上的Hive依赖项。要更改此配置，请执行以下操作：

在Cloudera Manager管理控制台中，转至Hive服务。
单击配置选项卡。
在YARN服务上搜索Spark。要配置Spark服务，请选择Spark服务名称。要删除依赖项，请选择none。
单击保存更改。
转到Spark服务。
将Spark网关角色添加到运行HiveServer2的主机。
点击Cloudera Manager徽标返回主页。
单击任何陈旧的服务旁边的图标以调用集群重新启动向导。
单击重新启动旧服务。
单击立即重新启动。
单击完成。
在Hive客户端中，配置Spark执行引擎。

参考：https://www.cloudera.com/documentation/enterprise/latest/topics/admin_hos_oview.html#concept_i22_l1h_1v__section_k22_l1h_1v

CM记录-配置Hive on Spark的更多相关文章

Hive on Spark安装配置详解（都是坑啊）
个人主页:http://www.linbingdong.com 简书地址:http://www.jianshu.com/p/a7f75b868568 简介本文主要记录如何安装配置Hive on Sp ...
大数据学习系列之九---- Hive整合Spark和HBase以及相关测试
前言在之前的大数据学习系列之七 ----- Hadoop+Spark+Zookeeper+HBase+Hive集群搭建中介绍了集群的环境搭建,但是在使用hive进行数据查询的时候会非常的慢,因为h ...
Mac OSX系统中Hadoop / Hive 与 spark 的安装与配置环境搭建记录
Mac OSX系统中Hadoop / Hive 与 spark 的安装与配置环境搭建记录 Hadoop 2.6 的安装与配置(伪分布式) 下载并解压缩配置 .bash_profile : ...
Hive记录-配置远程连接（JAVA/beeline）
1.修改配置hive-site.xml hadoop core-site.xml限制---参考Hive记录-部署Hive环境 2.启动hadoop #sh /usr/app/hadoop/sbi ...
基于CDH 5.9.1 搭建 Hive on Spark 及相关配置和调优
Hive默认使用的计算框架是MapReduce,在我们使用Hive的时候通过写SQL语句,Hive会自动将SQL语句转化成MapReduce作业去执行,但是MapReduce的执行速度远差与Spark ...
hive on spark配置
1.安装java.maven.scala.hadoop.mysql.hive 略 2.编译spark ./make-distribution.sh --name "hadoop2-witho ...
Hive记录-Hive on Spark环境部署
1.hive执行引擎 Hive默认使用MapReduce作为执行引擎,即Hive on mr.实际上,Hive还可以使用Tez和Spark作为其执行引擎,分别为Hive on Tez和Hive on ...
spark 2.0.0集群安装与hive on spark配置
1. 环境准备: JDK1.8 hive 2.3.4 hadoop 2.7.3 hbase 1.3.3 scala 2.11.12 mysql5.7 2. 下载spark2.0.0 cd /home/ ...
Spark记录-源码编译spark2.2.0（结合Hive on Spark/Hive on MR2/Spark on Yarn）
#spark2.2.0源码编译 #组件:mvn-3.3.9 jdk-1.8 #wget http://mirror.bit.edu.cn/apache/spark/spark-2.2.0/spark- ...

随机推荐

pandas 初识（一）
基本内容 Series: Series 是有一组数据(numpy的数据类型 numpy.ndarray)以及一组数据标签(即索引)组成,可以看成一个一个定长的有序字典(索引值到数据值的一个映射) ob ...
tomcat设置开机自启动和后台运行
前言:当浏览器页面显示不出来的时候,重启装在服务器上的tomcat可以正常使用,是通过进入tomcat的bin目录,双击startup.bat运行启动的程序,这时会弹出启动窗口(tomcat的运行日志 ...
Hadoop版本的选择问题
自从2013年下半年开始,hadoop的版本开始了快速的更新换代,这和通信和互联网行业(ICT)的发展是密切相关的.随着移动网络的和宽带网络的覆盖以及数据传输速率的提升,线上的数据有了爆炸式的增长.这 ...
SCRUM 12.03
第二轮迭代从今天起正式开始了.12月3日,我们举行了一次组会. 第一轮迭代结束时,我们意识到第二轮迭代需要实现的功能主要如下: 在下次迭代的时候实现对多个网站的信息进行比较取最优惠的选择,目前我们劲针 ...
12.17daily_scrum
悬浮窗的优化设计工作已经展开,各界面的测试也在有条不紊的进行,大家都尽量做到了在发现了软件自身的一些问题和bug后,做到在第一时间及时恢复和修改,工作进度的安排也在预期之中,明日的任务发布如下: 具体 ...
Java实验报告（实验五）
课程:Java程序设计班级:1351 姓名:王玮怡学号:20135116 成绩: 指导教师: ...
电梯V1.0
电梯V1.0 GitHub仓库地址 Problem 一栋3层的大楼(楼层编号0-2),设有一台无限载重的电梯,初始时电梯停在0层.电梯移动1层的耗时为1,在某一层停靠的耗时为1(时间初始为0).电梯不 ...
“数学口袋精灵”第二个Sprint计划(第三天)
“数学口袋精灵”第二个Sprint计划----第三天进度任务分配: 冯美欣:欢迎界面的背景音乐完善吴舒婷:游戏界面的动作条,选择答案后的音效林欢雯:代码算法设计进度: 冯美欣:欢迎界面背景 ...
Objective-C语言--self和super关键字解析
看代码: @implementation Son : Father - (id)init{ self = [super init]; if (self){ } return self; } self是 ...
ElasticSearch 2 (17) - 深入搜索系列之部分匹配
ElasticSearch 2 (17) - 深入搜索系列之部分匹配摘要到目前为止,我们介绍的所有查询都是基于完整术语的,为了匹配,最小的单元为单个术语,我们只能查找反向索引中存在的术语. 但是, ...

CM记录-配置Hive on Spark

在Spark上配置Hive

配置Spark服务的Hive依赖关系

CM记录-配置Hive on Spark的更多相关文章

随机推荐

热门专题