hive—high Avaliable

hive的搭建方式有三种，分别是

1、Local/Embedded Metastore Database (Derby)

2、Remote Metastore Database

3、Remote Metastore Server

一般情况下，我们在学习的时候直接使用hive –service metastore的方式启动服务端，使用hive的方式直接访问登录客户端，除了这种方式之外，hive提供了hiveserver2的服务端启动方式，提供了beeline和jdbc的支持，并且官网也提出，一般在生产环境中，使用hiveserver2的方式比较多，如图：

使用hiveserver2的优点如下：

1、在应用端不需要部署hadoop和hive的客户端

2、hiveserver2不用直接将hdfs和metastore暴露给用户

3、有HA机制，解决应用端的并发和负载问题

4、jdbc的连接方式，可以使用任何语言，方便与应用进行数据交互

本文档主要介绍如何进行hive的HA的搭建：

如何进行搭建，参照之前hadoop的HA，使用zookeeper完成HA

1、环境如下:

	Node01	Node02	Node03	Node04
Namenode	1	1
Journalnode	1	1	1
Datanode		1	1	1
Zkfc	1	1
zookeeper	1	1	1
resourcemanager		1	1	1
nodemanager		1	1	1
Hiveserver2			1
beeline				1

2、node02—hive-site.xml

<property>

  <name>hive.metastore.warehouse.dir</name>

  <value>/user/hive/warehouse</value>

</property>

<property>

  <name>javax.jdo.option.ConnectionURL</name>

  <value>jdbc:mysql://node01:3306/hive?createDatabaseIfNotExist=true</value>

</property>

<property>

  <name>javax.jdo.option.ConnectionDriverName</name>

  <value>com.mysql.jdbc.Driver</value>

</property>

<property>

  <name>javax.jdo.option.ConnectionUserName</name>

  <value>root</value>

</property>

<property>

  <name>javax.jdo.option.ConnectionPassword</name>

  <value>123</value>

</property>

<property>

  <name>hive.server2.support.dynamic.service.discovery</name>

  <value>true</value>

</property>

<property>

  <name>hive.server2.zookeeper.namespace</name>

  <value>hiveserver2_zk</value>

</property>

<property>

  <name>hive.zookeeper.quorum</name>

  <value>node01:2181,node02:2181,node03:2181</value>

</property>

<property>

  <name>hive.zookeeper.client.port</name>

  <value>2181</value>

</property>

<property>

  <name>hive.server2.thrift.bind.host</name>

  <value>node02</value>

</property>

<property>

  <name>hive.server2.thrift.port</name>

  <value>10001</value>

</property>

3、node4—hive-site.xml

<property>

  <name>hive.metastore.warehouse.dir</name>

  <value>/user/hive/warehouse</value>

</property>

<property>

  <name>javax.jdo.option.ConnectionURL</name>

  <value>jdbc:mysql://node01:3306/hive?createDatabaseIfNotExist=true</value>

</property>

<property>

  <name>javax.jdo.option.ConnectionDriverName</name>

  <value>com.mysql.jdbc.Driver</value>

</property>

<property>

  <name>javax.jdo.option.ConnectionUserName</name>

  <value>root</value>

</property>

<property>

  <name>javax.jdo.option.ConnectionPassword</name>

  <value>123</value>

</property>

<property>

  <name>hive.server2.support.dynamic.service.discovery</name>

  <value>true</value>

</property>

<property>

  <name>hive.server2.zookeeper.namespace</name>

  <value>hiveserver2_zk</value>

</property>

<property>

  <name>hive.zookeeper.quorum</name>

  <value>node01:2181,node02:2181,node03:2181</value>

</property>

<property>

  <name>hive.zookeeper.client.port</name>

  <value>2181</value>

</property>

<property>

  <name>hive.server2.thrift.bind.host</name>

  <value>node04</value>

</property>

<property>

  <name>hive.server2.thrift.port</name>

  <value>10001</value>

</property>

4、使用jdbc或者beeline两种方式进行访问

1） beeline

!connect jdbc:hive2://node01,node02,node03/;serviceDiscoveryMode=zooKeeper;zooKeeperNamespace=hiveserver2_zk root 123

2）jdbc

public class HiveJdbcClient2 {

	private static String driverName = "org.apache.hive.jdbc.HiveDriver";

	public static void main(String[] args) throws SQLException {

		try {

			Class.forName(driverName);

		} catch (ClassNotFoundException e) {

			e.printStackTrace();

		}

		Connection conn = DriverManager.getConnection("jdbc:hive2://node01,node02,node03/default;serviceDiscoveryMode=zooKeeper;zooKeeperNamespace=hiveserver2_zk", "root", "");

		Statement stmt = conn.createStatement();

		String sql = "select * from tbl";

		ResultSet res = stmt.executeQuery(sql);

		while (res.next()) {

			System.out.println(res.getString(1));

		}

	}

}

Hive-ha （十三）的更多相关文章

Hive HA使用说明
hive让大数据飞了起来,不再需要专人写MR.平常我们都可以用基于thrift的任意语言来调用hive. 不过爱恨各半,hive的thrift不稳定也是出了名的.很容易就出问题,让人无计可施.唯一的办 ...
Hadoop 2.6.0+ZooKeeper+Hive HA高可用集群安装
http://blog.csdn.net/totxian/article/details/45248399
Hive HA基本原理
hive数据仓库入门到实战及面试
第一章.hive入门一.hive入门手册 1.什么是数据仓库 1.1数据仓库概念对历史数据变化的统计,从而支撑企业的决策.比如:某个商品最近一个月的销量,预判下个月应该销售多少,从而补充多少货源. ...
基于Hadoop的数据仓库Hive
Hive是基于Hadoop的数据仓库工具,可对存储在HDFS上的文件中的数据集进行数据整理.特殊查询和分析处理,提供了类似于SQL语言的查询语言–HiveQL,可通过HQL语句实现简单的MR统计,Hi ...
MUA
a big deal analysis analytics cooperate 合作 efficient explicitly fine grained Granularity graph geogr ...
oschina大数据开源软件
Hadoop 图形化用户界面 Hue 大数据可视化工具 Nanocubes 企业大数据平台 RedHadoop 大数据查询引擎 PrestoDB Hadoop集群监控工具 HTools 安全大数据分析 ...
通过Ambari2.2.2部署HDP大数据服务
node1 amari-server node2 amari-agent namenode1,datanode,resourcemanager,zk node3 amari-agent namen ...
【学习笔记】大数据技术原理与应用（MOOC视频、厦门大学林子雨）
1 大数据概述大数据特性:4v volume velocity variety value 即大量化.快速化.多样化.价值密度低数据量大:大数据摩尔定律快速化:从数据的生成到消耗,时间窗口小,可 ...
大二暑假第六周总结--开始学习Hadoop基础（五）
简单学习数据仓库HIVE HIVE是一个构建于Hadoop顶端的数据仓库工具支持大规模数据存储,分析,具有良好的可扩展性某种程度上可以看做是用户编程接口,本身不存储和处理数据依赖分布式系统HDF ...

随机推荐

itchat相关资料
https://itchat.readthedocs.io/zh/latest/ https://www.v2ex.com/t/306804 http://blog.csdn.net/th_num/a ...
Java学习笔记-IO
IO(Input Output)流,用来处理设备之间的数据传输 IO IO概述 Java对数据的操作是通过流的方式 Java用于操作流的对象都在IO包中流按操作数据分为两种:字节流与字符流流按流向 ...
day20 logging模块、re模块
今日内容: 1.logging模块 2.re模块 1.logging模块 -- 什么是logging模块 -- logging模块是用来进行记录日志的模块,主要作用是将想要输出的日志进行分级,然后以不 ...
使用Java实现hello/hi的简单网络聊天程序
Socket又称套接字,是基于应用服务与TCP/IP通信之间的一个抽象,它是计算机之间进行通信的一种约定或一种方式.通过socket这种约定,一台计算机可以接收其他计算机的数据,也可以向其他计算机发送 ...
【转帖】CentOS 7 修改时区
CentOS 7 修改时区 https://www.cnblogs.com/yaohong/p/7269878.html timedatectl 以及 time 分类: 操作系统-CentOS u ...
Web在线报表设计器使用指南
市面上的报表工具有很多,虽说功能大同小异,但每一个报表工具都有各自明确的定位,选择最合适的工具,才能达到事半功倍的效果. 本文将要介绍的ActiveReports报表工具,可全面满足 .NET 报表开 ...
ES-基本概念
目录: 1. ElasticSearch是什么 2. 基本概念 3. 几个关键词正文: 1. ElasticSearch是什么 ElasticSearch是一个基于Lucene的搜索 ...
「java.util.concurrent并发包」之 CyclicBarrier
一描述 CyclicBarrier初始化时规定一个数目,然后计算调用了CyclicBarrier.await()进入等待的线程数.当线程数达到了这个数目时,所有进入等待状态的线程被唤醒并继续.Cyc ...
python 基础（十八）--shutil模块
shutil模块 shutil.copyfileobj(src,dst):只拷贝文件内容,需要open文件:目标文件不存在时创建,存在时覆盖 shutil.copyfileobj(open('old. ...
T100——报表的小计数量、小计金额，总计金额
范例:cxmr540_g01 范例代码: ON EVERY ROW #add-point:rep.everyrow.before name="rep.everyrow.before" ...

Hive-ha （十三）

hive—high Avaliable

Hive-ha （十三）的更多相关文章

随机推荐

热门专题