hiveservice简介

由于实验的须要，这两天就搭了个Hive，简单记录一下：

平台：OS：Ubuntu Kylin 14.04

　　　JAVA：Java 1.8.0_25

　　　HADOOP：Hadoop 2.4.0

　　　HIVE：Hive 0.14.0

　　有关Hive的安装这里就不说了，Hive配置好后，直接在安装目录下起动hive（记得先启动Hadoop哈，不然会报错），看着网上的教程简单的试用下；

 create table test(key int, name string) row format delimited fields terminated by ',' lines terminated by '\n';

 load data local inpath '/home/liang/test.txt' overwrite into table test;

 select * from test;

 show tables;

 show databases;

 desc test;

　　看着官网语言手册一顿乱试，感觉好数据库里的命令都好像啊！有关hive都支持什么样的语句及语句怎么写，官网语言手册上写的很详细，好像说从0.14开始支持ACID了，想学习还是啃下英文的手册比较好点，我只是大概看了下。

　　有事关机，回来重启，在用户主目录下启动hive，发现关机前create的表不见了，开始怀疑是不是自己的配置没配好呢，重新看了看配置，没错啊。还好在网上看到了hive使用derby作为元数据库找不到所创建表的原因这个帖子，原来是因为我使用的是默认元数据库derby，元数据库是存放在hive的启动目录的，其实如果你细心就会发现，在hive的启动目录下多了一个目录metastore_db和一个日志文件derby.log。当你换个目录启动hive时，derby在当前目录下就找不到以前的元数据库了，只好重建，所以会出现在HDFS上可以看到以前建的文件，但在hive中就是看不见的。所以，要想常用hive还是建议使用MySQL存放元数据吧，而且使用MySQL可以让多用户使用Hive。

　　下面进正题，说说使用JDBC连接hiveservice的事：

　　打开终端，先看看帮助文档是怎么说的，

 liang@liang-pc:/opt/apache-hive-0.14.-bin$ hive --help

 Usage ./hive <parameters> --service serviceName <service parameters>

 Service List: beeline cli help hiveburninclient hiveserver2 hiveserver hwi jar lineage metastore metatool orcfiledump rcfilecat schemaTool version

 Parameters parsed:

 --auxpath : Auxillary jars

 --config : Hive configuration directory

 --service : Starts specific service/component. cli is default

 Parameters used:

 HADOOP_HOME or HADOOP_PREFIX : Hadoop install directory

 HIVE_OPT : Hive options

 For help on a particular service:

 ./hive --service serviceName --help

 Debug help: ./hive --debug --help

　　从上面的输出的第二行可以看到hive的用法是：./hive <parameters> --service serviceName <service parameters>

　　从上面的输出的第三行可以看到可用的service有很多，我们这次要用的是hiveserver和hiveserver2

　　从上面的输出的第12行可以看到，想了解特定service的详细帮助的命令是：./hive --service serviceName --help

　　在终端输入依次输入hive --service hiveserver --help和hive --service hiveserver2

 liang@liang-pc:/opt/apache-hive-0.14.-bin$ hive --service hiveserver --help

 Starting Hive Thrift Server

 usage: hiveserver

  -h,--help                        Print help information

     --hiveconf <property=value>   Use value for given property

     --maxWorkerThreads <arg>      maximum number of worker threads,

                                   default:

     --minWorkerThreads <arg>      minimum number of worker threads,

                                   default:

  -p <port>                        Hive Server port number, default:

  -v,--verbose                     Verbose mode

 liang@liang-pc:/opt/apache-hive-0.14.-bin$ hive --service hiveserver2 --help

 usage: hiveserver2

     --deregister <versionNumber>   Deregister all instances of given

                                    version from dynamic service discovery

  -H,--help                         Print help information

     --hiveconf <property=value>    Use value for given property

　　从上面的输出只能看到两个service的使用配置和一些默认值，那有关两者的区别和详细说明只好去官网找找HiveServer和HiveServer2了。果然说的比较详细，HiveServer2是HiveServer的升级，且在hive 0.15后，HiveServer将会被移除。原话是：

WARNING!

HiveServer cannot handle concurrent requests from more than one client. This is actually a limitation imposed by the Thrift interface that HiveServer exports, and can't be resolved by modifying the HiveServer code.

HiveServer2 is a rewrite of HiveServer that addresses these problems, starting with Hive 0.11.0. Use of HiveServer2 is recommended.

HiveServer is scheduled to be removed from Hive releases starting Hive 0.15. See HIVE-6977. Please switch over to HiveServer2.

　　hive服务启动后，就使用JDBC来写程序了，这个和数据库就更想了，直接上代码，

 package hive;

 import java.sql.Connection;

 import java.sql.DriverManager;

 import java.sql.ResultSet;

 import java.sql.Statement;

 public class HiveService {

     public static void main(String[] args) throws Exception

     {

         Connection conn = null;

         /*

          * 使用hiveserver时的配置

          * 其中URL的写法是：jdbc:hive://ip:port/db

          * ip是hiveserver所在的机器ip，port是hiveserver的服务端口，db是数据库名字，后面还有用户名和密码，

          * 这都和其他的数据库的JDBC一样

          */

 //        Class.forName("org.apache.hadoop.hive.jdbc.HiveDriver");

 //        conn = DriverManager.getConnection("jdbc:hive://localhost:10000/default", "", "");

         /*

          * 使用hiveserver2时的配置

          * 与hiveserver比较，只有要加载的类和URL的写法有一点点的不同，其他的都不用改

          */

         Class.forName("org.apache.hive.jdbc.HiveDriver");

         conn = DriverManager.getConnection("jdbc:hive2://localhost:10000/default", "", "");

         Statement stat = conn.createStatement();

         ResultSet rs = stat.executeQuery("select * from test");

 //        ResultSet rs = stat.executeQuery("show tables");

 //        ResultSet rs = stat.executeQuery("show databases");

 //        ResultSet rs = stat.executeQuery("desc test");

         while (rs.next())

         {

             System.out.println(rs.getString(1) + "\t" + rs.getString(2));

         }

     }

 }

　　所依赖的jar包有：${HIVE_HOME}/lib/hive-jdbc-0.14.0-standalone.jar和${HADOOP_HOME}/share/hadoop/common/hadoop-common-2.4.0.jar

　　当使用hiveserver时，可能是我的hive版本和hadoop版本不对应，会报以下错误，而hiveserver2却不会。

 Exception in thread "main" java.lang.ExceptionInInitializerError

 at org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe.initSerdeParams(LazySimpleSerDe.java:318)

 ......

 at hive.HiveService.main(HiveService.java:16)

 Caused by: java.lang.RuntimeException: Could not load shims in class org.apache.hadoop.hive.shims.Hadoop23Shims

 at org.apache.hadoop.hive.shims.ShimLoader.createShim(ShimLoader.java:138)

 ......

 Caused by: java.lang.ClassNotFoundException: org.apache.hadoop.hive.shims.Hadoop23Shims

 at java.net.URLClassLoader$1.run(URLClassLoader.java:372)

　　由于hiveserver2可以正常运行，且hiveserver是将要被移除的，就没查找错误的具体原因，有了解的可给我说下。

　　还有一点要注意的是，在我的电脑上测试时，SQL语句后面不要以";"结尾，不然会报错，ResultSet.getString(String columnLabel)会出错。

更详细的有关JDBC的使用请参考：

HiveServer1：https://cwiki.apache.org/confluence/display/Hive/HiveClient

HiveServer2：https://cwiki.apache.org/confluence/display/Hive/HiveServer2%20Clients#HiveServer2Clients-UsingJDBC

hiveservice简介的更多相关文章

ASP.NET Core 1.1 简介
ASP.NET Core 1.1 于2016年11月16日发布.这个版本包括许多伟大的新功能以及许多错误修复和一般的增强.这个版本包含了多个新的中间件组件.针对Windows的WebListener服 ...
MVVM模式和在WPF中的实现（一）MVVM模式简介
MVVM模式解析和在WPF中的实现(一) MVVM模式简介系列目录: MVVM模式解析和在WPF中的实现(一)MVVM模式简介 MVVM模式解析和在WPF中的实现(二)数据绑定 MVVM模式解析和在 ...
Cassandra简介
在前面的一篇文章<图形数据库Neo4J简介>中,我们介绍了一种非常流行的图形数据库Neo4J的使用方法.而在本文中,我们将对另外一种类型的NoSQL数据库——Cassandra进行简单地介 ...
REST简介
一说到REST,我想大家的第一反应就是“啊,就是那种前后台通信方式.”但是在要求详细讲述它所提出的各个约束,以及如何开始搭建REST服务时,却很少有人能够清晰地说出它到底是什么,需要遵守什么样的准则. ...
Microservice架构模式简介
在2014年,Sam Newman,Martin Fowler在ThoughtWorks的一位同事,出版了一本新书<Building Microservices>.该书描述了如何按照Mic ...
const,static,extern 简介
const,static,extern 简介一.const与宏的区别: const简介:之前常用的字符串常量,一般是抽成宏,但是苹果不推荐我们抽成宏,推荐我们使用const常量. 执行时刻:宏是预编 ...
HTTPS简介
一.简单总结 1.HTTPS概念总结 HTTPS 就是对HTTP进行了TLS或SSL加密. 应用层的HTTP协议通过传输层的TCP协议来传输,HTTPS 在 HTTP和 TCP中间加了一层TLS/SS ...
【Machine Learning】机器学习及其基础概念简介
机器学习及其基础概念简介作者:白宁超 2016年12月23日21:24:51 摘要:随着机器学习和深度学习的热潮,各种图书层出不穷.然而多数是基础理论知识介绍,缺乏实现的深入理解.本系列文章是作者结 ...
Cesium简介以及离线部署运行
Cesium简介 cesium是国外一个基于JavaScript编写的使用WebGL的地图引擎,一款开源3DGIS的js库.cesium支持3D,2D,2.5D形式的地图展示,可以自行绘制图形,高亮区 ...

随机推荐

Vue源码探究-虚拟DOM的渲染
Vue源码探究-虚拟DOM的渲染在虚拟节点的实现一篇中,除了知道了 VNode 类的实现之外,还简要地整理了一下DOM渲染的路径.在这一篇中,主要来分析一下两条路径的具体实现代码. 按照创建 Vue ...
PHP 中的 curl 函数发送 Post 请求应该注意的几点
public function http_request( $url, $post = '', $timeout = 5 ){ if( empty( $url ) ){return ;}$ch = c ...
Linux常用命令3 文件搜索命令
文件搜索非常占用资源,所以尽量不要使用这个命令避免少用该命令最好的方式是设置好文件夹结构,文件不要乱放 1.文件搜索命令:find 命令名称:find 所在路径:/bin/find 执行权限:所有用 ...
微信小程序 —— wepy 使用 Vant Weapp
一.下载 npm i @vant/weapp -S --production 下载完毕之后,就可以在 node_modules 文件夹里,看见下载的包了. 2.移动文件夹把刚刚下载的包文件夹下的 l ...
洛谷 P2568 GCD（莫比乌斯反演）
题意:$\sum_{i=1}^{n}\sum_{j=1}^{n}[gcd(i,j)\epsilon prime]$. 对于这类题一般就是枚举gcd,可得: =$\sum_{d\epsilon prim ...
time 与 data time
>>> import datetime>>> datetime.datetime.now()datetime.datetime(2018, 5, 30, 15, 3 ...
docker保存容器的修改
docker保存容器修改通过在容器中运行某一个命令,可以把对容器的修改保存下来, 这样下次可以从保存后的最新状态运行该容器.docker中保存状态的过程称之为committing, 它保存的新旧状态 ...
阿里云：面向5G时代的物联网无线连接服务
在4月24日落幕的2019中国联通合作伙伴大会“5G+物联网(IoT)论坛”上,阿里云高级运营专家李茁出席圆桌对话,分享了5G时代物联网如何更好地推动行业完成生产.管理和商业模式的创新,阿里云又会以何 ...
TCP/IP网络编程读书笔记1
本篇主干内容是TCP/IP网络编程1-9章学习笔记 1. linux文件描述符描述符从3开始以由小到大的顺序编号,0,1,2,分配给标准I/O用作标准输入.标准输出和标准错误. 2. 协议族与套接字 ...
从零学React Native之06flexbox布局
前面我们接触了好多React Native代码, 并没有介绍RN中的组件具体是如何布局的,这一篇文章,重点介绍下flexbox布局. 什么是flexbox布局 React中引入了flexbox概念,f ...

hiveservice简介

hiveservice简介的更多相关文章

随机推荐

热门专题