hadoop上hive的安装

1.前言

说明：安装hive前提是要先安装hadoop集群，并且hive只需要再hadoop的namenode节点集群里安装即可(需要再所有namenode上安装)，可以不在datanode节点的机器上安装。另外还需要说明的是，虽然修改配置文件并不需要你已经把hadoop跑起来，但是本文中用到了hadoop命令，在执行这些命令前你必须确保hadoop是在正常跑着的，而且启动hive的前提也是需要hadoop在正常跑着，所以建议你先将hadoop跑起来在按照本文操作。有关如何安装和启动hadoop集群。

hive 版本下载：hive-2.3.4/

下载 mysql-connector-java-5.1.46.jar

https://mvnrepository.com/artifact/mysql/mysql-connector-java/5.1.46

把包上传到/home/hadoop/hive

-rw-r--r--. 1 hadoop hadoop 232234292 Jan 6 06:49 apache-hive-2.3.4-bin.tar.gz
-rw-r--r--. 1 hadoop hadoop 1004838 Jan 6 06:49 mysql-connector-java-5.1.46.jar

解压：
tar -xvf apache-hive-2.3.4-bin.tar.gz

mv apache-hive-2.3.4-bin hive

然后把 mysql-connector-java-5.1.46.jar移动到hive2.3.4/lib下

把hive移动到/home/hadoop下

vi /etc/profile 添加下面
export HIVE_HOME=/home/hadoop/hive
export PATH=$PATH:$HIVE_HOME/bin
生效：
source /etc/profile

修改hive配置文件
cp hive-env.sh.template hive-env.sh
cp hive-default.xml.template hive-site.xml
cp hive-log4j2.properties.template hive-log4j2.properties
cp hive-exec-log4j2.properties.template hive-exec-log4j2.properties

修改 hive-env.sh 文件添加：
export JAVA_HOME=/usr/local/jdk1.8
export HADOOP_HOME=/home/hadoop/hadoop-2.7.3
export HIVE_HOME=/home/hadoop/hive
export HIVE_CONF_DIR=/home/hadoop/hive/conf

在hdfs中创建目录，并授权，用于存储文件
启动hadoop
hdfs dfs -mkdir -p /user/hive/warehouse
hdfs dfs -mkdir -p /user/hive/tmp
hdfs dfs -mkdir -p /user/hive/log
hdfs dfs -chmod -R 777 /user/hive/warehouse
hdfs dfs -chmod -R 777 /user/hive/tmp
hdfs dfs -chmod -R 777 /user/hive/log

验证：
[hadoop@master conf]$ hdfs dfs -ls /user/hive
Found 3 items
drwxrwxrwx   - hadoop supergroup          0 2019-01-06 07:09 /user/hive/log
drwxrwxrwx   - hadoop supergroup          0 2019-01-06 07:09 /user/hive/tmp
drwxrwxrwx   - hadoop supergroup          0 2019-01-06 07:09 /user/hive/warehouse

修改hive-site.xml

<property>
    <name>hive.exec.scratchdir</name>
    <value>/user/hive/tmp</value>
</property>

<property>
    <name>hive.metastore.warehouse.dir</name>
    <value>/user/hive/warehouse</value>
</property>

<property>
    <name>hive.querylog.location</name>
    <value>/user/hive/log</value>
</property>

<property>
    <name>javax.jdo.option.ConnectionURL</name>
    <value>jdbc:mysql://localhost:3306/hive?createDatabaseIfNotExist=true&amp;characterEncoding=UTF-8&amp;useSSL=false</value>
  </property>

<property>
    <name>javax.jdo.option.ConnectionDriverName</name>
    <value>com.mysql.jdbc.Driver</value>
</property>

<property>
    <name>javax.jdo.option.ConnectionUserName</name>
    <value>root</value>
  </property>

<property>
    <name>javax.jdo.option.ConnectionPassword</name>
    <value>mysql</value>             --mysql 的密码
  </property>

创建 tmp 文件夹 ,并修改权限
mkdir -p /home/hadoop/apps/hive/tmp
chmod -R 777 /home/hadoop/apps/hive/tmp

将hive-site.xml文件中的${system:java.io.tmpdir}替换为hive的临时目录 /home/hadoop/apps/hive/tmp
把 {system:user.name} 改成 {user.name}

初始化：

[hadoop@master conf]$ schematool -dbType mysql -initSchema
SLF4J: Class path contains multiple SLF4J bindings.
SLF4J: Found binding in [jar:file:/home/hadoop/hive/lib/log4j-slf4j-impl-2.6..jar!/org/slf4j/impl/StaticLoggerBinder.class]
SLF4J: Found binding in [jar:file:/home/hadoop/hadoop-2.7./share/hadoop/common/lib/slf4j-log4j12-1.7..jar!/org/slf4j/impl/StaticLoggerBinder.class]
SLF4J: See http://www.slf4j.org/codes.html#multiple_bindings for an explanation.
SLF4J: Actual binding is of type [org.apache.logging.slf4j.Log4jLoggerFactory]
Metastore connection URL:     jdbc:mysql://localhost:3306/hive?createDatabaseIfNotExist=true&characterEncoding=UTF-8&useSSL=false
Metastore Connection Driver :     com.mysql.jdbc.Driver
Metastore connection User:     root

原因是jar重复导致，删除一个jar包

[hadoop@master tmp]$ cd /home/hadoop/hive/lib/
[hadoop@master lib]$ ll log4j-slf4j-impl-2.6.2.jar
-rw-r--r--. 1 hadoop hadoop 22927 Jan 6 06:57 log4j-slf4j-impl-2.6.2.jar
[hadoop@master lib]$ rm -rf log4j-slf4j-impl-2.6.2.jar

[hadoop@master conf]$ schematool -dbType mysql -initSchema
Metastore connection URL:   jdbc:mysql://localhost:3306/hive?createDatabaseIfNotExist=true&characterEncoding=UTF-8&useSSL=false
Metastore Connection Driver :   com.mysql.jdbc.Driver
Metastore connection User:   root
Starting metastore schema initialization to 2.3.0
Initialization script hive-schema-2.3.0.mysql.sql
Initialization script completed
schemaTool completed

启动hive方式一：

[hadoop@master conf]$ hive
which: no hbase in (/usr/local/jdk1./bin:/usr/local/jdk1./jre/bin:/usr/local/bin:/bin:/usr/bin:/usr/local/sbin:/usr/sbin:/sbin:/home/hadoop/hive/bin:/home/hadoop/hadoop-2.7./sbin:/home/hadoop/hadoop-2.7./bin)
 
Logging initialized using configuration in file:/home/hadoop/hive/conf/hive-log4j2.properties Async: true
Hive-on-MR is deprecated in Hive  and may not be available in the future versions. Consider using a different execution engine (i.e. spark, tez) or using Hive .X releases.
hive> show database;

启动方式二：

使用 beeline
必须先对hadoop的core-site.xml进行配置，在文件里面添加并保存

<property>
<name>hadoop.proxyuser.hadoop.groups</name>
<value>*</value>
</property>
<property>
<name>hadoop.proxyuser.hadoop.hosts</name>
<value>*</value>
</property>
先启动 hiveserver2

[hadoop@master conf]$ hiveserver2
which: no hbase in (/usr/local/jdk1./bin:/usr/local/jdk1./jre/bin:/usr/local/bin:/bin:/usr/bin:/usr/local/sbin:/usr/sbin:/sbin:/home/hadoop/hive/bin:/home/hadoop/hadoop-2.7./sbin:/home/hadoop/hadoop-2.7./bin)
-- ::: Starting HiveServer2

在启动

[hadoop@master hadoop]$ beeline
Beeline version 2.3. by Apache Hive
beeline> !connect jdbc:hive2://master:10000
Connecting to jdbc:hive2://master:10000
Enter username for jdbc:hive2://master:10000: hadoop
Enter password for jdbc:hive2://master:10000: ******
Connected to: Apache Hive (version 2.3.)
Driver: Hive JDBC (version 2.3.)
Transaction isolation: TRANSACTION_REPEATABLE_READ
: jdbc:hive2://master:10000> show databases;
+----------------+
| database_name  |
+----------------+
| default        |
+----------------+
 row selected (1.196 seconds)
: jdbc:hive2://master:10000>

启动方式三 :Web UI

一、页面配置

[hadoop@master conf]$ vi hive-site.xml

<property>
    <name>hive.server2.webui.host</name>
    <value>192.168.1.30</value>  --主机IP
    <description>The host address the HiveServer2 WebUI will listen on</description>
  </property>
  <property>
    <name>hive.server2.webui.port</name>
    <value></value>
    <description>The port the HiveServer2 WebUI will listen on. This can beset to  or a negative integer to disable the web UI</description>
  </property>

二、切记，在修改完hive的hive-site.xml的配置之后，一定要重新启动HiveServer2服务

[hadoop@master conf]$ hive --service hiveserver2 &
[1] 3731
[hadoop@master conf]$ which: no hbase in (/usr/local/jdk1.8/bin:/usr/local/jdk1.8/jre/bin:/usr/local/bin:/bin:/usr/bin:/usr/local/sbin:/usr/sbin:/sbin:/home/hadoop/hive/bin:/home/hadoop/hadoop-2.7.3/sbin:/home/hadoop/hadoop-2.7.3/bin)
2019-01-08 10:38:40: Starting HiveServer2

。。。。。。

三、在浏览器前台输入网址：http://192.168.1.30:10002/

[hadoop@master bin]$ beeline
Beeline version 2.3. by Apache Hive
beeline> !connect jdbc:hive2://master:10000 hadoop hadoop org.apache.hive.jdbc.HiveDriver
Connecting to jdbc:hive2://master:10000
Connected to: Apache Hive (version 2.3.)
Driver: Hive JDBC (version 2.3.)
Transaction isolation: TRANSACTION_REPEATABLE_READ
: jdbc:hive2://master:10000> show databases;
OK
+----------------+
| database_name  |
+----------------+
| db_hive        |
| default        |
+----------------+
 rows selected (1.555 seconds)
: jdbc:hive2://master:10000> use db_hive;
OK
No rows affected (0.153 seconds)
: jdbc:hive2://master:10000> show tables;
OK
+-----------+
| tab_name  |
+-----------+
| u2        |
| u4        |
+-----------+
 rows selected (0.159 seconds)
: jdbc:hive2://master:10000> select * from u2;
OK
+--------+----------+---------+-----------+---------+
| u2.id  | u2.name  | u2.age  | u2.month  | u2.day  |
+--------+----------+---------+-----------+---------+
|       | xm1      |       |          |       |
|       | xm2      |       |          |       |
|       | xm3      |       |          |       |
|       | xh4      |       |          |       |
|       | xh5      |       |          |       |
|       | xh6      |       |          |       |
|       | xh7      |       |          |       |
|       | xh8      |       |          |       |
|       | xh9      |       |          |       |
+--------+----------+---------+-----------+---------+
 rows selected (2.672 seconds)
: jdbc:hive2://master:10000>
 [hadoop@master bin]$ beeline -u jdbc:hive2://master:10000/default
Connecting to jdbc:hive2://master:10000/default
Connected to: Apache Hive (version 2.3.)
Driver: Hive JDBC (version 2.3.)
Transaction isolation: TRANSACTION_REPEATABLE_READ
Beeline version 2.3. by Apache Hive
: jdbc:hive2://master:10000/default> show databases;
OK
+----------------+
| database_name  |
+----------------+
| db_hive        |
| default        |
+----------------+
 rows selected (0.208 seconds)

完。。。

hadoop上hive的安装的更多相关文章

Hadoop上 Hive 操作
数据dept表的准备: --创建dept表 CREATE TABLE dept( deptno int, dname string, loc string) ROW FORMAT DELIMITED ...
Hadoop 上Hive 的操作
数据dept表的准备: --创建dept表 CREATE TABLE dept( deptno int, dname string, loc string) ROW FORMAT DELIMITED ...
《Programming Hive》读书笔记（一）Hadoop和hive环境搭建
<Programming Hive>读书笔记(一)Hadoop和Hive环境搭建先把主要的技术和工具学好,才干更高效地思考和工作. Chapter 1.Int ...
hadoop/hbase/hive单机扩增slave
原来只有一台机器,hadoop,hbase,hive都安装在一台机器上,现在又申请到一台机器,领导说做成主备, 要重新配置吗?还是原来的不动,把新增的机器做成slave,原来的当作master?网上找 ...
Hadoop之hive安装过程以及运行常见问题
Hive简介 1.数据仓库工具 2.支持一种与Sql类似的语言HiveQL 3.可以看成是从Sql到MapReduce的映射器 4.提供shall.Jdbc/odbc.Thrift.Web等接口 Hi ...
Hadoop学习(7)-hive的安装和命令行使用和java操作
Hive的用处,就是把hdfs里的文件建立映射转化成数据库的表但hive里的sql语句都是转化成了mapruduce来对hdfs里的数据进行处理 ,并不是真正的在数据库里进行了操作. 而那些表的定义 ...
Mac上Hive安装配置
Mac上Hive安装配置 1.安装下载hive,地址:http://mirror.bit.edu.cn/apache/hive/ 之前我配置了集群,tjt01.tjt02.tjt03,这里hive安 ...
【Hadoop离线基础总结】Hive的安装部署以及使用方式
Hive的安装部署以及使用方式安装部署 Derby版hive直接使用 cd /export/softwares 将上传的hive软件包解压:tar -zxvf hive-1.1.0-cdh5.14. ...
1. 安装虚拟机，Hadoop和Hive
由于想自学下Hive,所以前段时间在个人电脑上安装了虚拟机,并安装上Hadoop和Hive.接下我就分享下我如何安装Hive的.步骤如下: 安装虚拟机安装Hadoop 安装Java 安装Hive 我 ...

随机推荐

is幻梦 Linux命令之文件和目录操作命令（二）——查看文件内容cat、more、less、tail、head
一.cat命令用法:cat [选项][文件] 1.主要用来查看文件内容 2.-n 在文件内容的每一行上加上行号 3.再不加任何选项和文件名的时候,将标准输入的内容复制到标准输出这个时候一般用于重定 ...
LC 470. Implement Rand10() Using Rand7()
Given a function rand7 which generates a uniform random integer in the range 1 to 7, write a functio ...
Mysql密码忘记，修改密码方法
1.set password for ‘root’@’localhost’ = password(‘czllss’); -- czllss为新密码
手动集成 Ironic 裸金属管理服务（Rocky）
目录文章目录目录前文列表横向扩展裸金属管理服务节点配置基础设施安装 Ironic(BareMetal) 安装 Nova Compute(BareMetal) 配置 Neutron 提供 P ...
js 中实现汉字按拼音排序
let arr = ["贵州省", "江苏省", "江西省", "浙江省", "四川省", &quo ...
进程,虚拟环境,Mysql主从
进程查看进程 ps(类似windows任务管理器) man 1 ps # 查看命令文档 ps[options] 1 UNIX options, which may be grouped and mu ...
centos 7.3镜像制作
1.在KVM环境上准备虚拟机磁盘 [root@localhost ~]# qemu-img create -f qcow2 -o size=50G /opt/CentOS-7-1511-x86_64_ ...
office web apps安装部署,配置https,负载均衡（七）配置过程中遇到的问题详细解答
该篇文章,是这个系列文章的最后一篇文章,该篇文章将详细解答owa在安装过程中常见的问题. 如果您没有搭建好office web apps,您可以查看前面的一系列文章,查看具体步骤: office we ...
Django模板系统-内置和自定义Filters
django模板中最常用的两种特殊符号是 {{ }} 用来表示变量和 {% %} 用来表示逻辑相关的操作变量 {{ 变量名 }} ,由字母数字下划线组成而.在模板语言中有特殊含义,用来获取对象相应的 ...
【miscellaneous】最新HEVC/H.265 4K视频，显卡解码测试
转载自:http://bbs.zol.com.cn/diybbs/d34441_76103.html 4K这个概念也在最近几年开始流行了起来,无论是4K显示器.4K电视盒子,还是4K游戏对硬件的要求也 ...

hadoop上hive的安装

hadoop上hive的安装的更多相关文章

随机推荐

热门专题