4大数据实战系列-hive安装配置优化

1 基础环境

1.1 版本预览

    Cnetos 6.5    已安装

    Hadoop 2.8   已安装集群

    Hive 2.3      待安装

    Mysql 5.6     已安装

    Spark 2.1.1    已安装

1.2 机器环境

机192.168.0.251 slave
192.168.0.252 master
Hadoop：hadoop已做双机无密码登录1.3 工作路径

*Hadoop：/home/data/app/hadoop/hadoop-2.8.0/etc/hadoop
Spark：/home/data/app/hadoop/spark-2.1.1-bin-hadoop2.7
Hive数据路径： /user/hive/warehouse/*

2安装

2.1 下载hive

http://hive.apache.org/downloads.html

2.2 下载mysql-connector

http://dev.mysql.com/downloads/connector/j/

2.3 安装

Hive:

Cd /data/software

Rz apache-hive-2.3.0-bin.tar.gz

Tar -zxvf apache-hive-2.3.0-bin.tar.gz

Mv apache-hive-2.3.0-bin /home/data/app/hadoop/

Mysql-connector:

/home/data/app/hadoop/hive-2.3.0/lib

Tar -zxvf mysql-connector-java-5.1.44.tar.gz

Cd mysql-connector-java-5.1.44

Mv mysql-connector-java-5.1.44-bin.jar ../

3 配置

3.1 初始配置

Vim /etc/profile

export HIVE_HOME=/home/data/app/hadoop/hive-2.3.0

export PATH=$PATH:$HIVE_HOME/bin

cp hive-env.sh.template hive-env.sh

cp hive-default.xml.template hive-site.xml

cp hive-log4j2.properties.template hive-log4j2.properties

cp hive-exec-log4j2.properties.template hive-exec-log4j2.properties

3.2 hive-env.sh环境配置

export JAVA_HOME=/home/data/software/jdk1.8.0_121   ##Java路径

export HADOOP_HOME=/home/data/app/hadoop/hadoop-2.8.0   ##Hadoop安装路径

export HIVE_HOME=/home/data/app/hadoop/hive-2.3.0    ##Hive安装路径

export HIVE_CONF_DIR=/home/data/app/hadoop/hive-

2.3.0 /conf    ##Hive配置文件路径

3.3 创建配置路径

hdfs dfs -mkdir -p /user/hive/warehouse

hdfs dfs -mkdir -p /user/hive/tmp

hdfs dfs -mkdir -p /user/hive/log

hdfs dfs -chmod -R 777 /user/hive/warehouse

hdfs dfs -chmod -R 777 /user/hive/tmp

hdfs dfs -chmod -R 777 /user/hive/log

3.4 hive-site.xml配置
2.4.1 配置连接mysql

<!--hive临时数据 -->

<property>

    <name>hive.exec.scratchdir</name>

    <value>/user/hive/tmp</value>

</property>

<!--hive数据库的数据文件-->

<property>

    <name>hive.metastore.warehouse.dir</name>

    <value>/user/hive/warehouse</value>

</property>

<!--hive日志-->

<property>

    <name>hive.querylog.location</name>

    <value>/user/hive/log</value>

</property>

<!--hive连接mysql，mysql存储hive数据库配置信息-->

<property>

    <name>javax.jdo.option.ConnectionURL</name>

<value>jdbc:mysql://192.168.0.2513306/hive?createDatabaseIfNotExist=true&amp;characterEncoding=UTF-8&amp;useSSL=false</value>

  </property>

  <property>

    <name>javax.jdo.option.ConnectionDriverName</name>

    <value>com.mysql.jdbc.Driver</value>

  </property>

  <property>

    <name>javax.jdo.option.ConnectionUserName</name>

    <value>hive</value>

  </property>

  <property>

    <name>javax.jdo.option.ConnectionPassword</name>

    <value>hive</value>

  </property>

3.4.2 配置tmp路径

mkdir /home/data/app/hadoop/hive-2.3.0/tmp

把{system:java.io.tmpdir} 改成 /home/data/app/hadoop/hive-2.3.0/tmp/

把 {system:user.name} 改成 {user.name}

4 初始化hive

schematool -dbType mysql -initSchema hive hive

5 启动测试

5.1 hive启动
5.1.1 hiveserver

Cd /home/data/app/hadoop/hive-2.3.0/bin

Nohup ./hiveserver2 &

ps -ef|grep hive|grep -v grep

5.1.2 hive

./hive

Debug 模式：hive -hiveconf hive.root.logger=DEBUG,console

Show databases;

Create database hive_data;

请检查 mysql->hive->dbs表

hadoop fs -ls /user/hive/warehouse

5.2 beeline启动
5.2.1同上先启动hiveserver
5.2.2 hadoop core-site.xml添加配置：

<property>

  <name>hadoop.proxyuser.root.groups</name>

  <value>*</value>

</property>

<property>

  <name>hadoop.proxyuser.root.hosts</name>

  <value>*</value>

</property>

./beeline

6 任务运行分析webUI

总结：hive运行在hadoop上，数据库文件存储hdfs，job task是mapreduce执行,所以数据库存储是分布式，任务执行也是多节点并行执行
http://192.168.0.252:8088

4大数据实战系列-hive安装配置优化的更多相关文章

《OD大数据实战》Hive环境搭建
一.搭建hadoop环境 <OD大数据实战>hadoop伪分布式环境搭建二.Hive环境搭建 1. 准备安装文件下载地址: http://archive.cloudera.com/cd ...
【大数据】Hadoop单机安装配置
1.解压缩hadoop-2.7.6.tar.gz到/home/hadoop/Soft目录中 2.创建软链接,方便hadoop升级 ln -s /home/hadoop/Soft/hadoop-2.7 ...
吴裕雄--天生自然 HADOOP大数据分布式处理：安装配置MYSQL数据库
安装之前先安装基本环境:yum install -y perl perl-Module-Build net-tools autoconf libaio numactl-libs # 下载mysql源安 ...
《OD大数据实战》Hive入门实例
官方参考文档:https://cwiki.apache.org/confluence/display/Hive/LanguageManual 一.命令行和客户端 1. 命令窗口 1)进入命令窗口 hi ...
InfluxDB+Grafana大数据监控系列之数据源配置（二）
一.Grafana 配置 InfluxDB 数据源 1.1 登录 Granfana 界面选择 InfluxDB 数据源在前面我们已经部署好相应监控环境,登录Grafana:http://10.223 ...
吴裕雄--天生自然 HADOOP大数据分布式处理：安装配置Tomcat服务器
下载链接:https://tomcat.apache.org/download-80.cgi tar -zxvf apache-tomcat-8.5.42.tar.gz -C /usr/local/s ...
吴裕雄--天生自然 HADOOP大数据分布式处理：安装配置JAVA
tar -xzvf jdk-8u151-linux-x64.tar.gz -C /usr/local/src sudo vim /etc/profile .编辑/etc/profile # JAVA ...
《OD大数据实战》驴妈妈旅游网大型离线数据电商分析平台
一.环境搭建 1. <OD大数据实战>Hadoop伪分布式环境搭建 2. <OD大数据实战>Hive环境搭建 3. <OD大数据实战>Sqoop入门实例 4. &l ...
大数据学习系列之四 ----- Hadoop+Hive环境搭建图文详解(单机)
引言在大数据学习系列之一 ----- Hadoop环境搭建(单机) 成功的搭建了Hadoop的环境,在大数据学习系列之二 ----- HBase环境搭建(单机)成功搭建了HBase的环境以及相关使用 ...
大数据学习系列之七 ----- Hadoop+Spark+Zookeeper+HBase+Hive集群搭建图文详解
引言在之前的大数据学习系列中,搭建了Hadoop+Spark+HBase+Hive 环境以及一些测试.其实要说的话,我开始学习大数据的时候,搭建的就是集群,并不是单机模式和伪分布式.至于为什么先写单 ...

随机推荐

flask基本项目结构
|-- myproject |-- config.py |-- flask-env.yml |-- manage.py |-- app | |-- models.py | |-- __init__.p ...
【Java SE】反射
Java Reflection 1 Java 反射机制概述 Reflection反射被视为动态语言的关键,反射机制允许在运行期间借助于Reflection取得任何类的内部信息,并能直接操作任意对象的内 ...
LNMP搭建静态网页服务器
chattr -i default/.user.ini LNMP搭建使用 1.安装screen,命令或者操作可以一直运行下去 yum install screen 2.获取及安装 LNMP wget ...
介绍一个.Net远程日志组件
对于软件开发的阶段和正式运行阶段,我们都需要查看日志来诊断出现的问题.不过,在查看日志时需要登录服务器,找到特定的日志文件,再查看其中的内容,这显然不是很方便. 为了解决这个问题,我们可以使用远程日志 ...
DeepSpeed Chat: 一键式RLHF训练，让你的类ChatGPT千亿大模型提速省钱15倍
DeepSpeed Chat: 一键式RLHF训练,让你的类ChatGPT千亿大模型提速省钱15倍 1. 概述近日来,ChatGPT及类似模型引发了人工智能(AI)领域的一场风潮. 这场风潮对数字世 ...
vivo 推送系统的容灾建设与实践
作者:vivo 互联网服务器团队 - Yu Quan 本文介绍了推送系统容灾建设和关键技术方案,以及实践过程中的思考与挑战. 一.推送系统介绍 vivo推送平台是vivo公司向开发者提供的消息推送服务 ...
机器学习07-(中文分词、样本类别均衡化、置信概率、k-means聚类算法、均值漂移聚类算法)
机器学习-07 机器学习-07 中文分词(jieba) 样本类别均衡化置信概率聚类模型 K均值算法均值漂移算法轮廓系数 DBSCAN算法推荐引擎代码总结结巴分词酒店评论舆情分析针对测 ...
UIOTOS：一款无门槛的前端0代码搭建工具
什么是UIOTOS? UIOTOS中文名称前端大师,是一款基于图形技术的前端0代码工具,支持通过连线和嵌套无门槛来搭建各类复杂的的交互界面,包括后台管理系统.组态数据大屏等,实现跟代码开发媲美的效果. ...
百度飞桨(PaddlePaddle)- 张量（Tensor）
飞桨使用张量(Tensor) 来表示神经网络中传递的数据,Tensor 可以理解为多维数组,类似于 Numpy 数组(ndarray) 的概念.与 Numpy 数组相比,Tensor 除了支持运行在 ...
2022-02-24：k8s安装rabbitmq，yaml如何写？
2022-02-24:k8s安装rabbitmq,yaml如何写? 答案2022-02-24: yaml如下: apiVersion: apps/v1 kind: Deployment metadat ...

4大数据实战系列-hive安装配置优化

1 基础环境

2安装

3 配置

4 初始化hive

5 启动测试

6 任务运行分析webUI

4大数据实战系列-hive安装配置优化的更多相关文章

随机推荐

热门专题