038 关于HIVE的配置
一:常用版本
1.版本
0.13.1 2014年
1.2.1 2015年
版本之间的区别:支持SQL不同,向关系型数据库靠拢。
目前看到的版本是2.3.2了。
2.官网
二:安装配置hive
1.检测hadoop
2.解压hive
3.修改环境
sudo vi /etc/profile
4.source以下
5.复制hive-env.sh
6.编辑hive-env.sh
设置hadoop的配置环境,因为hive需要hadoop,不然hive和hadoop没有关联。
hive的配置文件目录要启动的,因为除了默认的hive加载,自定义的hive文件在conf下,也需要加载。
7.在HDFS上创建文件夹并修改写权限
同组可写权限。
保存hive的数据,主要放在HDFS上的warehouse文件夹下。
说明:
为啥是这个目录。因为hive.metastore.warehouse.dir在默认文件中的位置是这个位置,所以就设置了这个目录。
8.验证hive的安装
属于启动。
进入hive的命令行。
二:操作hive
1.显示有哪些数据库
有一个default数据库。
说明:
假设在这个数据库下创建一个表,这个表就在user/hive/warehouse文件夹下。
2.创建数据库
3.在新建的数据库中新建表
使用新建的数据库
use hadoop09;
这个使用的字符串是string,不是varchar,因为底层是hadoop。
4.加载数据
首先要书写数据:
加载数据:
5.HDFS里文件的分布
一开始是数据仓库文件。
hadoop09是数据库,所以生成的文件名字教hadoop09.db。
student是一张表。
里面有一个文件,是数据文件,这个文件也是刚才在本地编辑的文件。
维护都是使用文件夹。
6.hive查询语句
三:hive的问题
1.问题的由来
当开启第二个hive的时候,就会出现问题。
因为hive的默认数据库使用的是derby,只能启用一个实例,所以不适合企业。
解决的方案是:使用mysql关系数据库代替derby。
四:配置mysql
1.卸载已经安装的mysql
2.安装mysql
3.查看mysql的状态
4.开启服务
5.设置开机启动
6.设置密码
7.进入数据库
8.修改连接权限的位置
9.修改连接权限
增加一个权限
删除其他的
10.刷新权限,退出,重启服务
以上的mysql已经配置完成
五.配置hive
1.生成hive-site.xml
2.配置hive-site.xml、
官网位置:
修改的配置:
3.在lib下加入驱动
4.启动hive
5.观看效果
出现了metastore数据库。
六:日志的配置问题
1.问题的由来
2.在conf中启用
3.修改配置,hive运行的日志配置
七.人性化设置
1.列名,数据库名
2.效果
038 关于HIVE的配置的更多相关文章
- Hive安装配置指北(含Hive Metastore详解)
个人主页: http://www.linbingdong.com 本文介绍Hive安装配置的整个过程,包括MySQL.Hive及Metastore的安装配置,并分析了Metastore三种配置方式的区 ...
- Hadoop之Hive(2)--配置Hive Metastore
Hive metastore服务以关系性数据库的方式存储Hive tables和partitions的metadata,并且提供给客户端访问这些数据的metastore service的API.下面介 ...
- 【转】 hive安装配置及遇到的问题解决
原文来自: http://blog.csdn.net/songchunhong/article/details/51423823 1.下载Hive安装包apache-hive-1.2.1-bin.ta ...
- hive权限配置
基于CDH5.x的Hive权限配置 1.打开权限控制,默认是没有限制的 set hive.security.authorization.enabled=true; 2.配置默认权限 hive.secu ...
- Hive的配置| 架构原理
Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能. 本质是:将HQL转化成MapReduce程序 1)Hive处理的数据存储在HDFS 2)Hi ...
- Mac上Hive安装配置
Mac上Hive安装配置 1.安装 下载hive,地址:http://mirror.bit.edu.cn/apache/hive/ 之前我配置了集群,tjt01.tjt02.tjt03,这里hive安 ...
- Hive的配置详解和日常维护
Hive的配置详解和日常维护 一.Hive的参数配置详解 1>.mapred.reduce.tasks 默认为-1.指定Hive作业的reduce task个数,如果保留默认值,则Hive 自 ...
- Hive安装配置详解步骤以及hive使用mysql配置
Hive是一个数据仓库基础工具在Hadoop中用来处理结构化数据.它架构在Hadoop之上,总归为大数据,并使得查询和分析方便.并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务 ...
- Hive设置配置参数的方法,列举8个常用配置
Hive设置配置参数的方法 Hive提供三种可以改变环境变量的方法,分别是: (1).修改${HIVE_HOME}/conf/hive-site.xml配置文件: (2).命令行参数: (3).在已经 ...
随机推荐
- HTML链接/实施CSS的三种方法
①页面内部链接: <head> <style type="text/css"> /*Cascading Style Shee ...
- ElasticSearch学习
官方文档 https://www.elastic.co/cn/ http://www.learnes.net/
- golang使用simplejson库解析复杂json
cnblogs原创 golang自带的json解析库encoding/json提供了json字符串到json对象的相互转换,在json字符串比较简单的情况下还是挺好用的,但是当json字符串比较复杂或 ...
- [转]xargs命令详解,xargs与管道的区别
为什么要用xargs,问题的来源 在工作中经常会接触到xargs命令,特别是在别人写的脚本里面也经常会遇到,但是却很容易与管道搞混淆,本篇会详细讲解到底什么是xargs命令,为什么要用xargs命令以 ...
- Fragment与Activity之间的相互通信
https://blog.csdn.net/u012702547/article/details/49786417 https://blog.csdn.net/carson_ho/article/de ...
- android 解决子线程进行UI操作
Android确实不允许在子线程中进行UI操作的,但我们有时必须在子线程里去执行一些耗时的任务,然后根据任务的执行结果来更新相应的UI控件. Android提供了一套异步消息处理机制,可以解决子线程中 ...
- Dubbo——基于Zookeeper服务框架搭建及案例演示
一.了解SOA微服务架构 在大规模服务化之前,应用可能只是通过RMI或Hessian等工具,简单的暴露和引用远程服务,通过配置服务的URL地址进行调用,通过F5等硬件进行负载均衡. (1) 当服务越来 ...
- Node 7.6默认支持Async/Await
Node.js 7.6正式默认支持async/await功能,并能够使低内存设备获得更出色的性能. Node 7.6对async/await的支持来自于将V8(Chromium JavaScript引 ...
- oracle数据库自增主键重复
select max(t.id) from T_PLAT_ENUM_VALUE tdrop sequence T_PLAT_ENUM_VALUE;create sequence T_PLAT_ENUM ...
- Python3学习笔记17-类与实例
面向对象最重要的概念就是类(Class)和实例(Instance),必须牢记类是抽象的模板,比如Student类 而实例是根据类创建出来的一个个具体的“对象”,每个对象都拥有相同的方法,但各自的数据可 ...