Hive的安装和建表

认识Hive
1. 解压
2. 配置mysql metastore（切换到root用户）
3. 配置hive
- 复制hive-default.xml.template文件并改名为 hive-site.xml，删除hive-site.xml所有内容，并添加如下内容：
4. 安装hive和mysq完成后，将MySQL的连接jar包拷贝到$HIVE_HOME/lib目录下
5. 建表
6. 创建分区表
- 普通表和分区表区别：有大量数据增加的需要建分区表
- 分区表加载数据

认识Hive

Hive是基于Hadoop构建的一套数据仓库分析系统，它提供了丰富的SQL查询方式来分析存储在Hadoop分布式文件系统中的数据，可以将结构化的数据文件映射为一张数据库表，并提供完整的SQL查询功能，可以将SQL语句转换为MapReduce任务进行运行，通过自己的SQL去查询分析需要的内容，这套SQL简称Hive SQL，使不熟悉MapReduce用户很方便地利用SQL语言查询、汇总、分析数据。

1. 解压

tar -zxvf hive-0.9.0.tar.gz -C /home/hadoop/app

2. 配置mysql metastore（切换到root用户）

安装MySQL



##rpm包安装

rpm -ivh MySQL-server-5.1.73-1.glibc23.i386.rpm

rpm -ivh MySQL-client-5.1.73-1.glibc23.i386.rpm

##若安装过程出现依赖库冲突，按照以下步骤解决（以冲突库mysql-libs-5.1.66-2.el6_3.i686为例）

##解决依赖包冲突

##查出冲突库

rpm -qa | grep mysql

##删除冲突库

rpm -e mysql-libs-5.1.66-2.el6_3.i686 --nodeps

修改MySQL密码

执行/usr/bin/mysql_secure_installation

（注意：删除匿名用户，允许用户远程连接）

进行登录

3. 配置hive

复制`hive-default.xml.template`文件并改名为 `hive-site.xml`，删除`hive-site.xml`所有内容，并添加如下内容：

<!-- 指定连接数据库hive，不存在则创建 -->

<property>

     <name>javax.jdo.option.ConnectionURL</name>

     <value>jdbc:mysql://master:3306/hive?createDatabaseIfNotExist=true</value>

     <description>JDBC connect string for a JDBC metastore</description>

   </property>

<!-- 指定数据库驱动 -->

   <property>

     <name>javax.jdo.option.ConnectionDriverName</name>

     <value>com.mysql.jdbc.Driver</value>

     <description>Driver class name for a JDBC metastore</description>

   </property>

<!-- 指定数据库用户名 -->

   <property>

     <name>javax.jdo.option.ConnectionUserName</name>

     <value>root</value>

     <description>username to use against metastore database</description>

   </property>

<!-- 指定数据库密码 -->

   <property>

     <name>javax.jdo.option.ConnectionPassword</name>

     <value>root</value>

     <description>password to use against metastore database</description>

   </property>

4. 安装hive和mysq完成后，将MySQL的连接jar包拷贝到$HIVE_HOME/lib目录下

如果出现没有权限的问题，在MySQL授权(在安装mysql的机器上执行)

## 使用root登录mysql

mysql -u root

##赋予所有表上的权限给root用户，*.*表示所有库下的所有表,%表示所有的主机都可以访问，密码是root

GRANT ALL PRIVILEGES ON *.* TO 'root'@'%' IDENTIFIED BY 'root' WITH GRANT OPTION;

FLUSH PRIVILEGES;

##或者

grant all on *.* to root@'主机名' identified by 'root';

5. 建表

Hive中的一张表对应HDFS上的一个文件夹，一个分区对应文件中的子文件夹，外部表只是指向某一文件数据，删除外部表不会删除文件。

启动hive

在hive安装目录的bin目录下执行./hive
默认是内部表

 #创建数据库

 CREATE DATABASE test;

 #选择刚创建的数据库

 USE test;

 #创建表

CREATE TABLE IF NOT EXISTS control_20180815(ordertime STRING, userid STRING, songIndex INT, songid STRING, presource INT)

ROW FORMAT DELIMITED FIELDS TERMINATED BY '\|'

LINES TERMINATED BY '\n';

#载入数据

#将本地数据文件装载刚创建的表

#本地数据文件里的数据格式要符合hive表创建时的描述，上面创建时字段分隔符为|，行分隔符为\n

LOAD DATA LOCAL INPATH '/home/lmh/testModel/control-20180815' OVERWRITE INTO TABLE control_20180815;

#将表格数据导出到本地

#可以自定义导出时的字段分隔符和行分割符

insert overwrite local directory '/home/lmh/testModel/myexpofen-20180815'

row format delimited fields terminated by '|'

select * from myexpofen_20180815;

建分区表

create table td_part(id bigint, account string, income double, expenses double, time string) partitioned by (logdate string) row format delimited fields terminated by '\t';

建外部表

create external table td_ext(id bigint, account string, income double, expenses double, time string) row format delimited fields terminated by '\t' location '/td_ext';

6. 创建分区表

普通表和分区表区别：有大量数据增加的需要建分区表

create table book (id bigint, name string) partitioned by (pubdate string) row format delimited fields terminated by '\t';

分区表加载数据

##将文本文件book.txt导入book表中

load data local inpath './book.txt' overwrite into table book partition (pubdate='2010-08-22');

load data local inpath '/root/data.am' into table beauty partition (nation="USA");

select nation, avg(size) from beauties group by nation order by avg(size);

Hive的安装和建表的更多相关文章

centos7下oracle11g详细的安装与建表操作
一.oracle的安装,在官网下载oracle11g R2 1.在桌面单击右键,选择“在终端中打开”,进入终端输入命令:su 输入ROOT密码: 创建用户组oinstall:groupadd oin ...
大数据学习day26----hive01----1hive的简介 2 hive的安装（hive的两种连接方式，后台启动，标准输出，错误输出）3. 数据库的基本操作 4. 建表（内部表和外部表的创建以及应用场景，数据导入，学生、分数sql练习）5.分区表 6加载数据的方式
1. hive的简介(具体见文档) Hive是分析处理结构化数据的工具本质:将hive sql转化成MapReduce程序或者spark程序 Hive处理的数据一般存储在HDFS上,其分析数据底 ...
Vertica 安装，建库，新建测试用户并授予权限，建表，入库
测试环境:RHEL 6.4 + Vertica 6.1.3-7 需求:搭建Vertica数据库3节点的测试环境,建立测试用户,建表,测试数据入库. 1.各节点关闭防火墙和SELinux,配置主机名,I ...
hive建表与数据的导入导出
建表: create EXTERNAL table tabtext(IMSI string,MDN string,MEID string,NAI string,DestinationIP string ...
hive查看建表语句
查看hive建表语句:show create table tablename; 查看hive表结构:describe tablename; 简写:desc tablename;
Mac下安装MySQL、Workbench以及建数据库建表最基础操作
刚用上Mac,什么都不懂,加之以前还没有用过mysql,就想着在Mac上装一个mysql来自己玩,奈何,在网上找了大半天,没有一个干货!愤怒!下面是我安装的过程,希望能帮到和我情况差不多的朋友首 ...
批量导出hive表的建表语句
转的这里的首先先导出所有的table表 hive -e "use xxxdb;show tables;" > tables.txt 然后再使用hive内置语法导出hive表 ...
[Hive_3] Hive 建表指定分隔符
0. 说明 Hive 建表示例及指定分隔符 1. Hive 建表 Demo 在 Hive 中输入以下命令创建表 user2 create table users2 (id int, name stri ...
Hive学习笔记——安装和内部表CRUD
1.首先需要安装Hadoop和Hive 安装的时候参考 http://blog.csdn.net/jdplus/article/details/46493553 安装的版本是apache-hive-2 ...

随机推荐

EPANET头文件解读系列7——MEMPOOL.H
//EPANET应用程序使用了大量的节点与管段数据,而且每个对象数据又有不同时段的数据,这些数据占用了大量内存,而mempool.h就是一个简单快速的内存分配相关的头文件/*** mempool.h ...
简单了解json以及使用google json 2.2
json简介: JSON: JavaScript对象表示法(JavaScript Object Notation) JSON是存储和交换信息的语法. JSON是轻量级的文本交互格式 JSON独立于语言 ...
eclipse 编码设置【转】
一般Java文件编码格式是UTF-8的.以下以默认GBK改为UTF-8为例. 1.改变整个工作空间的编码格式,这样以后新建的文件也是新设置的编码格式. eclipse->window->p ...
win32程序显示网页
说是win32,实际程序中使用了atl的东西.所以新建win32程序时,记得勾选使用atl: 代码如下: #include "stdafx.h" #include "Wi ...
在Linux中批量修改字符串的命令
昨天一个朋友忽然问我,在Linux下如何批量修改字符串,当时瞬间懵逼了,完全想不起来....... 今天特意的重温了一下Linux下的一些常用命令,并将这个遗忘的批量修改字符串的命令记录下来(资料来自 ...
DesignPattern（五）行为型模式（上）
行为型模式行为型模式是对在不同对象之间划分责任和算法的抽象化.行为模式不仅仅关于类和对象,还关于它们之间的相互作用.行为型模式又分为类的行为模式和对象的行为模式两种. 类的行为模式——使用继承关系在 ...
hibernate映射对象三种状态的分析
一,首先hibernate中对象的状态有三种:瞬态.游离态和持久态,三种状态转化的方法都是通过session来调用,瞬态到持久态的方法有save().saveOrUpdate(). get().lo ...
Linux内核静态映射表的建立过程
/* * 平台: s5pv210 * 内核版本号: 2.6.35.7 */ kernel/arch/arm/mach-s5pv210/mach-smdkc110.c 这个文件是由三星在 ...
python functiontools 模块
一个内置的模块. 作用是实现了更多的功能, 同时形式上显得很简洁. 虽然在使用很方便, 但其中的原理还是很难复杂的. ------------------------------------- ...
sourcetree回退到历史节点
1. 原理原理,我们都知道Git是基于Git树进行管理的,要想要回滚必须做到如下2点: 本地头节点与远端头节点一样(Git提交代码的前提条件):于本地头节点获取某次历史节点的更改.说的有点抽象,以图 ...

Hive的安装和建表

认识Hive

1. 解压

2. 配置mysql metastore（切换到root用户）

安装MySQL

修改MySQL密码

进行登录

3. 配置hive

复制hive-default.xml.template文件并改名为 hive-site.xml，删除hive-site.xml所有内容，并添加如下内容：

4. 安装hive和mysq完成后，将MySQL的连接jar包拷贝到$HIVE_HOME/lib目录下

5. 建表

启动hive

默认是内部表

建分区表

建外部表

6. 创建分区表

普通表和分区表区别：有大量数据增加的需要建分区表

分区表加载数据

Hive的安装和建表的更多相关文章

随机推荐

热门专题

复制`hive-default.xml.template`文件并改名为 `hive-site.xml`，删除`hive-site.xml`所有内容，并添加如下内容：