Apache Hive 建表操作的简单描述

客户端连接hive

[root@bigdata-02 bin]# ./beeline

Beeline version 1.2.1 by Apache Hive

beeline> ! connect jdbc:hive2://bigdata-01:10000

Connecting to jdbc:hive2://bigdata-01:10000

Enter username for jdbc:hive2://bigdata-01:10000: root

Enter password for jdbc:hive2://bigdata-01:10000: ******

Connected to: Apache Hive (version 1.2.1)

Driver: Hive JDBC (version 1.2.1)

Transaction isolation: TRANSACTION_REPEAtable_READ

0: jdbc:hive2://bigdata-01:10000>

create database hive_test;

show databases;

use hive_test;

创建表

create table t_a1(id int,name string) row format delimited fields terminated by ',';

加载数据  如果在本地加local  如果不在本地 不加local   load data只针对内部表

load data local inpath '/root/1.txt' into table t_a1

hadoop fs -put 1.txt /user/hive/warehouse/hive_test.db/t_a1  

1.txt

1,张学友

2,刘德华

3,黎明

4,郭富城

0: jdbc:hive2://bigdata-01:10000> select * from t_a1;

+----------+------------+--+

| t_a1.id  | t_a1.name  |

+----------+------------+--+

| 1        | 张学友        |

| 2        | 刘德华        |

| 3        | 黎明         |

| 4        | 郭富城        |

+----------+------------+--+

4 rows selected (1.358 seconds)

//创建外部表

create external table t_a2(id int,name string) row format delimited fields terminated by ',' location '/test/';

hadoop fs -mkdir /test

hadoop fs -put 1.txt /test

0: jdbc:hive2://bigdata-01:10000> select * from t_a2;

+----------+------------+--+

| t_a2.id  | t_a2.name  |

+----------+------------+--+

| 1        | 张学友        |

| 2        | 刘德华        |

| 3        | 黎明         |

| 4        | 郭富城        |

+----------+------------+--+

4 rows selected (0.638 seconds)

区别

内部表的数据文件必须放到 指定的位置

外部表的数据文件 可以自己指定位置

外部表 drop table t_a2 后 数据文件依然存在 内部表 直接连表带数据文件一起删除

//分区表

create table t_user(id int,name string,area string) partitioned by(region string) row format delimited fields terminated by ',';

//加载数据

 load data local inpath '/root/beijing.txt' into table t_user partition(region='beijing');

 load data local inpath '/root/shanghai.txt' into table t_user partition(region='shanghai');

0: jdbc:hive2://bigdata-01:10000> select * from t_user;

+----------+------------+------------+--------------+--+

| t_user.id  | t_user.name  | t_user.area  | t_user.region  |

+----------+------------+------------+--------------+--+

| 1        | 张学友        | 北京         | beijing      |

| 2        | 刘德华        | 北京         | beijing      |

| 3        | 黎明         | 北京         | beijing      |

| 4        | 郭富城        | 北京         | beijing      |

| 5        | 诸葛亮        | 上海         | shanghai     |

| 6        | 司马懿        | 上海         | shanghai     |

| 7        | 周瑜         | 上海         | shanghai     |

+----------+------------+------------+--------------+--+

7 rows selected (0.445 seconds)

//多分区

create table day_hour_table (id int, content string) partitioned by (dt string, hour string);

load data local inpath '/root/900101_08.txt' into table day_hour_table PARTITION(dt='1990-01-01', hour='');

//分桶表

开启分桶功能：set hive.enforce.bucketing = true;

设置reduce个数等于分桶的个数：set mapreduce.job.reduces=4;

创建表

create table stu_buck(Sno int,Sname string,Sex string,Sage int,Sdept string) clustered by(Sno) into 4 buckets row format delimited fields terminated by ',';

加载方式:

1,首先创建一个普通的过渡中间表 把对应的文件映射上去

create table student(Sno int,Sname string,Sex string,Sage int,Sdept string) row format delimited fields terminated by ',';

hadoop fs -put students.txt /user/hive/warehouse/hive_test.db/student

2,真正映射分桶表(insert+select)

insert overwrite table stu_buck select * from student cluster by(Sno);

测试的时候可以设置本地模式

set hive.exec.mode.local.auto=true;

Apache Hive 建表操作的简单描述的更多相关文章

[Hive_3] Hive 建表指定分隔符
0. 说明 Hive 建表示例及指定分隔符 1. Hive 建表 Demo 在 Hive 中输入以下命令创建表 user2 create table users2 (id int, name stri ...
Hive与表操作有关的语句
Hive与表操作有关的语句 1.创建表的语句: Create [EXTERNAL] TABLE [IF NOT EXISTS] table_name [(col_name data_type [COM ...
hive建表与数据的导入导出
建表: create EXTERNAL table tabtext(IMSI string,MDN string,MEID string,NAI string,DestinationIP string ...
hive建表没使用LZO存储格式，可是数据是LZO格式时遇到的问题
今天微博大数据平台发邮件来说.他们有一个hql执行失败.可是从gateway上面的日志看不出来是什么原因导致的,我帮忙看了一下.最后找到了问题的解决办法,下面是分析过程: 1.执行失败的hql: IN ...
Oracle 自动生成hive建表语句
从 oracle 数据库导数到到 hive 大数据平台,需要按照大数据平台的数据规范,重新生成建表的 SQL 语句,方便其间,写了一个自动生成SQL的存储过程. ① 创建一张表,用来存储源表的结构,以 ...
CDH集群部署hive建表中文乱码
背景:部署CDH集群的 hive 服务,选用 mysql 作为 hive 元数据的存储数据库,通过 hive cli 建表时发现中文注释均乱码. 现象:hive端建表中文注释乱码. 定位: 已经确认过 ...
利用MySQL原数据信息批量转换指定库数据表生成Hive建表语句
1.写出文件工具类 package ccc.utile; import java.io.*; /** * @author ccc * @version 1.0.0 * @ClassName Write ...
hive建表范例
建表范例:支持update和delete create table aaa( id string, visitor_name string ) clustered by(id) into bucket ...
Hive建表和内外部表的使用
原文链接: https://www.toutiao.com/i6766784274965201415 一.普通建表方式 create table stu_info( id int, name stri ...

随机推荐

lzugis—搭建属于自己的小型的版本控制SVN
对于不了解SVN的同志们可以参考下"mh942408056"的这篇博文,SVN简介,链接地址为:http://blog.csdn.net/mh942408056/article/d ...
canvas 绘制环形进度条
结果: 代码: <!DOCTYPE html> <html> <head lang="en"> <meta charset="U ...
I.MX6 网卡能收不能发
/******************************************************************** * I.MX6 网卡能收不能发 * 说明: * MAC控制器 ...
使用wsgiref库diy简单web架构
1. 了解CGI和WSGI (1)CGI CGI(Common Gateway Interface)通用网关接口,即接口协议,前端向服务器发送一个URL(携带请求类型.参数.cookie等信息)请求, ...
jstl错误排除:According to TLD or attribute directive in tag file, attribute value does not accept any expressions
问题描述: 在 JSP 页面中使用 JSTL 标签库,访问 JSP 页面时抛出了如下异常信息: org.apache.jasper.JasperException: /index.jsp (line: ...
Microsoft Office 2013 (64位) 免费完整版（安装 + 激活）
Microsoft Office 2013(Office 15)是微软的新一代Office办公软件,全面采用Metro界面.Microsoft Office 2013官方下载(Office2013专业 ...
kali视频（26-30）学习
第七周 kali视频(26-30)学习 26.KaliSecurity漏洞利用之检索与利用 27.KaliSecurity漏洞利用之Metasploit基础 28.KaliSecurity漏洞利用之M ...
dynamic_caast操作符
dynamic_caast操作符,将基类的指针或引用安全的转换为派生类的指针或引用. 原理: 将一个基类对象指针或引用抛到继承类指针,dynamic_cast会根据基类指针是否真正指向继承类指针来做相 ...
javascript的八张思维导图
出处:http://www.cnblogs.com/junhey/p/4292683.html
Codeforces Round #320 (Div. 1) [Bayan Thanks-Round] B. "Or" Game
题目链接:http://codeforces.com/contest/578/problem/B 题目大意:现在有n个数,你可以对其进行k此操作,每次操作可以选择其中的任意一个数对其进行乘以x的操作. ...

Apache Hive 建表操作的简单描述

Apache Hive 建表操作的简单描述的更多相关文章

随机推荐

热门专题