原文链接:

https://www.toutiao.com/i6766784274965201415

一、普通建表方式

create table stu_info(

id int,

name string

)ROW FORMAT DELIMITED FIELDS TERMINATED BY ' '

载入数据

load data local inpath '/data/hivetest/stu_info_local' into table stu_info;

load data inpath '/data/hivetest/stu_info_local' into table stu_info;

另外的方式

官网

二、子查询方式建表

我们练习下

创建一个练习库

创建一个普通表

create table normal(

id int,

name string

)ROW FORMAT DELIMITED FIELDS TERMINATED BY ' '

我们装载数据

load data local inpath '/data/hivetest/stu_info_two' into table normal;

我们看数据是存在的

我们利用子查询生成新表

create table normal_zcx_t as select * from normal;

实际在跑MapReduce

我们查看表和数据

我们可以看到元数据也存在

表结构也一样

我们再看下HDFS

所以子查询将查询的数据和表的结构赋予一张新的表

三、Like建表

我们建表

create table normal_like_t like normal;

只有表结构,没有数据,但是相对于子查询没有MapReduce执行,速度会快很多。

元数据和HDFS都有

四、数据共享

我们重新创建一个数据库

创建员工表

创建部门表

导入数据

我们创建表引用另外一个表的文件,比如引入我们的dept表的文件

可以看到表

元数据也有

数据也有

我们把dept_yr数据清空,会发现dept的数据竟然也没有了

那我们重新加载数据呢?

这时候我们明白了,它俩在一起关联的,添加和清除在一起。

如果删除的话 drop table dept_yr;数据还是清空

所以这种方式建表,他们是互相影响的。

数据共享一份数据,删除的时候就把共享的数据删除

删除表也会把元数据数据删除,清除HDFS上的文件

建表中,这有两个关键字

如果我们不加这两个关键字,表默认是管理表

我们先看TEMPORARY

我们创建

我们导入数据

去查询元数据,发现没有信息

用desc formatted查看,信息是有的

我们看其中的数据存放路径

查看一下HDFS

这就是临时表的一些特点

如果关闭的话,就会自动删除临时表,也可以手动删除,常作为临时结果使用。

如果用location+temporary共享数据会发生什么呢?可以做个练习。(1)关闭客户端对原始数据的影响?(2)删除临时表对原始数据的影响?(3)如果是清空临时表呢?

我们创建EXTERNAL表

我们看元数据

Formatted

我们再dept中加载数据

发现数据在外部表也是有的

如果我们清空外部表,就会报错

FAILED: SemanticException [Error 10146]: Cannot truncate non-managed table dept_ext.

那我们删除外部表呢?不会对原始数据产生影响

元数据也没了

练习:如果不使用location,直接创建的话,删除表会怎么样?

总结:删除表时,内部表元数据和数据一起删除,而外部表只删除元数据,不会删除数据,以及HDFS上表对应的目录及文件都不会删除。

Hive建表和内外部表的使用的更多相关文章

  1. [Hive_3] Hive 建表指定分隔符

    0. 说明 Hive 建表示例及指定分隔符 1. Hive 建表 Demo 在 Hive 中输入以下命令创建表 user2 create table users2 (id int, name stri ...

  2. hive,分桶,内外部表,分区

    简单的word-count操作: [root@master test-map]# head -10 The_Man_of_Property.txt    #先看看数据Preface“The Forsy ...

  3. CDH集群部署hive建表中文乱码

    背景:部署CDH集群的 hive 服务,选用 mysql 作为 hive 元数据的存储数据库,通过 hive cli 建表时发现中文注释均乱码. 现象:hive端建表中文注释乱码. 定位: 已经确认过 ...

  4. 利用MySQL原数据信息批量转换指定库数据表生成Hive建表语句

    1.写出文件工具类 package ccc.utile; import java.io.*; /** * @author ccc * @version 1.0.0 * @ClassName Write ...

  5. 大数据学习day26----hive01----1hive的简介 2 hive的安装(hive的两种连接方式,后台启动,标准输出,错误输出)3. 数据库的基本操作 4. 建表(内部表和外部表的创建以及应用场景,数据导入,学生、分数sql练习)5.分区表 6加载数据的方式

    1. hive的简介(具体见文档) Hive是分析处理结构化数据的工具   本质:将hive sql转化成MapReduce程序或者spark程序 Hive处理的数据一般存储在HDFS上,其分析数据底 ...

  6. hive内部表、外部表、分区表、视图

    1.Table 内部表 1).与数据库中的Table在概念上是类似的 2).每一个Table在Hive中都有一个相应的目录存储数据 3).所有的Table数据(不包括 External Table) ...

  7. Hive通过查询语句向表中插入数据注意事项

    最近在学习使用Hive(版本0.13.1)的过程中,发现了一些坑,它们或许是Hive提倡的比关系数据库更加自由的体现(同时引来一些问题),或许是一些bug.总而言之,这些都需要使用Hive的开发人员额 ...

  8. 039 hive中关于数据库与表等的基本操作

    一:基本用法 1.新建数据库 2.删除数据库 3.删除非空的数据库 4.指定数据库的位置 LOCATION:指定数据库的位置,不会在系统的默认文件下. 5.在指定数据库中新建表(验证在指定的数据库中可 ...

  9. Hive创建内部表、外部表

    使用hive需要hive环境 启动Hive 进入HIVE_HOME/bin,启动hive ./hive 内部表 建表 hive> create table fz > (id int,nam ...

随机推荐

  1. Java知识点总结——IO流框架

    IO框架 一.流的概念 概念:内存与存储设备之间传输数据的通道. 二.流的分类 按方向分类: 输入流:将<存储设备>中的内容读入到<内存>中 输出流:将<内存>中的 ...

  2. Mysql资料 主键

    目录 一.简介 二.操作 三.技巧 一.简介 主键意味着表中每一行都应该有可以唯一标识自己的一列(或一组列). 一个顾客可以使用顾客编号列,而订单可以使用订单ID,雇员可以使用雇员ID 或 雇员社会保 ...

  3. Tableau如何绘制瀑布图

    一.将子类别拖至列,利润拖拽至行,类型改为甘特条形图 二 右键利润-快速表计算-汇总(数据会从左向右显示累计汇总) 三.创建计算字段-[利润] 四.将负利润拖拽到大小,利润拖拽到颜色 分析-合计-显示 ...

  4. CF701A Cards 题解

    Content 有一个长度为 \(n\) 的数组 \(a_1,a_2,a_3,...,a_n\),试在其中找到 \(\dfrac{n}{2}\) 对数,使得每个数对的元素的和都相等. 数据范围:\(2 ...

  5. AT2287 [ARC067B] Walk and Teleport 题解

    Content 一条直线上有 \(n\) 个城市,第 \(i\) 个城市的坐标为 \(x_i\).你在某一个城市内,每一次你可以按两种方式之一进行移动: 左右移动,每移动一个单位疲劳值增加 \(a\) ...

  6. IDEA安装vue.js插件后,new没有Vue component

    首先要安装vue相关的插件vue.js 但是很多人安装vue.js右键发现没有vue Componment,解决方法如下 Settings>Editor>File and Code Tem ...

  7. 【LeetCode】21. Merge Two Sorted Lists 合并两个有序链表

    作者: 负雪明烛 id: fuxuemingzhu 个人博客:http://fuxuemingzhu.cn/ 个人公众号:负雪明烛 本文关键词:合并,有序链表,递归,迭代,题解,leetcode, 力 ...

  8. 【LeetCode】717. 1-bit and 2-bit Characters 解题报告(Python)

    作者: 负雪明烛 id: fuxuemingzhu 个人博客: http://fuxuemingzhu.cn/ 目录 题目描述 题目大意 解题方法 遍历 日期 题目地址:https://leetcod ...

  9. [LeetCode]621. Task Scheduler 任务安排 题解

    题目描述 给定一个char数组,代表CPU需要做的任务,包含A-Z,不用考虑顺序,每个任务能在1个单位完成.但是有规定一个非负整数n代表两个相同任务之间需要至少n个时间单位.球最少数量的时间单位完成所 ...

  10. Fibonacci String(hdu 1708)

    Fibonacci String Time Limit: 3000/1000 MS (Java/Others)    Memory Limit: 32768/32768 K (Java/Others) ...