2.7-2.8 导入、导出数据(进/出)hive表的方式

一、导入数据进hive表

1、语法

LOAD DATA [LOCAL] INPATH 'filepath'

[OVERWRITE] INTO TABLE tablename

[PARTITION (partcol1=val1,partcol2=val2...)]

##

* 原始文件的存储位置

    *在本地要写local

    *在HDFS不用写local

* ‘filepath’ 文件路径要加引号

* 对表的数据是否覆盖

    * 覆盖要写overwrite

    * 追加不写overwrite

* 分区表要写partition

2、加载本地数据进hive表

load data local inpath '/opt/datas/emp. txt' into table default. emp;

3、加载hdfs文件到hive中

#hdfs上的数据

hive (default)> dfs -ls -R /user/root/hive/datas;

-rw-r--r--   1 root supergroup        659 2019-04-23 11:23 /user/root/hive/datas/emp.txt

#emp表中现在有14条数据

hive (default)> select * from emp;

OK

emp.empno    emp.ename    emp.job    emp.mgr    emp.hiredate    emp.sal    emp.comm    emp.deptno

7369    SMITH    CLERK    7902    1980-12-17    800.0    NULL    20

7499    ALLEN    SALESMAN    7698    1981-2-20    1600.0    300.0    30

7521    WARD    SALESMAN    7698    1981-2-22    1250.0    500.0    30

7566    JONES    MANAGER    7839    1981-4-2    2975.0    NULL    20

7654    MARTIN    SALESMAN    7698    1981-9-28    1250.0    1400.0    30

7698    BLAKE    MANAGER    7839    1981-5-1    2850.0    NULL    30

7782    CLARK    MANAGER    7839    1981-6-9    2450.0    NULL    10

7788    SCOTT    ANALYST    7566    1987-4-19    3000.0    NULL    20

7839    KING    PRESIDENT    NULL    1981-11-17    5000.0    NULL    10

7844    TURNER    SALESMAN    7698    1981-9-8    1500.0    0.0    30

7876    ADAMS    CLERK    7788    1987-5-23    1100.0    NULL    20

7900    JAMES    CLERK    7698    1981-12-3    950.0    NULL    30

7902    FORD    ANALYST    7566    1981-12-3    3000.0    NULL    20

7934    MILLER    CLERK    7782    1982-1-23    1300.0    NULL    10

Time taken: 0.606 seconds, Fetched: 14 row(s)

#将hdfs上的数据加载到emp表中，加载到hive表后，hdfs上的数据会被删除

hive (default)> load data inpath '/user/root/hive/datas/emp.txt' into table default.emp;

Loading data to table default.emp

Table default.emp stats: [numFiles=2, numRows=0, totalSize=1318, rawDataSize=0]

OK

Time taken: 0.228 seconds

#emp表中的数据增加到了28条

hive (default)> select * from emp;

OK

emp.empno    emp.ename    emp.job    emp.mgr    emp.hiredate    emp.sal    emp.comm    emp.deptno

7369    SMITH    CLERK    7902    1980-12-17    800.0    NULL    20

7499    ALLEN    SALESMAN    7698    1981-2-20    1600.0    300.0    30

7521    WARD    SALESMAN    7698    1981-2-22    1250.0    500.0    30

7566    JONES    MANAGER    7839    1981-4-2    2975.0    NULL    20

7654    MARTIN    SALESMAN    7698    1981-9-28    1250.0    1400.0    30

7698    BLAKE    MANAGER    7839    1981-5-1    2850.0    NULL    30

7782    CLARK    MANAGER    7839    1981-6-9    2450.0    NULL    10

7788    SCOTT    ANALYST    7566    1987-4-19    3000.0    NULL    20

7839    KING    PRESIDENT    NULL    1981-11-17    5000.0    NULL    10

7844    TURNER    SALESMAN    7698    1981-9-8    1500.0    0.0    30

7876    ADAMS    CLERK    7788    1987-5-23    1100.0    NULL    20

7900    JAMES    CLERK    7698    1981-12-3    950.0    NULL    30

7902    FORD    ANALYST    7566    1981-12-3    3000.0    NULL    20

7934    MILLER    CLERK    7782    1982-1-23    1300.0    NULL    10

7369    SMITH    CLERK    7902    1980-12-17    800.0    NULL    20

7499    ALLEN    SALESMAN    7698    1981-2-20    1600.0    300.0    30

7521    WARD    SALESMAN    7698    1981-2-22    1250.0    500.0    30

7566    JONES    MANAGER    7839    1981-4-2    2975.0    NULL    20

7654    MARTIN    SALESMAN    7698    1981-9-28    1250.0    1400.0    30

7698    BLAKE    MANAGER    7839    1981-5-1    2850.0    NULL    30

7782    CLARK    MANAGER    7839    1981-6-9    2450.0    NULL    10

7788    SCOTT    ANALYST    7566    1987-4-19    3000.0    NULL    20

7839    KING    PRESIDENT    NULL    1981-11-17    5000.0    NULL    10

7844    TURNER    SALESMAN    7698    1981-9-8    1500.0    0.0    30

7876    ADAMS    CLERK    7788    1987-5-23    1100.0    NULL    20

7900    JAMES    CLERK    7698    1981-12-3    950.0    NULL    30

7902    FORD    ANALYST    7566    1981-12-3    3000.0    NULL    20

7934    MILLER    CLERK    7782    1982-1-23    1300.0    NULL    10

Time taken: 0.033 seconds, Fetched: 28 row(s)

4、加载数据覆盖表中已有的数据

#重新加载到hdfs，因为刚才的数据加载到hdfs后已被删除

hive (default)> dfs -put /opt/datas/emp.txt /user/root/hive/datas;   

#覆盖加载金hive表

hive (default)> load data inpath '/user/root/hive/datas/emp.txt' overwrite into table default.emp;

Loading data to table default.emp

rmr: DEPRECATED: Please use 'rm -r' instead.

Moved: 'hdfs://hadoop-senior.ibeifeng.com:8020/user/hive/warehouse/emp' to trash at: hdfs://hadoop-senior.ibeifeng.com:8020/user/root/.Trash/Current

Table default.emp stats: [numFiles=1, numRows=0, totalSize=659, rawDataSize=0]

OK

Time taken: 0.192 seconds

#此时emp中只有14条数据，刚才此表中有28条数据

hive (default)> select * from emp;

OK

emp.empno    emp.ename    emp.job    emp.mgr    emp.hiredate    emp.sal    emp.comm    emp.deptno

7369    SMITH    CLERK    7902    1980-12-17    800.0    NULL    20

7499    ALLEN    SALESMAN    7698    1981-2-20    1600.0    300.0    30

7521    WARD    SALESMAN    7698    1981-2-22    1250.0    500.0    30

7566    JONES    MANAGER    7839    1981-4-2    2975.0    NULL    20

7654    MARTIN    SALESMAN    7698    1981-9-28    1250.0    1400.0    30

7698    BLAKE    MANAGER    7839    1981-5-1    2850.0    NULL    30

7782    CLARK    MANAGER    7839    1981-6-9    2450.0    NULL    10

7788    SCOTT    ANALYST    7566    1987-4-19    3000.0    NULL    20

7839    KING    PRESIDENT    NULL    1981-11-17    5000.0    NULL    10

7844    TURNER    SALESMAN    7698    1981-9-8    1500.0    0.0    30

7876    ADAMS    CLERK    7788    1987-5-23    1100.0    NULL    20

7900    JAMES    CLERK    7698    1981-12-3    950.0    NULL    30

7902    FORD    ANALYST    7566    1981-12-3    3000.0    NULL    20

7934    MILLER    CLERK    7782    1982-1-23    1300.0    NULL    10

Time taken: 0.036 seconds, Fetched: 14 row(s)

5、创建表是通过insert加载

##

hive (default)> create table default.emp_ci like emp;

OK

Time taken: 0.092 seconds

hive (default)> select * from emp_ci;

OK

emp_ci.empno    emp_ci.ename    emp_ci.job    emp_ci.mgr    emp_ci.hiredate    emp_ci.sal    emp_ci.comm    emp_ci.deptno

Time taken: 0.034 seconds

##

hive (default)> insert into table default.emp_ci select * from default.emp;

hive (default)> select * from emp_ci;

OK

emp_ci.empno    emp_ci.ename    emp_ci.job    emp_ci.mgr    emp_ci.hiredate    emp_ci.sal    emp_ci.comm    emp_ci.deptno

7369    SMITH    CLERK    7902    1980-12-17    800.0    NULL    20

7499    ALLEN    SALESMAN    7698    1981-2-20    1600.0    300.0    30

7521    WARD    SALESMAN    7698    1981-2-22    1250.0    500.0    30

7566    JONES    MANAGER    7839    1981-4-2    2975.0    NULL    20

7654    MARTIN    SALESMAN    7698    1981-9-28    1250.0    1400.0    30

7698    BLAKE    MANAGER    7839    1981-5-1    2850.0    NULL    30

7782    CLARK    MANAGER    7839    1981-6-9    2450.0    NULL    10

7788    SCOTT    ANALYST    7566    1987-4-19    3000.0    NULL    20

7839    KING    PRESIDENT    NULL    1981-11-17    5000.0    NULL    10

7844    TURNER    SALESMAN    7698    1981-9-8    1500.0    0.0    30

7876    ADAMS    CLERK    7788    1987-5-23    1100.0    NULL    20

7900    JAMES    CLERK    7698    1981-12-3    950.0    NULL    30

7902    FORD    ANALYST    7566    1981-12-3    3000.0    NULL    20

7934    MILLER    CLERK    7782    1982-1-23    1300.0    NULL    10

Time taken: 0.028 seconds, Fetched: 14 row(s)

6、创建表的时候通过location指定加载

二、导出hive表数据

1、导出到本地

#将查询结果插入到本地，本地目录会自动创建

hive (default)> insert overwrite local directory '/opt/datas/hive_exp_emp'

              > ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' COLLECTION ITEMS TERMINATED BY '/n'

              > select * from default.emp;

ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t'    #列之间的分隔符

COLLECTION ITEMS TERMINATED BY '/n'        #行之间的分隔符

[root@hadoop-senior modules]# cat /opt/datas/hive_exp_emp/000000_0

7369    SMITH    CLERK    7902    1980-12-17    800.0    \N    20

7499    ALLEN    SALESMAN    7698    1981-2-20    1600.0    300.0    30

7521    WARD    SALESMAN    7698    1981-2-22    1250.0    500.0    30

7566    JONES    MANAGER    7839    1981-4-2    2975.0    \N    20

7654    MARTIN    SALESMAN    7698    1981-9-28    1250.0    1400.0    30

7698    BLAKE    MANAGER    7839    1981-5-1    2850.0    \N    30

7782    CLARK    MANAGER    7839    1981-6-9    2450.0    \N    10

7788    SCOTT    ANALYST    7566    1987-4-19    3000.0    \N    20

7839    KING    PRESIDENT    \N    1981-11-17    5000.0    \N    10

7844    TURNER    SALESMAN    7698    1981-9-8    1500.0    0.0    30

7876    ADAMS    CLERK    7788    1987-5-23    1100.0    \N    20

7900    JAMES    CLERK    7698    1981-12-3    950.0    \N    30

7902    FORD    ANALYST    7566    1981-12-3    3000.0    \N    20

7934    MILLER    CLERK    7782    1982-1-23    1300.0    \N    10

2、查询输出到文件

##

[root@hadoop-senior hive-0.13.1]# bin/hive -e "select * from default.emp;" >/opt/datas/exp_res.txt

Logging initialized using configuration in file:/opt/modules/hive-0.13.1/conf/hive-log4j.properties

OK

Time taken: 0.837 seconds, Fetched: 14 row(s)

[root@hadoop-senior hive-0.13.1]# cat /opt/datas/exp_res.txt

emp.empno    emp.ename    emp.job    emp.mgr    emp.hiredate    emp.sal    emp.comm    emp.deptno

7369    SMITH    CLERK    7902    1980-12-17    800.0    NULL    20

7499    ALLEN    SALESMAN    7698    1981-2-20    1600.0    300.0    30

7521    WARD    SALESMAN    7698    1981-2-22    1250.0    500.0    30

7566    JONES    MANAGER    7839    1981-4-2    2975.0    NULL    20

7654    MARTIN    SALESMAN    7698    1981-9-28    1250.0    1400.0    30

7698    BLAKE    MANAGER    7839    1981-5-1    2850.0    NULL    30

7782    CLARK    MANAGER    7839    1981-6-9    2450.0    NULL    10

7788    SCOTT    ANALYST    7566    1987-4-19    3000.0    NULL    20

7839    KING    PRESIDENT    NULL    1981-11-17    5000.0    NULL    10

7844    TURNER    SALESMAN    7698    1981-9-8    1500.0    0.0    30

7876    ADAMS    CLERK    7788    1987-5-23    1100.0    NULL    20

7900    JAMES    CLERK    7698    1981-12-3    950.0    NULL    30

7902    FORD    ANALYST    7566    1981-12-3    3000.0    NULL    20

7934    MILLER    CLERK    7782    1982-1-23    1300.0    NULL    10

3、导出到HDFS上

##

hive (default)> insert overwrite directory '/user/root/hive/hive_exp_emp'

              > select * from default.emp;

##

hive (default)> dfs -ls -R /user/root/hive/hive_exp_emp;

-rw-r--r--   1 root supergroup        661 2019-04-23 13:33 /user/root/hive/hive_exp_emp/000000_0

hive (default)> dfs -text /user/root/hive/hive_exp_emp/000000_0;

7369SMITHCLERK79021980-12-17800.0\N20

7499ALLENSALESMAN76981981-2-201600.0300.030

7521WARDSALESMAN76981981-2-221250.0500.030

7566JONESMANAGER78391981-4-22975.0\N20

7654MARTINSALESMAN76981981-9-281250.01400.030

7698BLAKEMANAGER78391981-5-12850.0\N30

7782CLARKMANAGER78391981-6-92450.0\N10

7788SCOTTANALYST75661987-4-193000.0\N20

7839KINGPRESIDENT\N1981-11-175000.0\N10

7844TURNERSALESMAN76981981-9-81500.00.030

7876ADAMSCLERK77881987-5-231100.0\N20

7900JAMESCLERK76981981-12-3950.0\N30

7902FORDANALYST75661981-12-33000.0\N20

7934MILLERCLERK77821982-1-231300.0\N10

#也可以从hdfs上get到本地查看

4、sqoop

hive—>rdbms

rdbms—>hive

2.7-2.8 导入、导出数据(进/出)hive表的方式的更多相关文章

CRL快速开发框架系列教程九(导入/导出数据)
本系列目录 CRL快速开发框架系列教程一(Code First数据表不需再关心) CRL快速开发框架系列教程二(基于Lambda表达式查询) CRL快速开发框架系列教程三(更新数据) CRL快速开发框 ...
mysql导入导出数据中文乱码解决方法小结
linux系统中 linux默认的是utf8编码,而windows是gbk编码,所以会出现上面的乱码问题. 解决mysql导入导出数据乱码问题首先要做的是要确定你导出数据的编码格式,使用mysqld ...
Android开发笔记：SQLite导入导出数据
SQLite是Android中最方便使用的数据库了,现在看下如何快速的在SQLite中导入导出数据. 首先由于是.NET项目转Android,原有数据库使用的是SQLSERVER,由于项目相同部分结构 ...
解决mysql导入导出数据乱码问题
最近在linux上面用mysqldump导出数据,放在windows系统中导入就会出现中文乱码,然后就会导致出现: Unknown MySQL server host和Can't connect to ...
[转]mysql导入导出数据中文乱码解决方法小结
本文章总结了mysql导入导出数据中文乱码解决方法,出现中文乱码一般情况是导入导入时编码的设置问题,我们只要把编码调整一致即可解决此方法,下面是搜索到的一些方法总结,方便需要的朋友. linux系统中 ...
oracle中导入导出数据备份数据库
原文:oracle中导入导出数据备份数据库数据库所在位置将数据导出到的文件名用户名备份数据库 :exp c ...
PLSQL导入/导出数据方法
PLSQL导入/导出数据方法 PLSQL导入/导出数据方法以前导数据库信息的时候,总是会先开启sql窗口,把自己手写的建表文件复制进去,然后再导入数据信息. 今天突然懒得去找以前的建表文件,而想用S ...
oracle10g和oracle11g导入导出数据区别
其中flxuser为用户名,flxuser为密码,file值为导入到数据库中的备份文件. oracle10g和oracle11g导入导出数据的命令方式大有不同: oracle10g导入数据: imp ...
利用sqoop将hive数据导入导出数据到mysql
一.导入导出数据库常用命令语句 1)列出mysql数据库中的所有数据库命令 # sqoop list-databases --connect jdbc:mysql://localhost:3306 ...

随机推荐

java: private, protected, public
这三个「可访问修饰符」,是一个老生常谈的话题了.在 C++ 中也有类似的概念. 按其修饰对象的不同,分为几种用法小记一下: 用于类只有 public 可以修饰类:private 和 protect ...
用js判断文本框中的是不是空，是否有空格
<script type="text/javascript"> function checkRoleName(){ var userName=document.getE ...
01 json方式封装通信接口
新建一个json_api.php<?php class Response{ /** *按json方式输出通信 *@param integet $code 状态码 *@param string $ ...
【BZOJ4668】冷战并查集
[BZOJ4668]冷战 Description 1946 年 3 月 5 日,英国前首相温斯顿·丘吉尔在美国富尔顿发表“铁幕演说”,正式拉开了冷战序幕. 美国和苏联同为世界上的“超级大国”,为了争夺 ...
LightOJ1197 Help Hanzo —— 大区间素数筛选
题目链接:https://vjudge.net/problem/LightOJ-1197 1197 - Help Hanzo PDF (English) Statistics Forum Tim ...
poj3904 Sky Code —— 唯一分解定理 + 容斥原理 + 组合
题目链接:http://poj.org/problem?id=3904 Sky Code Time Limit: 1000MS Memory Limit: 65536K Total Submiss ...
[转]FPGA入门——basys2开发板的伪随机gold码的生成
本文原创,转载请注明出处:http://www.cnblogs.com/risten/p/4166169.html 1.系统原理通过频率控制字选择相位步进,产生访问ROM的地址,进而控制DAC的输出 ...
haproxy参数解析
HAProxy工作于隧道模式,其仅检查每一个连接的第一个请求, 1. option abortonclose #当服务器负载过高时,将自动关闭队列中处理时间较长的连接请求 2. option http ...
webstorm代码提示按键改为alt+/
webstorm代码提示默认按键为ctrl+空格但是windows输入法中英文输入法的默认按键也是ctrl+空格这就导致webstorm按键冲突,无法使用代码快捷提示按键解决方法: 按ctrl+ ...
windows 下python搭建环境
一.python安装 1,首先访问https://www.python.org/downloads/windows/去下载python版本. 2. 选择3.5版本,installer文件类型(因为3. ...

2.7-2.8 导入、导出数据(进/出)hive表的方式

2.7-2.8 导入、导出数据(进/出)hive表的方式的更多相关文章

随机推荐

热门专题