hive 导入数据

1、load data

load data local inpath "/home/hadoop/userinfo.txt" into table userinfo;

load data inpath "/mysql/syslog2/part-m-00000" into table syslog;

2、insert

hive> insert into userinfo2 values(25,'test_user');

insert into table weather_list  select year,data from weather_data;

insert overwritetable weather_list  select year,data from weather_data;

insert into table weather_list partition(createtime='2012-01-01',area='gz') select year,data from weather_data;

insert overwritetable table weather_list partition(createtime='2012-01-01',area='gz') select year,data from weather_data;

#动态分区
insert into table weather_list partition(createtime='2012-01-02',area) select year,data,'gz' from weather_data;

hive> insert into table weather_list partition(createtime,area) select year,data,'2013-01-01','gz' from weather_data;

FAILED: SemanticException [Error 10096]: Dynamic partition strict mode requires at least one static partition column. To turn this off set hive.exec.dynamic.partition.mode=nonstrict

hive> set hive.exec.dynamic.partition.mode=nonstrict;

hive> insert into table weather_list partition(createtime,area) select year,data,'2013-01-01','gz' from weather_data;

3、多表插入，在单表插入的时候，from子句可以放在前面，这个特性在多表插入的时候被应用

#建立三张表，分别按年份存最大，最小，计数

hive> create table weather_max(year int,mdata int) row format delimited fields terminated by ',';

OK

Time taken: 0.519 seconds

hive> create table weather_min(year int,mdata int) row format delimited fields terminated by ',';

OK

Time taken: 0.471 seconds

hive> create table weather_count(year int,cdata int) row format delimited fields terminated by ',';

OK

Time taken: 0.258 seconds

hive> from weather_data

    > insert into weather_max select year,max(data) group by year

    > insert into weather_min select year,min(data) group by year

    > insert into weather_count select year,count(1) group by year;

4、使用CTAS创建表并导入数据，create table ... as select ...

hive> create table userinfo2 as select userid,username from userinfo;

hive 导入数据的更多相关文章

使用Sqoop从mysql向hdfs或者hive导入数据时出现的一些错误
1.原表没有设置主键,出现错误提示: ERROR tool.ImportTool: Error during import: No primary key could be found for tab ...
【转】hive导入数据出现NULL
在把hdfs上数据迁移到hive中的表时,若出现数据位NULL,是因为没有指定列分隔符. 由于hive默认的分隔符是/u0001(Ctrl+A),为了平滑迁移,需要在创建表格时指定数据的分割符号,语法 ...
sqoop从hive导入数据到mysql时出现主键冲突
今天在将一个hive数仓表导出到mysql数据库时出现进度条一直维持在95%一段时间后提示失败的情况,搞了好久才解决.使用的环境是HUE中的Oozie的workflow任何调用sqoop命令,该死的o ...
Hive导入数据的四种方法
Hive的几种常见的数据导入方式这里介绍四种:(1).从本地文件系统中导入数据到Hive表:(2).从HDFS上导入数据到Hive表:(3).从别的表中查询出相应的数据并导入到Hive表中:(4).在 ...
hive导入数据
替换分隔符为\ sed -i 's/\t/\x1/g;s/;/\x1/g' test1.txt gz压缩 gzip -r test1.txt 查看文件 hdfs dfs -ls /hive/wareh ...
Hive导入数据到HBase,再与Phoenix映射同步
1. 创建HBase 表 create 'hbase_test','user' 2. 插入数据 put 'hbase_test','111','user:name','jack' put 'hbase ...
Sqoop增量从MySQL中向hive导入数据
sqoop job --create incretest -- import --connect jdbc:mysql://10.8.2.19:3306/db --table table1 --use ...
Hive导入导出数据的方法
Hive导入数据的方式官网文档: LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (p ...
sqoop1.4.7 导入数据到hive2.3.4 jackson版本问题
今天用sqoop往hive导入数据的时候,执行报错,错误信息为: java.lang.NoSuchMethodError:com.fasterxml.jackson.databind.ObjectMa ...

随机推荐

4709: [Jsoi2011]柠檬
4709: [Jsoi2011]柠檬 https://www.lydsy.com/JudgeOnline/problem.php?id=4709 分析: 决策单调性+栈+二分. 首先挖掘性质:每个段选 ...
tidb测试环境安装，离线部署
1.环境以及规划机器:centos7.5 ; 文件系统为ext4:内存16g:cpu8核,共三个节点: ip hostname roles --- tidb tipd tikv --- tidb t ...
JS的发布订阅模式
JS的发布订阅模式这里要说明一下什么是发布-订阅模式发布-订阅模式里面包含了三个模块,发布者,订阅者和处理中心.这里处理中心相当于报刊办事大厅.发布者相当与某个杂志负责人,他来中心这注册一个的杂志 ...
解决老项目中 Timer运行一段时间后失效的问题
那是因为Timer中的代码出现了异常未被捕获,所以线程被挂起只需要加入 try catch即可推荐使用 Quartz 2018-08-08 03:50:44 [ Timer-1:39366015 ...
Android开发笔记——以Volley图片加载、缓存、请求及展示为例理解Volley架构设计
Volley是由Google开源的.用于Android平台上的网络通信库.Volley通过优化Android的网络请求流程,形成了以Request-RequestQueue-Response为主线的网 ...
Python单元测试--unittest(一)
unittest模块是Python中自带的一个单元测试模块,我们可以用来做代码级的单元测试. 在unittest模块中,我们主要用到的有四个子模块,他们分别是: 1)TestCase:用来写编写逐条的 ...
不相交集合ADT -数据结构（C语言实现）
读数据结构与算法分析不相交集合等价关系满足三个性质 - 自反性 - 对称性 - 传递性基本数据结构基本思路使用一个数组,下标表示该集合,内容表示指向的父亲实现类型声明 typedef ...
java处理大文本2G以上
面试中经常碰到类似问题,问题的关键我觉得是用设置一个缓冲区还有一个思路是通过Linux split 命令将文件直接切割成小文件,再进行处理再汇总. 或者jdk7提供的 forkjoin 框架,利用 ...
Java的继承，final关键字，super关键字
1.继承的初始化顺序: 父类—>父类的初始化对象中的属性—>父类的构造方法—>子类—>子类的初始化对象中的属性—>子类的构造方法若有构造方法:则先执行属性,再执行构造方 ...
记录 C++ STL 中一些好用的函数--持续更新 (for_each,transform,count_if,find_if)
在日常的编程中,有这么几种操作还是比较常见的: 把一组数据都赋值成一个数,在一组数据中查找一个数,统计一组数据中符合条件的数等等. 一般的写法可以用循环,没有什么是循环不能搞定的.假如在这里怎么用介绍 ...

hive 导入数据

hive 导入数据的更多相关文章

随机推荐

热门专题