Hive基础之Hive的复杂类型

ARRAY

一组有序字段，字段的类型必须相同。Array(1,2)

create table hive_array(ip string, uid array<string>)

row format delimited

fields terminated by ','

collection items terminated by '|'

stored as textfile;

加载数据

load data local inpath "/home/spark/software/data/hive_array.txt" overwrite into table hive_array;

hive_array.txt

192.168.1.1,www.baidu.com|www.google.com|www.qq.com

192.168.1.2,www.baidu.com|www.sina.com|www.sohu.com

192.168.1.3,www.qq.com|www.163.com|www.youku.com

select * from hive_array;

192.168.1.1     ["www.baidu.com","www.google.com","www.qq.com"]

192.168.1.2     ["www.baidu.com","www.sina.com","www.sohu.com"]

192.168.1.3     ["www.qq.com","www.163.com","www.youku.com"]

使用下标访问，下标从0开始：

select ip, uid[] as id from hive_array;

192.168.1.1     www.baidu.com

192.168.1.2     www.baidu.com

192.168.1.3     www.qq.com

查看数据长度：

select size(uid) from hive_array;

3

3

3

数组查找：

select * from hive_array where array_contains(uid, "www.baidu.com");

192.168.1.1     ["www.baidu.com","www.google.com","www.qq.com"]

192.168.1.2     ["www.baidu.com","www.sina.com","www.sohu.com"]

MAP

一组无序的键值对，键的类型必须是原子的，值可以是任何类型，同一个映射的键的类型必须相同，值的类型也必须相同。Map('a',1,'b',2)

create table hive_map(ts string, ip string, type string, logtype string, request Map<string,string>, response Map<string, string>)

row format delimited fields terminated by '#'

collection items terminated by '&'

map keys terminated by '='

stored as textfile;

hive_map.txt

2014-03-03 12:22:34#127.0.0.1#get#amap#src=123&code=456&cookie=789#status=success&time=2s

2014-03-03 11:22:34#127.0.0.1#get#autonavi#src=123&code=456#status=success&time=2s&cookie=789

加载数据：

load data local inpath "/home/spark/software/data/hive_map.txt" overwrite into table hive_map;

查看表结构: desc hive_map

ts                      string                  None

ip                      string                  None

type                    string                  None

logtype                 string                  None

request                 map<string,string>      None

response                map<string,string>      None

查看所有字段：

select * from hive_map;

2014-03-03 12:22:34     127.0.0.1       get     amap    {"src":"123","code":"456","cookie":"789"}       {"status":"success","time":"2s"}

2014-03-03 11:22:34     127.0.0.1       get     autonavi        {"src":"123","code":"456"}      {"status":"success","time":"2s","cookie":"789"}

查看map中指定的字段：

select request['src'], request['code'], request['cookie'] from hive_map;

123     456     789

123     456     NULL

STRUCT

一组命名的字段，字段类型可以不同。 Struct('a',1,2,0)

create table hive_struct(ip string, user struct<name:string, age:int>)

row format delimited fields terminated by '#'

collection  items terminated by ':'

stored as textfile;

hive_struct.txt

192.168.1.1#zhangsan:40

192.168.1.2#lisi:50

192.168.1.3#wangwu:60

192.168.1.4#zhaoliu:70

加载数据：

load data local inpath "/home/spark/software/data/hive_struct.txt" overwrite into table hive_struct;

查询所有字段：

select * from hive_struct;

192.168.1.1     {"name":"zhangsan","age":40}

192.168.1.2     {"name":"lisi","age":50}

192.168.1.3     {"name":"wangwu","age":60}

192.168.1.4     {"name":"zhaoliu","age":70}

查询指定字段：

select user.name, user.age from hive_struct;

zhangsan        40

lisi    50

wangwu  60

zhaoliu 70

Hive基础之Hive的复杂类型的更多相关文章

Hive基础之Hive数据类型
Hive数据类型参考:中文博客:http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2843448.html 英文:https: ...
Hive基础之Hive体系架构&运行模式&Hive与关系型数据的区别
Hive架构 1)用户接口: CLI(hive shell):命令行工具:启动方式:hive 或者 hive --service cli ThriftServer:通过Thrift对外提供服务,默认端 ...
Hive基础之Hive环境搭建
Hive默认元数据信息存储在Derby里,Derby内置的关系型数据库.单Session的(只支持单客户端连接,两个客户端连接过去会报错): Hive支持将元数据存储在关系型数据库中,比如:Mysql ...
Hive基础之Hive的存储类型
Hive常用的存储类型有: 1.TextFile: Hive默认的存储类型:文件大占用空间大,未压缩,查询慢: 2.Sequence File:将属于以<KEY,VALUE>的形式序列化到 ...
Hive基础之Hive开启查询列名及行转列显示
Hive默认情况下查询结果里面是只显示值: hive> select * from click_log; OK ad_101 :: ad_102 :: ad_103 :: ad_104 :: a ...
Hive基础之Hive与关系型数据库的比较
Hive与关系型数据库的比较使用Hive的CTL(命令行接口)时,你会感觉它很像是在操作关系型数据库,但是实际上,Hive和关系型数据库有很大的不同. 1)Hive和关系型数据库 ...
Hive基础之Hive表常用操作
本案例使用的数据均来源于Oracle自带的emp和dept表创建表语法: CREATE [EXTERNAL] TABLE [IF NOT EXISTS] [db_name.]table_name ...
Hive基础之Hive是什么以及使用场景
Hive是什么1)Hive由facebook开源,构建在Hadoop (HDFS/MR)上的用于管理和查询结果化/非结构化的数据仓库:2)一种可以存储.查询和分析存储在Hadoop 中的大规模数据的机 ...
Hive基础(1)
Hive基础(1) Hive的HQL(2) 1. Hive并不是分布式的,它独立于机器之外,类似于Hadoop的客户端. 2. 元数据和数据的区别,前者如表名.列名.字段名等. 3. Hive的三种安 ...

随机推荐

【转】游戏buff设计参见
其实这类帖子并没有多少的设计理论,对于策划的提升和帮助也并不大,原因其实在于其适用性太窄,当我要设计XX象棋的时候,它就滚一边去了. 废话不多说切入正题: 游戏中的BUFF/DEBUFF我们见过很多, ...
STM32中断定时，控制LED灯
#include "led.h" void TIM3_Int_Init(u16 arr,u16 psc) { TIM_TimeBaseInitTypeDef TIM_TimeBas ...
LightOJ 1355 :Game of CS(树上green博弈)
Jolly and Emily are two bees studying in Computer Science. Unlike other bees they are fond of playin ...
《DSP using MATLAB》Problem 3.6
逆DTFT定义如下: 需要求积分,
使用OASGraph 暴露rest 接口为graphql api
OASGraph 是loopback 团队开发的方便将rest api 暴露为graphql 的工具, 这个也是loopback 4 的一个新特性类似的有些团队提出了binding 以及stitch ...
SharedImageCollection
https://documentation.devexpress.com/#WindowsForms/clsDevExpressUtilsSharedImageCollectiontopic The ...
TensorFlow笔记-01-开篇概述
人工智能实践:TensorFlow笔记-01-开篇概述从今天开始,从零开始学习TensorFlow,有相同兴趣的同志,可以互相学习笔记,本篇是开篇介绍 Tensorflow,已经人工智能领域的一些名 ...
【转】每天一个linux命令(12)：more命令
原文网址:http://www.cnblogs.com/peida/archive/2012/11/02/2750588.html more命令,功能类似 cat ,cat命令是整个文件的内容从上到下 ...
HTMLCanvasElement.toBlob() 兼容性及使用
toBlob 兼容性: 在最新版chrome和firefox中能正常使用,在Safari中报错:没有这个函数规避方法: 不使用toBlob,使用toDataURL()将file转成base64编码, ...
svn知识点
svn checkout [url] [dir]: 从版本库中检出代码到本地文件夹 svn status :查看当前工作副本的代码变更状态信息 svn diff [file]:比对工作副本与版本库之间 ...

Hive基础之Hive的复杂类型

Hive基础之Hive的复杂类型的更多相关文章

随机推荐

热门专题