2.3 Hive的数据类型讲解及实际项目中如何使用python脚本对数据进行ETL
一、hive Data Types
https://cwiki. apache. org/confluence/display/HiveLanguageManual+Types
Numeric Types
· TINYINT(1-byte signed integer, from-128 to 127)
· SMALLINT(2-byte signed integer, from-32,768 to 32,767)
· INT(4-byte signed integer, from-2,147,483,648 to 2,147,483,647)
· BIGINT(8-byte signed integer, from-9,223,372,036,854,775,808 to9
· FLOAT(4-byte single precision floating point number)
· DOUBLE(8-byte double precision floating point number)
· DECIMAL
· Introduced in Hive 0.11.0 with a precision of 38 digits
· Hive 0.13.0 introduced user definable precision and scale Date/Time Types
· TIMESTAMP(Note: Only available starting with Hive 0.8.0)
· DATE(Note: Only available starting with Hive 0.12.0) String Types
· STRING
· VARCHAR(Note: Only available starting with Hive 0.12.0)
· CHAR(Note: Only available starting with Hive 0.13.0) Misc Types
· BOOLEAN
· BINARY(Note: Only available starting with Hive 0.8.0) Complex Types
· arrays: ARRAY<data_type>(Note: negative values and non-constant expressions are allowed as of Hive 0.14.)
· maps: MAP<primitivetype, data_type>(Note: negative values and non-constant expressions are allowed as of Hive 0.14.)
· structs: STRUCT<col_name: datatype [ COMENT col_comment],..>
· union: UNIONTYPE<datatype, data_type,..>(Note: Only available starting with Hive 0.7.0.)
二、Primitive Types
·Types are associated with the columns in the tables.The following Primitive types are
supported: ·Integers
·TINYINT-1 byte integer
·SMALLINT-2 byte integer
·INT-4 byte integer
·BIGINT-8 byte integer ·Boolean type
·BOOLEAN-TRUE/FALSE ·Floating point numbers
·FLOAT-single precision
·DOUBLE-Double precision ·String type
·STRING-sequence of characters in a specified character set https://cwiki.apache.org/confluence/display/Hive/Tutorial
三、python脚本对数据进行ETL流程
1)table, load E
2)select, python T
3)sub table L
2.3 Hive的数据类型讲解及实际项目中如何使用python脚本对数据进行ETL的更多相关文章
- Spark(Hive) SQL数据类型使用详解(Python)
Spark SQL使用时需要有若干“表”的存在,这些“表”可以来自于Hive,也可以来自“临时表”.如果“表”来自于Hive,它的模式(列名.列类型等)在创建时已经确定,一般情况下我们直接通过Spar ...
- 大数据时代的技术hive:hive的数据类型和数据模型
在上篇文章里,我列举了一个简单的hive操作实例,创建了一张表test,并且向这张表加载了数据,这些操作和关系数据库操作类似,我们常把hive和关系数据库进行比较,也正是因为hive很多知识点和关系数 ...
- Hive 5、Hive 的数据类型 和 DDL Data Definition Language)
官方帮助文档:https://cwiki.apache.org/confluence/display/Hive/LanguageManual+DDL Hive的数据类型 -- 扩展数据类型data_t ...
- hadoop笔记之Hive的数据类型
Hive的数据类型 Hive的数据类型 前面说过,Hive是一个数据仓库,相当于一个数据库.既然是数据库,那么就必须能创建表,既然有表,那么当中就有列,列中就有对应的类型 总的来讲,hive的数据类型 ...
- Hive之数据类型
Hive之数据类型 (本文是基于多篇文章根据个人理解进行的整合,参考的文章见末尾的整理) 数据类型 Hive支持两种数据类型,一类叫原子数据类型,一类叫复杂数据类型.原子数据类型包括数值型.布尔型 ...
- Hive 复杂数据类型的使用
Hive复杂数据类型 1.Array数据类型的使用 1.1.创建数据库表,以array作为数据类型 hive (hive_demo1)> create table stu_test(name a ...
- 《Hive编程指南》读书笔记 | 一文看懂Hive的数据类型和文件格式
Hive支持关系型数据库中的大多数基本数据类型,同时也支持关系型数据库中很少出现的3种集合数据类型. 和大多数数据库相比,Hive具有一个独特的功能,那就是其对于数据在文件中的编码方式具有非常大的灵活 ...
- memcache讲解和在.net中初使用
memcache讲解和在.net中初使用 2017年10月17日 22:51:36 等待临界 阅读数:503 前言 传统数据库面临的问题 数据库死锁 磁盘IO 正文 了解memcache 原理 基 ...
- 在C#项目中需要用double类型操作MSSQL float类型数据(附C#数据类型和SQL数据类型对照)
C#操作SQL Float类型,数据会多很多小数,原来是C#的float和sql的float类型不一致.以下是数据库中与C#中的数据类型对照. /// <summary> /// 数据库中 ...
随机推荐
- HDU 5667 :Sequence
Sequence Accepts: 59 Submissions: 650 Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536 ...
- Linux 中如何查询和卸载已安装的软件
Linux 中如何查询和卸载已安装的软件 Linux软件的安装和卸载一直是困扰许多新用户的难题.在Windows中,我们可以使用软件自带的安装卸载程序或在控制面板中的“添加/删除程序” 来实现.与其相 ...
- linux 信号屏蔽
<span style="font-size:18px;">#include <sys/types.h> #include <unistd.h> ...
- Tika解析word文件
Apache POI - HWPF and XWPF - Java API to Handle Microsoft Word Files http://poi.apache.org/document/ ...
- 使用 fcntl 函数 获取,设置文件的状态标志
前言 当打开一个文件的时候,我们需要指定打开文件的模式( 只读,只写等 ).那么在程序中如何获取,修改这个文件的状态标志呢?本文将告诉你如何用 fcntl函数 获取指定文件的状态标志. 解决思路 1. ...
- Android 监听返回键退出程序的两种实现
1.Android 双击返回键退出程序 思路:用户按下返回键时设定一个定时器来监控是否2秒内实现了退出,如果用户没有接着按返回键,则清除第一次按返回键的效果,使程序还原到第一次按下返回键之前的状态.定 ...
- node.js npm 安装spm失败,竟然是版本的问题
SPM v.1.1.2 With SeaJS SPM v1.1.2使用指南 1.SPM用途 SeaJS提供了模块化开发的机制,在代码开发完后,还需要做产品发布相关的一些操作. 这些可以通过SPM来 ...
- 有关Option.inSamplSize 和 Compress 图片压缩
1.图片占用内存:占用的内存 = 图片长度 * 图片宽度 * 单位像素占用的字节数 注: 图片长度和图片宽度就是图片在行列上的像素数量. 图片格式: ALPHA_8:表示8位Alpha位图,即A=8, ...
- vue的缓存机制
缓存,不管是PC 端还是移动端,不可避免的问题.vue中有一个keepAlive,这个api 基本 能实现我们开发的一些需要. 一.简单介绍下keep-alive: 1.把切换出去的组件保留在内存中, ...
- CSS控制文本的长度,超过一行显示省略号
代码如下: <div style="width:100px;height:20px;text-overflow:ellipsis; white-space:nowrap; overfl ...