一、hive Data Types

https://cwiki. apache. org/confluence/display/HiveLanguageManual+Types

  1. Numeric Types
  2. · TINYINT(1-byte signed integer, from-128 to 127)
  3. · SMALLINT(2-byte signed integer, from-32,768 to 32,767)
  4. · INT(4-byte signed integer, from-2,147,483,648 to 2,147,483,647)
  5. · BIGINT(8-byte signed integer, from-9,223,372,036,854,775,808 to9
  6. · FLOAT(4-byte single precision floating point number)
  7. · DOUBLE(8-byte double precision floating point number)
  8. · DECIMAL
  9. · Introduced in Hive 0.11.0 with a precision of 38 digits
  10. · Hive 0.13.0 introduced user definable precision and scale
  11.  
  12. Date/Time Types
  13. · TIMESTAMP(Note: Only available starting with Hive 0.8.0)
  14. · DATE(Note: Only available starting with Hive 0.12.0)
  15.  
  16. String Types
  17. · STRING
  18. · VARCHAR(Note: Only available starting with Hive 0.12.0)
  19. · CHAR(Note: Only available starting with Hive 0.13.0)
  20.  
  21. Misc Types
  22. · BOOLEAN
  23. · BINARY(Note: Only available starting with Hive 0.8.0)
  24.  
  25. Complex Types
  26. · arrays: ARRAY<data_type>(Note: negative values and non-constant expressions are allowed as of Hive 0.14.)
  27. · maps: MAP<primitivetype, data_type>(Note: negative values and non-constant expressions are allowed as of Hive 0.14.)
  28. · structs: STRUCT<col_name: datatype [ COMENT col_comment],..>
  29. · union: UNIONTYPE<datatype, data_type,..>(Note: Only available starting with Hive 0.7.0.)

二、Primitive Types

  1. ·Types are associated with the columns in the tables.The following Primitive types are
  2. supported
  3.  
  4. ·Integers
  5. ·TINYINT-1 byte integer
  6. ·SMALLINT-2 byte integer
  7. ·INT-4 byte integer
  8. ·BIGINT-8 byte integer
  9.  
  10. ·Boolean type
  11. ·BOOLEAN-TRUE/FALSE
  12.  
  13. ·Floating point numbers
  14. ·FLOAT-single precision
  15. ·DOUBLE-Double precision
  16.  
  17. ·String type
  18. ·STRING-sequence of characters in a specified character set
  19.  
  20. https://cwiki.apache.org/confluence/display/Hive/Tutorial

三、python脚本对数据进行ETL流程

1)table, load           E

2)select, python     T

3)sub table             L

2.3 Hive的数据类型讲解及实际项目中如何使用python脚本对数据进行ETL的更多相关文章

  1. Spark(Hive) SQL数据类型使用详解(Python)

    Spark SQL使用时需要有若干“表”的存在,这些“表”可以来自于Hive,也可以来自“临时表”.如果“表”来自于Hive,它的模式(列名.列类型等)在创建时已经确定,一般情况下我们直接通过Spar ...

  2. 大数据时代的技术hive:hive的数据类型和数据模型

    在上篇文章里,我列举了一个简单的hive操作实例,创建了一张表test,并且向这张表加载了数据,这些操作和关系数据库操作类似,我们常把hive和关系数据库进行比较,也正是因为hive很多知识点和关系数 ...

  3. Hive 5、Hive 的数据类型 和 DDL Data Definition Language)

    官方帮助文档:https://cwiki.apache.org/confluence/display/Hive/LanguageManual+DDL Hive的数据类型 -- 扩展数据类型data_t ...

  4. hadoop笔记之Hive的数据类型

    Hive的数据类型 Hive的数据类型 前面说过,Hive是一个数据仓库,相当于一个数据库.既然是数据库,那么就必须能创建表,既然有表,那么当中就有列,列中就有对应的类型 总的来讲,hive的数据类型 ...

  5. Hive之数据类型

    Hive之数据类型   (本文是基于多篇文章根据个人理解进行的整合,参考的文章见末尾的整理) 数据类型 Hive支持两种数据类型,一类叫原子数据类型,一类叫复杂数据类型.原子数据类型包括数值型.布尔型 ...

  6. Hive 复杂数据类型的使用

    Hive复杂数据类型 1.Array数据类型的使用 1.1.创建数据库表,以array作为数据类型 hive (hive_demo1)> create table stu_test(name a ...

  7. 《Hive编程指南》读书笔记 | 一文看懂Hive的数据类型和文件格式

    Hive支持关系型数据库中的大多数基本数据类型,同时也支持关系型数据库中很少出现的3种集合数据类型. 和大多数数据库相比,Hive具有一个独特的功能,那就是其对于数据在文件中的编码方式具有非常大的灵活 ...

  8. memcache讲解和在.net中初使用

    memcache讲解和在.net中初使用 2017年10月17日 22:51:36 等待临界 阅读数:503   前言 传统数据库面临的问题 数据库死锁 磁盘IO 正文 了解memcache 原理 基 ...

  9. 在C#项目中需要用double类型操作MSSQL float类型数据(附C#数据类型和SQL数据类型对照)

    C#操作SQL Float类型,数据会多很多小数,原来是C#的float和sql的float类型不一致.以下是数据库中与C#中的数据类型对照. /// <summary> /// 数据库中 ...

随机推荐

  1. C语言函数的递归和调用

    函数记住两点: (1)每个函数运行完才会返回调用它的函数:每个函数运行完才会返回调用它的函数,因此,你可以先看看这个函数不自我调用的条件,也就是fun()中if条件不成立的时候,对吧,不成立的时候就是 ...

  2. svn 版本管理与自动部分发布(转)

    作为团队开发项目时,会遇到项目的版本管理,测试部署与发布部署,下面是摘至他人的关于版本管理和自动部署的方案. svn自动部署的实现: 使用svn的hook功能 1.在版本库的hooks目录下面,有一些 ...

  3. java设计模式之综述

    一.什么是设计模式 设计模式是一套被反复使用的.多数人知晓的.经过分类编目的.代码设计经验的总结.使用设计模式是为了重用代码.让代码更容易被他人理解.保证代码可靠性. 毫无疑问,设计模式于己于他人于系 ...

  4. git 的安装

    git在开发中已经成了必备工具了,我们来看看git在各个平台上的安装 1.Linux上安装git $sudo apt-get install git 2.mac上安装 1)homebrew安装git ...

  5. 2 Maven使用入门

    一.编写pom.xml文件     Maven项目的核心是pom.xml.POM(Project Object Model,项目对象模型)定义了项目的基本信息,用于描述项目如何构建,声明项目依赖等等. ...

  6. ZOJ - 3948 Marjar Cola 【循环】

    题目链接 http://acm.zju.edu.cn/onlinejudge/showProblem.do?problemCode=3948 题意 用 x 个 瓶身 可以 换 一瓶饮料 用 y 个 瓶 ...

  7. 03-树1 树的同构(25 point(s)) 【Tree】

    03-树1 树的同构(25 point(s)) 给定两棵树T1和T2.如果T1可以通过若干次左右孩子互换就变成T2,则我们称两棵树是"同构"的.例如图1给出的两棵树就是同构的,因为 ...

  8. 7-5 打印选课学生名单(25 point(s)) 【排序】

    7-5 打印选课学生名单(25 point(s)) 假设全校有最多40000名学生和最多2500门课程.现给出每个学生的选课清单,要求输出每门课的选课学生名单. 输入格式: 输入的第一行是两个正整数: ...

  9. ansible操作模块相关

    1. 查看模块可用参数命令 ansible-doc -s module_name

  10. XML中CDATA和#PCDATA的区别

    在XML文档中, 能看到“CDATA"的地方有三处: 1)在DTD中,指定标签中某个属性的类型为字符型时,使用CDATA.因为XML解析器会去分析这段字符内容,因而里面如果需要使用>, ...