Hive——元数据表含义

1、VERSION   -- 查询版本信息

  Field Type Comment
  VER_ID bigint(20) ID主键
  SCHEMA_VERSION varchar(127) Hive版本
  VERSION_COMMENT varchar(255) 版本说明

2、DBS     -- 存储Hive中所有数据库的基本信息

  Field Type Comment
  DB_ID bigint(20) 数据库ID
  DESC varchar(4000) 数据库描述
  DB_LOCATION_URI varchar(4000) 数据库HDFS路径
  NAME varchar(128) 数据库名
  OWNER_NAME varchar(128) 数据库所有者用户名
  OWNER_TYPE varchar(10) 所有者角色

3、DATABASE_PARAMS  --该表存储数据库的相关参数,在CREATE DATABASE时候用

  Field Type Comment
  DB_ID bigint(20) 数据库ID
  PARAM_KEY varchar(180) 参数名
  PARAM_VALUE varchar(4000) 参数值

4、TBLS  --该表中存储Hive表、视图、索引表的基本信息

  Field Type Comment
  TBL_ID bigint(20) 表ID
  CREATE_TIME int(11) 创建时间
  DB_ID bigint(20) 数据库ID
  LAST_ACCESS_TIME int(11) 上次访问时间
  OWNER varchar(767) 所有者
  RETENTION int(11) 保留字段
  SD_ID bigint(20) 序列化配置信息
  TBL_NAME varchar(128) 表名
  TBL_TYPE varchar(128) 表类型
  VIEW_EXPANDED_TEXT mediumtext 视图的详细HQL语句
  VIEW_ORIGINAL_TEXT mediumtext 视图的原始HQL语句

5、TABLE_PARAMS  --该表存储表/视图的属性信息。

  Field Type Comment
  TBL_ID bigint(20) 表ID
  PARAM_KEY varchar(256) 属性名
  PARAM_VALUE varchar(4000) 属性值

6、SDS  --该表保存文件存储的基本信息,如INPUT_FORMAT、OUTPUT_FORMAT、是否压缩等。

  Field Type Comment
  SD_ID bigint(20) 存储信息ID
  CD_ID bigint(20) 字段信息ID
  INPUT_FORMAT varchar(4000) 文件输入格式
  IS_COMPRESSED bit(1) 是否压缩
  IS_STOREDASSUBDIRECTORIES bit(1) 是否以子目录存储
  LOCATION varchar(4000) HDFS路径
  NUM_BUCKETS int(11) 分桶数量
  OUTPUT_FORMAT varchar(4000) 文件输出格式
  SERDE_ID bigint(20) 序列化类ID

7、SERDS      --该表存储序列化使用的类信息

  Field Type Comment
  SERDE_ID bigint(20) 序列化类配置ID
  NAME varchar(128) 序列化类别名
  SLIB varchar(4000) 序列化类

8、SERDE_PARAMS      --该表存储序列化的一些属性、格式信息,比如:行、列分隔符

  Field Type Comment
  SERDE_ID bigint(20) 序列化类配置ID
  PARAM_KEY varchar(256) 属性名
  PARAM_VALUE varchar(4000) 属性值

9、COLUMNS_V2      --该表存储表对应的字段信息。

  Field Type Comment
  CD_ID bigint(20) 字段信息ID
  COMMENT varchar(256) 字段注释
  COLUMN_NAME varchar(128) 字段名
  TYPE_NAME varchar(4000) 字段类型
  INTEGER_IDX int(11) 字段顺序

10、PARTITIONS      --该表存储表分区的基本信息。

  Field Type Comment
  PART_ID bigint(20) 分区ID
  CREATE_TIME int(11) 分区创建时间
  LAST_ACCESS_TIME int(11) 最后一次访问时间
  PART_NAME varchar(767) 分区名
  SD_ID bigint(20) 分区存储ID
  TBL_ID bigint(20) 表ID

11、PARTITION_KEYS      --该表存储分区的字段信息。

  Field Type Comment
  TBL_ID bigint(20) 表ID
  PKEY_COMMENT varchar(4000) 分区字段说明
  PKEY_NAME varchar(128) 分区字段名
  PKEY_TYPE varchar(767) 分区字段类型
  INTEGER_IDX int(11) 分区字段顺序

12、PARTITION_KEY_VALS      --该表存储分区字段值。

  Field Type Comment
  PART_ID bigint(20) 分区ID
  PART_KEY_VAL varchar(255) 分区字段值
  INTEGER_IDX int(11) 分区字段值顺序

13、PARTITION_PARAMS      --该表存储分区的属性信息。

  Field Type Comment
  PART_ID bigint(20) 分区ID
  PARAM_KEY varchar(256) 分区属性名
  PARAM_VALUE varchar(4000) 分区属性值

其他不常用的元数据表:

DB_PRIVS:数据库权限信息表。通过GRANT语句对数据库授权后,将会在这里存储。

IDXS:索引表,存储Hive索引相关的元数据

INDEX_PARAMS:索引相关的属性信息。

TAB_COL_STATS:表字段的统计信息。使用ANALYZE语句对表字段分析后记录在这里。

TBL_COL_PRIVS:表字段的授权信息

PART_PRIVS:分区的授权信息

PART_COL_STATS:分区字段的统计信息。

PART_COL_PRIVS:分区字段的权限信息。

FUNCS:用户注册的函数信息

FUNC_RU:用户注册函数的资源信息

Hive——元数据表含义的更多相关文章

  1. Hive学习之路 (三)Hive元数据信息对应MySQL数据库表

    概述 Hive 的元数据信息通常存储在关系型数据库中,常用MySQL数据库作为元数据库管理.上一篇hive的安装也是将元数据信息存放在MySQL数据库中. Hive的元数据信息在MySQL数据中有57 ...

  2. Hive(三)Hive元数据信息对应MySQL数据库表

    概述 Hive 的元数据信息通常存储在关系型数据库中,常用MySQL数据库作为元数据库管理.上一篇hive的安装也是将元数据信息存放在MySQL数据库中. Hive的元数据信息在MySQL数据中有57 ...

  3. Apache Hive (三)Hive元数据信息对应MySQL数据库表

    转自:https://www.cnblogs.com/qingyunzong/p/8710356.html 概述 Hive 的元数据信息通常存储在关系型数据库中,常用MySQL数据库作为元数据库管理. ...

  4. 【转】Hive内部表、外部表

    hive内部表.外部表区别自不用说,可实际用的时候还是要小心. 1. 内部表: create table tt (name string , age string) location '/input/ ...

  5. hive内部表、外部表

    hive内部表.外部表区别自不用说,可实际用的时候还是要小心. Hive的数据分为表数据和元数据,表数据是Hive中表格(table)具有的数据:而元数据是用来存储表的名字,表的列和分区及其属性,表的 ...

  6. hive内部表与外部表区别

    1.在Hive里面创建一个表: hive> create table wyp(id int,    > name string,    > age int,    > tele ...

  7. 如何监听对 HIVE 元数据的操作

    目录 简介 HIVE 基本操作 获取 HIVE 源码 编译 HIVE 源码 启动 HIVE 停止 HIVE 监听对 HIVE 元数据的操作 参考文档 简介 公司有个元数据管理平台,会定期同步 HIVE ...

  8. hive元数据研究

    hive的元数据存放在关系型数据库中,元数据中存储了hive中所有表格的信息,包括表格的名字,表格的字段,字段的类型,注释.这些信息分散的存放在各个表中,给定一个hive中的表格名字,查询这个表中含有 ...

  9. hive内部表、外部表、分区

    hive内部表.外部表.分区 内部表(managed table) 默认创建的是内部表(managed table),存储位置在hive.metastore.warehouse.dir设置,默认位置是 ...

随机推荐

  1. ResNet网络的训练和预测

    ResNet网络的训练和预测 简介 Introduction 图像分类与CNN 图像分类 是指将图像信息中所反映的不同特征,把不同类别的目标区分开来的图像处理方法,是计算机视觉中其他任务,比如目标检测 ...

  2. 深度学习Dropout技术分析

    深度学习Dropout技术分析 什么是Dropout? dropout是指在深度学习网络的训练过程中,对于神经网络单元,按照一定的概率将其暂时从网络中丢弃.注意是暂时,对于随机梯度下降来说,由于是随机 ...

  3. NVIDIA空中导航SDK改造5G通信

    NVIDIA空中导航SDK改造5G通信 Transforming Next-Generation Wireless with 5T for 5G and the NVIDIA Aerial SDK N ...

  4. 20 岁发表 SCI 的学霸,梦想用算法改变世界

    2021 年 2 月,"新内容 新交互" 全球视频云创新挑战赛启幕.本次大赛由英特尔联合阿里云主办,与优酷战略技术合作,天池平台和阿里云视频云团队共同承办.大赛自开赛以来,吸引了全 ...

  5. 腾讯云 K8S 集群实战 Service Mesh—Linkerd2 & Traefik2 部署 emojivoto 应用

    Linkerd 是 Kubernetes 的服务网格. 它通过为您提供运行时调试(runtime debugging).可观察性(observability).可靠性(reliability)和安全性 ...

  6. SpringBoot基础系列之自定义配置源使用姿势实例演示

    [SpringBoot基础系列]自定义配置源的使用姿势介绍 前面一篇博文介绍了一个@Value的一些知识点,其中提了一个点,@Value对应的配置,除了是配置文件中之外,可以从其他的数据源中获取么,如 ...

  7. 【C++】sprintf 与sprintf_s

    (转自: http://blog.sina.com.cn/s/blog_4ded4a890100j2nz.html) 将过去的工程用VS2005打开的时候.你有可能会遇到一大堆的警告:warning ...

  8. centos 7 显示系统执行的进程

    命令:ps -aux ps -aux | more USER PID %CPU %MEM VSZ RSS TTY STAT START TIME COMMAND root 1 0.0 0.2 1911 ...

  9. 面试常问的Java虚拟机内存模型,看这篇就够了!

    一.虚拟机 同样的java代码在不同平台生成的机器码肯定是不一样的,因为不同的操作系统底层的硬件指令集是不同的. 同一个java代码在windows上生成的机器码可能是0101.......,在lin ...

  10. 【dp】动归总结

    原标题:[DP专辑]ACM动态规划总结 转载自 http://blog.csdn.net/cc_again?viewmode=list http://blog.csdn.net/cc_again/ar ...