hive中建立外部分区表,外部数据格式是json的如何导入呢?

json格式的数据表不必含有分区字段,只需要在hdfs目录结构中体现出分区就可以了

This is all according to this guide: http://blog.cloudera.com/blog/2012/12/how-to-use-a-serde-in-apache-hive/

  1. hive> ADD JAR /home/hadoop/hive-serdes-1.0-SNAPSHOT.jar;
  2. Added /home/hadoop/hive-serdes-1.0-SNAPSHOT.jar to class path
  3. Added resource: /home/hadoop/hive-serdes-1.0-SNAPSHOT.jar

In /tmp/new I have a file abc.json

The CREATE EXTERNAL TABLE command runs properly, but it doesn't take in any data:

  1. hive>
  2. > CREATE EXTERNAL TABLE tweets (
  3. > id BIGINT,
  4. > created_at STRING,
  5. > source STRING,
  6. > favorited BOOLEAN,
  7. > retweeted_status STRUCT<
  8. > text:STRING,
  9. > user:STRUCT<screen_name:STRING,name:STRING>,
  10. > retweet_count:INT>,
  11. > entities STRUCT<
  12. > urls:ARRAY<STRUCT<expanded_url:STRING>>,
  13. > user_mentions:ARRAY<STRUCT<screen_name:STRING,name:STRING>>,
  14. > hashtags:ARRAY<STRUCT<text:STRING>>>,
  15. > text STRING,
  16. > user STRUCT<
  17. > screen_name:STRING,
  18. > name:STRING,
  19. > friends_count:INT,
  20. > followers_count:INT,
  21. > statuses_count:INT,
  22. > verified:BOOLEAN,
  23. > utc_offset:INT,
  24. > time_zone:STRING>,
  25. > in_reply_to_screen_name STRING
  26. > )
  27. > PARTITIONED BY (datehour INT)
  28. > ROW FORMAT SERDE 'com.cloudera.hive.serde.JSONSerDe'
  29. > LOCATION '/tmp/new';
  30. OK
  31. Time taken: 0.142 seconds

注意外部分区表需要手工添加分区

具体步骤

  1. .) Run the create table statement.
  2. .) In the directory /tmp/new/ create a sub directory datehour=<some int value>, and then put your .json file inside this.这里就是说只需要在hdfs上建立目录,目录体现分区信息,将数据放到对应目录,然后直接add partiton就好了
  3. .) Run alter table statement adding this partition to metadata:
  4. alter table tweets add partition(datehour=<some int value>);
  5. .) Now run the select statement.

hive中导入json格式的数据(hive分区表)的更多相关文章

  1. asp.net MVC控制器中返回JSON格式的数据时提示下载

    Asp.net mvc在接收的是JSON格式的数据,但是奇怪的是在IE中提示下载文件,其他浏览器中一切正常,下载后,里面的内容就是在控制器中返回的数据.代码如下: 视图中js代码: $("# ...

  2. 在IE中MVC控制器中返回JSON格式的数据时提示下载

    最近做项目时,视图中用jquery.form.js异步提交表单时,接收的是JSON格式的数据,但是奇怪的是在IE中提示下载文件,其他浏览器中一切正常,下载后,里面的内容就是在控制器中返回的数据.代码如 ...

  3. 解决在IE中返回JSON格式的数据时提示下载的问题

    如题,以ASP.NET MVC为例,解决办法如下: 控制器中: public JsonResult Test() { return Json(json, "text/html"); ...

  4. ssm框架中处理json格式的数据步骤

    1.导架包 <!--处理json--> <dependency> <groupId>com.fasterxml.jackson.core</groupId&g ...

  5. Spring拦截器从Request中获取Json格式的数据

    7 package com.newpp.core.interceptor; 8 9 import java.io.BufferedReader; 10 import java.io.ByteArray ...

  6. hive中创建hive-json格式的表及查询

    在hive中对于json的数据格式,可以使用get_json_object或json_tuple先解析然后查询. 也可以直接在hive中创建json格式的表结构,这样就可以直接查询,实战如下(hive ...

  7. JSON(五)——同步请求中使用JSON格式字符串进行交互(不太常见的用法)

    在同步请求中使用JSON格式进行数据交互的场景并不多,同步请求是浏览器直接与服务器进行数据交互的大多是用jsp的标签jstl和el表达式对请求中的数据进行数据的渲染.我也是在一次开发中要从其它服务器提 ...

  8. JSON(四)——异步请求中前后端使用Json格式的数据进行交互

    json格式的数据广泛应用于异步请求中前后端的数据交互,本文主要介绍几种使用场景和使用方法. 一,json格式字符串 <input type="button" id=&quo ...

  9. Hive中导入Oracle数据错误:Listener refused the connection with the following error: ORA-12505

    问题: 今天往Hive中导入Oracle数据的时候碰到了如下错误:Listener refused the connection with the following error: ORA-12505 ...

随机推荐

  1. C语言判断文件是否存在(转)

    int   access(const   char   *filename,   int   amode); amode参数为0时表示检查文件的存在性,如果文件存在,返回0,不存在,返回-1. 这个函 ...

  2. JQuery 操作对象的属性值

    通过JQuery去操作前台对象(div,span...)的属性是很常见的事情,本文就简单的介绍几种操作情形. 1):通过属性值去获取对象 2):用JQuery去修改对象的属性值 3):获取并修改对象的 ...

  3. MFC GDI绘图基础

    一.关于GDI的基本概念 什么是GDI? Windows绘图的实质就是利用Windows提供的图形设备接口GDI(Graphics Device Interface)将图形绘制在显示器上. 在Wind ...

  4. 【Android开发日记】Popupwindow 完美demo

    Popupwindow 完美demo实现 图示: 关键代码说明: 1.弹出popupwindow,背景变暗 ColorDrawable cd = new ColorDrawable(0x000000) ...

  5. 浅谈C++多态性

    本文转载至http://blog.csdn.net/hackbuteer1/article/details/7475622 总结: (1)区分概念:    重载----同一个类中,相同的函数名字,不同 ...

  6. C# 静态方法和非静态方法

    转载:http://www.cnblogs.com/mikelij/archive/2010/08/13/1798578.html 本文将围绕c#静态方法和实例方法讨论一下.针对一些观点,如:&quo ...

  7. Django学习笔记之一

    一.Windows下安装 Django 1.下载安装包解压后放到本地目录如C:\Django-1.7.2 官网地址:https://www.djangoproject.com/download/ 2. ...

  8. # asp.net core 1.0 项目结构

    1.环境 开发:VS2015 平台:window 7 2.解决方案级别结构 创建一个ASP.NET 5 Template Empty项目: src:存放项目(projects) global.json ...

  9. Git pull 强制覆盖本地文件

    git fetch --all git reset --hard origin/master git pull

  10. java工厂模式实例化class

    import java.io.*; import java.util.*; interface fruit { public abstract void eat(); } class Apple im ...