HIVE JOIN:http://blog.csdn.net/yfkiss/article/details/8073608

HIVE资料:

一条记录map阶段输出KV,shuffle sort,输出KV,最后reduce输出结果

https://skydrive.live.com/?mkt=zh-CN#!/view.aspx?cid=D04547F5707AF6F9&resid=D04547F5707AF6F9%21107&app=PowerPoint

RCFILE:http://www.csdn.net/article/2011-04-29/296900

http://www.slideshare.net/OReillyStrata/large-scale-etl-with-hadoop

HIVE DDL:https://cwiki.apache.org/Hive/languagemanual-ddl.html

删除带有表的数据库:

DROP DATABASE IF EXISTS db1 CASCADE;

删除空的数据库:

DROP DATABASE IF EXISTS db1 ;

启动hive服务:

hive --service hiveserver

上面的开启服务是针对hive0.9版本的

0.11版本的hive是如下命令:

hive --service hiveserver2(协议不一样)

JDBC链接HIVE:

https://cwiki.apache.org/Hive/hiveclient.html

  1. import java.sql.SQLException;
  2. import java.sql.Connection;
  3. import java.sql.ResultSet;
  4. import java.sql.Statement;
  5. import java.sql.DriverManager;
  6.  
  7. public class HiveJdbcClient {
  8. private static String driverName = "org.apache.hadoop.hive.jdbc.HiveDriver";
  9.  
  10. /**
  11. * @param args
  12. * @throws SQLException
  13. */
  14. public static void main(String[] args) throws SQLException {
  15. try {
  16. Class.forName(driverName);
  17. } catch (ClassNotFoundException e) {
  18. // TODO Auto-generated catch block
  19. e.printStackTrace();
  20. System.exit(1);
  21. }
  22. Connection con = DriverManager.getConnection("jdbc:hive://localhost:10000/default", "", "");
  23. Statement stmt = con.createStatement();
  24. // String tableName = "testHiveDriverTable";
  25. // stmt.executeQuery("drop table " + tableName);
  26. // ResultSet res = stmt.executeQuery("create table " + tableName + " (key int, value string)");
  27. // show tables
  28. // String sql = "show tables '" + tableName + "'";
  29. // System.out.println("Running: " + sql);
  30. // res = stmt.executeQuery(sql);
  31. // if (res.next()) {
  32. // System.out.println(res.getString(1));
  33. // }
  34. stmt.executeQuery("use etl_sales_db");
  35. // describe table
  36. // sql = "describe " + tableName;
  37. // System.out.println("Running: " + sql);
  38. // res = stmt.executeQuery(sql);
  39. // while (res.next()) {
  40. // System.out.println(res.getString(1) + "\t" + res.getString(2));
  41. // }
  42.  
  43. // load data into table
  44. // NOTE: filepath has to be local to the hive server
  45. // NOTE: /tmp/a.txt is a ctrl-A separated file with two fields per line
  46. /* String filepath = "/tmp/a.txt";
  47. sql = "load data local inpath '" + filepath + "' into table " + tableName;
  48. System.out.println("Running: " + sql);
  49. res = stmt.executeQuery(sql); */
  50.  
  51. // select * query
  52. String sql = "select count(*) from " + "item";
  53. System.out.println("Running: " + sql);
  54. ResultSet res = stmt.executeQuery(sql);
  55. // while (res.next()) {
  56. // System.out.println(String.valueOf(res.getInt(1)) + "\t" + res.getString(2));
  57. // }
  58. if (res.next()) {
  59. System.out.println(res.getString(1));
  60. }
  61.  
  62. // regular hive query
  63. // sql = "select count(1) from " + tableName;
  64. // System.out.println("Running: " + sql);
  65. // res = stmt.executeQuery(sql);
  66. // while (res.next()) {
  67. // System.out.println(res.getString(1));
  68. // }
  69. }
  70. }

  

hive相关的更多相关文章

  1. Hive相关集锦

    Hive介绍 http://www.cnblogs.com/sharpxiajun/archive/2013/06/02/3114180.htmlHive的数据类型和数据模型 http://www.c ...

  2. 3. Hive相关知识点

    以下是阅读<Hive编程指南>后整理的一些零散知识点: 1. 有时候用户需要频繁执行一些命令,例如设置系统属性,或增加对于Hadoop的分布式内存,加入自定的Hive扩展的Jave包(JA ...

  3. Hive相关知识点

    ---恢复内容开始--- 转载:Hive 性能优化 介绍 首先,我们来看看Hadoop的计算框架特性,在此特性下会衍生哪些问题? 数据量大不是问题,数据倾斜是个问题. jobs数比较多的作业运行效率相 ...

  4. Spark、Hadoop、Hive相关文章

    1.Spark On Yarn(HDFS HA)详细配置过程 2.Hive安装与配置详解

  5. hive中行转换成列以及hive相关知识

    Hive语句: Join应该把大表放到最后 左连接时,左表中出现的JOIN字段都保留,右表没有连接上的都为空.对于带WHERE条件的JOIN语句,例如: 1 SELECT a.val, b.val F ...

  6. Hive相关随笔

    1).Hive中Select Top N的实现 Hive中使用 Order by + Limit 可以很容易地实现Select Top N. 但是在Hive中Order by只能使用1个Reduce, ...

  7. hive 相关异常

    内存不够: set mapreduce.map.memory.mb=4096;set mapreduce.map.java.opts=-Xmx3280m; set mapreduce.reduce.m ...

  8. Hive相关的命令

    hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,可以将sql语句转换为MapReduce任务进行运行. 其优点是学习成本低,可以通过 ...

  9. HIVE教程

    完整PDF下载:<HIVE简明教程> 前言 Hive是对于数据仓库进行管理和分析的工具.但是不要被“数据仓库”这个词所吓倒,数据仓库是很复杂的东西,但是如果你会SQL,就会发现Hive是那 ...

随机推荐

  1. yii2 登录验证

  2. AsyncTask内的各个方法调用顺序

    |- AsyncTask内的各个方法调用顺序:|- 首先,用户调用execute方法,启动AsyncTask .然后在execute方法中:|- 首先调用onPreExecute方法,执行初始化操作. ...

  3. Ubuntu的安装与配置

    一.Ubuntu的安装与配置 Ubuntu 快速下载地址 1.安装VMwareTools 系统安装后,工具栏"虚拟机"-->"安装VMwareTools" ...

  4. LINQ教程

    在说LINQ之前必须先说说几个重要的C#语言特性 一:与LINQ有关的语言特性 1.隐式类型 (1)源起 在隐式类型出现之前, 我们在声明一个变量的时候, 总是要为一个变量指定他的类型 甚至在fore ...

  5. [Bug] 解决透明 Activity 在 Android 6.0 背景不透明

    如何复现 连续启动两个 Activity ,其中 Activity 1 为 不透明 的 Activity Activity 2 为 透明 的 Activity 通常用于引导页面,例如:豌豆夹锁屏引导用 ...

  6. Unable to the boot Simulator ! Mac开机现“CoreTelephony Trace File Error”,

    OS X升级到El Capitan之后,提供一个跟安全相关的模式叫SIP(System Integrity Protection),又称rootless mode,这个新功能在強化OS X的安全性,它 ...

  7. C/C++ 结构体 指针 简单输入输出

    #include <stdio.h> #include <stdlib.h> struct student{ int num; ]; double dec; }; int ma ...

  8. ASPX.Net控件

    简单控件 Label :显示文字,编译后的元素的为span 主要设置属性边框包括边框颜色,边框样式,边框粗细 Liteal :显示文字,编译后不会产生任何元素,一般用来从后台输出JS代码 Textbo ...

  9. mybatis里的foreach语句

    相信用了Mybatis的朋友们,都曾有一个疑惑,就是foreach是怎么用的,下面我就简单讲讲我的理解: foreach主要用在SQL语句中迭代一个集合.foreach元素的属性主要由item,ind ...

  10. css实现三角效果

    demo     <!DOCTYPE html> <html lang="zh"> <head> <meta charset=utf-8& ...