spark操作hive方式(scala)

第一种方式:

def operatorHive: Unit = {

    Class.forName("org.apache.hive.jdbc.HiveDriver")

    val url = "jdbc:hive2://192.168.2.xxx:10000"

    val connection: Connection = DriverManager.getConnection(url, "root", "diagbotkwz@123")

    val createStatement: Statement = connection.createStatement()

    val query: ResultSet = createStatement.executeQuery("select * from diagbot.ord_lis_trend limit 2")

    while (query.next()) {

      println(query.getString(1))

    }

  }

第二种方式:

object SparkOperaterHive {

  val sparkConf: SparkConf = new SparkConf().setAppName(SparkOperaterHive.getClass.getSimpleName)

  val sparkSession: SparkSession = SparkSession.builder().config(sparkConf).enableHiveSupport().getOrCreate()

  val sc: SparkContext = sparkSession.sparkContext

  val sqlContext: SQLContext = sparkSession.sqlContext

  def main(args: Array[String]) {

    import sparkSession.implicits._

    val sql1: DataFrame = sparkSession.sql("select * from janggan.diagnosismedication")

    val properties: Properties = new Properties()

    properties.put("user", "root")

    properties.put("password", "diagbot@20180822")

    properties.put("driver", "com.mysql.jdbc.Driver")

    //    sql1.write.mode(SaveMode.Append).jdbc(url,"doc_info_hive",properties)

    println("总数为:" + sql1.count())

    println("sddhdj" + sql1.columns(1))

    sparkSession.stop()

  }

}

spark操作hive方式(scala)的更多相关文章

Spark之使用SparkSql操作Hive的Scala程序实现
依赖 <dependency> <groupId>org.apache.spark</groupId> <artifactId>spark-hive_2 ...
Spark 操作Hive 流程
1.ubuntu 装mysql 2.进入mysql: 3.mysql>create database hive (这个将来是存你在Hive中建的数据库以及表的信息的(也就是元数据))mysql ...
spark 操作Hive时遇到的问题
To adjust logging level use sc.setLogLevel(newLevel). For SparkR, use setLogLevel(newLevel).17/10/14 ...
Docker搭建大数据集群 Hadoop Spark HBase Hive Zookeeper Scala
Docker搭建大数据集群给出一个完全分布式hadoop+spark集群搭建完整文档,从环境准备(包括机器名,ip映射步骤,ssh免密,Java等)开始,包括zookeeper,hadoop,hiv ...
spark 操作hive
1.hive动态分区,只需进行以下设置 val spark = SparkSession.builder() .appName("hivetest") .master(" ...
spark SQL学习（spark连接hive）
spark 读取hive中的数据 scala> import org.apache.spark.sql.hive.HiveContext import org.apache.spark.sql. ...
大数据学习day25------spark08-----1. 读取数据库的形式创建DataFrame 2. Parquet格式的数据源 3. Orc格式的数据源 4.spark_sql整合hive 5.在IDEA中编写spark程序（用来操作hive） 6. SQL风格和DSL风格以及RDD的形式计算连续登陆三天的用户
1. 读取数据库的形式创建DataFrame DataFrameFromJDBC object DataFrameFromJDBC { def main(args: Array[String]): U ...
数仓Hive和分布式计算引擎Spark多整合方式实战和调优方向
@ 目录概述 Spark on Hive Hive on Spark 概述编译Spark源码配置调优思路编程方向分组聚合优化 join优化数据倾斜任务并行度小文件合并 CBO 谓词下 ...
Spark&Hive：如何使用scala开发spark访问hive作业，如何使用yarn resourcemanager。
背景: 接到任务,需要在一个一天数据量在460亿条记录的hive表中,筛选出某些host为特定的值时才解析该条记录的http_content中的经纬度: 解析规则譬如: 需要解析host: api.m ...

随机推荐

面向对象分析与设计—OOD部分
第三部分面向对象设计 3.1 面向对象设计(OOD)的定义? 在面向对象分析阶段,已经针对用户需求建立起用面向对象概念描述的系统分析模型.在设计阶段,要考虑为实现系统而采用的计算机设备.操作系统.网 ...
Linux基础-04-权限
1. 查看文件的权限 1) 使用ls –l命令查看文件上所设定的权限. -rw-r--r-- 1 root root 605 Mar 18 20:28 .jp1.tar.gz 权限信息属主属组文 ...
Linux中光标消失解决办法
假如Linux下光标消失,不要急: echo -e "\033[?25l" 隐藏光标 echo -e "\033[?25h" 显示光标 (转载自:https: ...
使用postman mock server
需要写一个小的Java程序,用来调用云平台的接口由于云平台的接口程序还没有写好,只能用模拟的方式先行开发代码, 用了post来模拟接口程序. 需要模拟的接口如下: ■请求地址 /openapi/ip ...
Springboot笔记01——Springboot简介
一.什么是微服务在了解Springboot之前,首先我们需要了解一下什么是微服务. 微服务是一种架构风格(服务微化),是martin fowler在2014年提出来的.微服务简单地说就是:一个应用应 ...
CSS ,flex： 1的用处
flex: 1:的妙用首先 flex 是 flex-grow.flex-shrink.flex-basis的缩写. 当 flex 取值为一个非负数字,则该数字为 flex-grow 值,flex- ...
idea+maven使用
maven 1. 打开软件,点击configure-project default-settings.配置maven目录. 后续还需要配置一个地方是本地仓库的优先,在runner-VM Options ...
c语言二进制、八进制、十六进制
int binary = 0b01000010; //二进制 printf("%d\n", binary); //十进制 printf("0x%x\n", 0x ...
java - day013 - 流, FileInputStream, BufferedInputStream,
流 Stream 把数据的读写,抽象成数据在管道中流动. 流是单向的输入流, 只能用来读取数据输出流, 只能用来输出数据流只能顺序读写数据流只能一次性从头到尾读写数据流动过的数据,不能反复流 ...
动态规划——python
1.爬楼梯问题一个人爬楼梯,每次只能爬1个或两个台阶,假设有n个台阶,那么这个人有多少种不同的爬楼梯方法动态规划的状态转移:第 i 个状态的方案数和第 i-1, i-2时候的状态有关,即:dp[i] ...

spark操作hive方式(scala)

spark操作hive方式(scala)的更多相关文章

随机推荐

热门专题