Scala2.11.8 spark2.3.1 mongodb connector 2.3.0

import java.sql.DriverManager

import com.mongodb.spark._

import org.apache.spark.SparkConf

import org.apache.spark.sql.SparkSession

object mongospark20180830consume_amount {

  // 关于记录多个相同字段的处理方法 https://blog.csdn.net/qq_14950717/article/details/62425563

  // https://blog.csdn.net/qq_27234661/article/details/78344435?locationNum=3&fps=1

  def main(args: Array[String]): Unit = {

   // val mgohost = "dds-m5e6e56a3b0cf7b42784-pub.mongodb.rds.aliyuncs.com"

   // spark-submit --driver-class-path /usr/local/jdk/lib/mysql-connector-java-5.1.46.jar   --packages org.mongodb.spark:mongo-spark-connector_2.11:2.3.0 --class  "mongospark20180830consume_amount"  /testdata/u3.jar

    //  "org.mongodb.spark" %% "mongo-spark-connector" % "2.3.0",

  //  val conn = DriverManager.getConnection(url)

    val conf = new SparkConf().setAppName("appName").setMaster("local")

    val sparkConf = new SparkConf().setAppName("adver").setMaster("local[*]")

    val spark = SparkSession.builder().config(sparkConf).enableHiveSupport().getOrCreate()

    val inputUri="mongodb://saas:saas2018yundinglixin@dds-m5e6e56a3b0cf7b42784-pub.mongodb.rds.aliyuncs.com:3717/saas.elemeterPowerHistory"

    val df=spark.read.format("com.mongodb.spark.sql").options(

      Map("spark.mongodb.input.uri" -> inputUri,

        "spark.mongodb.input.partitioner" -> "MongoPaginateBySizePartitioner",

        "spark.mongodb.input.partitionerOptions.partitionKey"  -> "_id",

        "spark.mongodb.input.partitionerOptions.partitionSizeMB"-> ""))

      .load()

    val currentTimestamp = System.currentTimeMillis()

    val df2 = df.select("time".toString,"uuid".toString,"consume_amount".toString,"room_id".toString)

      .toDF("time","uuid","consume_amount","room_id")

    spark.sql("use saas")

    df2.write.mode("overwrite").saveAsTable("consume_amount20180831")

//       df2.foreach(println)

//

//    val rddf=spark.sql( "select uuid,from_unixtime(cast(`time`/1000 AS bigint),'yyyyMMddHH'),consume_amount from consume where time>=1533115788000").toDF("uuid", "time","consume_amount")

//

  //  spark.sql("use saas")

//

//    rddf.write.saveAsTable("consume_amount20180830")

//   // val p=df.printSchema()

//

//   // val select=spark.sql("select s.sn,s.uuid,e.time,e.consume_amount from staonly2  s join elem e on s.uuid=e.uuid").take(10)

//    val select=spark.sql("select consume_amount from elem limit 5").take(5)

//     select.foreach(println)

  }

}

Scala2.11.8 spark2.3.1 mongodb connector 2.3.0的更多相关文章

Eclipse+maven+scala2.11.8+spark2.0.0的环境部署
主要在maven-for-scalaIDE纠结了,因为在eclipse版本是luna4.x 里面有自己带有的maven. 根据网上面无脑的下一步下一步,出现了错误,在此讲解各个插件的用途,以此新人看见 ...
MongoDB Connector for Hadoop
MongoDB Connector for Hadoop https://github.com/mongodb/mongo-hadoop Purpose The MongoDB Connector f ...
centos+scala2.11.4+hadoop2.3+spark1.3.1环境搭建
一.Java安装 1.安装包准备: 首先到官网下载jdk,http://www.oracle.com/technetwork/java/javase/downloads/jdk7-downloads- ...
IntelliJ IDEA13.1.3+Scala2.11.1环境搭建
fesh个人实践,欢迎经验交流!本文Blog地址:http://www.cnblogs.com/fesh/p/3805611.html Intellij IDEA的使用性非常好,是一个非常优秀的IDE ...
安装Scala-2.11.7——集群学习日记
前言在安装Spark之前,我们需要安装Scala语言的支持.在此我选择的是scala-2.11.7版本. scala-2.11.7下载为了方便,我现在我的SparkMaster主机上先安装,把目录 ...
mongoDB BI 分析利器 - PostgreSQL FDW (MongoDB Connector for BI)
背景 mongoDB是近几年迅速崛起的一种文档型数据库,广泛应用于对事务无要求,但是要求较好的开发灵活性,扩展弹性的领域,. 随着企业对数据挖掘需求的增加,用户可能会对存储在mongo中的数据有挖掘需 ...
spark学习6（Centos下Scala2.11.4安装）
Centos下Scala安装上传Scala到/usr/scala目录下 [root@spark1 scala]# chmod u+x scala-2.11.4.tgz #修改权限 [root@spa ...
解决com.mongodb.MongoException$CursorNotFound: cursor 0 not found on server
背景经常需要执行脚本调用Java程序读取mongodb中数据,本来是转为后台进程.偶尔看看日志的简单任务.今天发现程序抛出异常“com.mongodb.MongoException$CursorNo ...
《转》CentOS7 安装MongoDB 3.0server (3.0的优势)
1.下载&安装 MongoDB 3.0 正式版本号公布!这标志着 MongoDB 数据库进入了一个全新的发展阶段,提供强大.灵活并且易于管理的数据库管理系统.MongoDB宣称.3.0新版本号 ...

随机推荐

iOS开发中多线程断点下载大文件
主要思想,就是创建一个与目标文件等大小的空白文件,然后分段往这个空白文件中写入数据. 可以通过发送HEAD请求,获得服务器中文件的具体大小,然后再将这样的长度分割成若干等大的数据块,在发送get请求时 ...
Android开发（一）——全屏或者取消标题栏
先介绍去掉标题栏的方法: 第一种:也一般入门的时候经常使用的一种方法 requestWindowFeature(Window.FEATURE_NO_TITLE);//去掉标题栏注意这句一定要写在se ...
ftp 自动上传数据库备份文件
将备份好的数据库文件传到另一个电脑上,自动上传数据库备份文件 #!/bin/bash # ####################################################### ...
git学习(五)：git diff魔法
不同参数下git diff输出并不相同,理解了工作区,暂存区和版本库的关系之后就很容易理解diff了. 工作区.暂存区和版本库的目录树浏览清除工作区中未被git管理的文件 git clean -fd ...
Mask R-CNN详解和安装
Detectron是Facebook的物体检测平台,今天宣布开源,它基于Caffe2,用Python写成,这次开放的代码中就包含了Mask R-CNN的实现. 除此之外,Detectron还包含了IC ...
Pass的通用指令开关
LOD: 设置:单个设置Shader.maximumLOD.全局设置Shader.globalMaximumLOD.QualitySettings里面的Maximum LODLevel 原理:小于指定 ...
Android训练课程(Android Training) - NFC基础
NFC 基础本文档介绍了在Android上的基本的NFC任务.它说明了如何发送和接收的NDEF消息(NDEF messages)的形式的表单里包含的NFC数据(NFC data),并介绍Androi ...
C#获取MySql 数据常用的代码
1.读取 public DataTable ExecuteDataTable(string SQLString) { using (MySqlConnection connection = new M ...
webpack9--删除冗余的CSS
我们在写代码的时候可能有些CSS并没有用到,我们如何利用webpack将冗余的CSS清除掉呢? 可以使用 purifycss-webpack 达到该目的. 1.安装 purifycss-webpack ...
combobox无法显示选中的数据，都是undefined
$('#firstfactor').combobox({ url: '@Url.Action("GetMultiAirFactor_Day_New", ...

Scala2.11.8 spark2.3.1 mongodb connector 2.3.0

Scala2.11.8 spark2.3.1 mongodb connector 2.3.0的更多相关文章

随机推荐

热门专题