Spark学习笔记——读写MySQL

1.使用Spark读取MySQL中某个表中的信息

build.sbt文件

name := "spark-hbase"

version := "1.0"

scalaVersion := "2.11.8"

libraryDependencies ++= Seq(

  "org.apache.spark" %% "spark-core" % "2.1.0",

  "mysql" % "mysql-connector-java" % "5.1.31",

  "org.apache.spark" %% "spark-sql" % "2.1.0"

)

Mysql.scala文件

import org.apache.spark.{SparkConf, SparkContext}

import org.apache.spark.sql.{SQLContext, SaveMode}

import java.util.Properties

/**

  * Created by mi on 17-4-11.

  */

case class resultset(name: String,

                     info: String,

                     summary: String)

object MysqlOpt {

  def main(args: Array[String]): Unit = {

    val conf = new SparkConf().setAppName("WordCount").setMaster("local")

    val sc = new SparkContext(conf)

    val sqlContext = new SQLContext(sc)

    import sqlContext.implicits._

    //定义数据库和表信息

    val url = "jdbc:mysql://localhost:3306/baidubaike?useUnicode=true&characterEncoding=UTF-8"

    val table = "baike_pages"

    //读MySQL的方法1

    val reader = sqlContext.read.format("jdbc")

    reader.option("url", url)

    reader.option("dbtable", table)

    reader.option("driver", "com.mysql.jdbc.Driver")

    reader.option("user", "root")

    reader.option("password", "XXX")

    val df = reader.load()

    df.show()

    //读MySQL的方法2

    //    val jdbcDF = sqlContext.read.format("jdbc").options(

    //      Map("url"->"jdbc:mysql://localhost:3306/baidubaike?useUnicode=true&characterEncoding=UTF-8",

    //        "dbtable"->"(select name,info,summary from baike_pages) as some_alias",

    //        "driver"->"com.mysql.jdbc.Driver",

    //        "user"-> "root",

    //        //"partitionColumn"->"day_id",

    //        "lowerBound"->"0",

    //        "upperBound"-> "1000",

    //        //"numPartitions"->"2",

    //        "fetchSize"->"100",

    //        "password"->"XXX")).load()

    //    jdbcDF.show()

  }

}

输出

2.使用Spark写MySQL中某个表中的信息

import org.apache.spark.{SparkConf, SparkContext}

import org.apache.spark.sql.{SQLContext, SaveMode}

import java.util.Properties

/**

  * Created by mi on 17-4-11.

  */

case class resultset(name: String,

                     info: String,

                     summary: String)

object MysqlOpt {

  def main(args: Array[String]): Unit = {

    val conf = new SparkConf().setAppName("WordCount").setMaster("local")

    val sc = new SparkContext(conf)

    val sqlContext = new SQLContext(sc)

    import sqlContext.implicits._

    //定义数据库和表信息

    val url = "jdbc:mysql://localhost:3306/baidubaike?useUnicode=true&characterEncoding=UTF-8"

    val table = "baike_pages"

    //写MySQL的方法1

    val list = List(

      resultset("名字1", "标题1", "简介1"),

      resultset("名字2", "标题2", "简介2"),

      resultset("名字3", "标题3", "简介3"),

      resultset("名字4", "标题4", "简介4")

    )

    val jdbcDF = sqlContext.createDataFrame(list)

    jdbcDF.collect().take(20).foreach(println)

    //    jdbcDF.rdd.saveAsTextFile("/home/mi/coding/coding/Scala/spark-hbase/output")

    val prop = new Properties()

    prop.setProperty("user", "root")

    prop.setProperty("password", "123456")

    //jdbcDF.write.mode(SaveMode.Overwrite).jdbc(url,"baike_pages",prop)

    jdbcDF.write.mode(SaveMode.Append).jdbc(url, "baike_pages", prop)

  }

}

Spark学习笔记——读写MySQL的更多相关文章

Spark学习笔记——读写Hbase
1.首先在Hbase中建立一张表,名字为student 参考 Hbase学习笔记——基本CRUD操作一个cell的值,取决于Row,Column family,Column Qualifier和Ti ...
Spark学习笔记——读写HDFS
使用Spark读写HDFS中的parquet文件文件夹中的parquet文件 build.sbt文件 name := "spark-hbase" version := " ...
spark学习笔记总结-spark入门资料精化
Spark学习笔记 Spark简介 spark 可以很容易和yarn结合,直接调用HDFS.Hbase上面的数据,和hadoop结合.配置很容易. spark发展迅猛,框架比hadoop更加灵活实用. ...
Spark学习笔记之SparkRDD
Spark学习笔记之SparkRDD 一. 基本概念 RDD(resilient distributed datasets)弹性分布式数据集. 来自于两方面 ① 内存集合和外部存储系统 ② ...
Spark学习笔记2（spark所需环境配置
Spark学习笔记2 配置spark所需环境 1.首先先把本地的maven的压缩包解压到本地文件夹中,安装好本地的maven客户端程序,版本没有什么要求不需要最新版的maven客户端. 解压完成之后 ...
Spark学习笔记3（IDEA编写scala代码并打包上传集群运行）
Spark学习笔记3 IDEA编写scala代码并打包上传集群运行我们在IDEA上的maven项目已经搭建完成了,现在可以写一个简单的spark代码并且打成jar包上传至集群,来检验一下我们的sp ...
Spark学习笔记-GraphX-1
Spark学习笔记-GraphX-1 标签: SparkGraphGraphX图计算 2014-09-29 13:04 2339人阅读评论(0) 收藏举报分类: Spark(8) 版权声明: ...
SQLMAP学习笔记2 Mysql数据库注入
SQLMAP学习笔记2 Mysql数据库注入注入流程 (如果网站需要登录,就要用到cookie信息,通过F12开发者工具获取cookie信息) sqlmap -u "URL" - ...
ref:学习笔记 UpdateXml() MYSQL显错注入
ref:https://www.cnblogs.com/MiWhite/p/6228491.html 学习笔记 UpdateXml() MYSQL显错注入在学习之前,需要先了解 UpdateXml( ...

随机推荐

java生成一次性验证码
1.编写生成验证码的工具类: import java.awt.BasicStroke;import java.awt.Color;import java.awt.Font;import java.aw ...
2016年3月1日Android实习笔记
1:经查资料,Android中gif动画加载共有两种 1)利用WebView,WebView 主要调用三个方法:LoadUrl.LoadData.LoadDataWithBaseURL 2)主要用的是 ...
linux <<eof
在平时的运维工作中,我们经常会碰到这样一个场景:执行脚本的时候,需要往一个文件里自动输入N行内容.如果是少数的几行内容,还可以用echo追加方式,但如果是很多行,那么单纯用echo追加的方式就显得愚蠢 ...
RxJava2学习笔记(2)
上一篇已经熟悉了Observable的基本用法,但是如果仅仅只是“生产-消费”的模型,这就体现不出优势了,java有100种办法可以玩这个:) 一.更简单的多线程正常情况下,生产者与消费者都在同一个 ...
OS面试题（转载）
转载自:http://placement.freshersworld.com/power-preparation/technical-interview-preparation/os-intervie ...
小程序快速部署富文本插件wxParser
为了解决html2wxml在ios下字体过大问题,又发现一个比较好用的富文本插件:wxParser. 目前 wxParser 支持对一般的富文本内容包括标题.字体大小.对齐和列表等进行解析.同时也支持 ...
mac下最简单的删除node方法是什么
sudo rm -rf /usr/local/{bin/{node,npm},lib/node_modules/npm,lib/node,share/man/*/node.*}
gitolite migration to bitbucket
https://gist.github.com/kostajh/9249937 https://designhammer.com/blog/easily-migrate-git-repositorie ...
Android夜间模式的几种实现
一.直接修改widget颜色,这种方式实现起来最简单,但需要每个控件都去修改,太过复杂.例如: /** * 相应交互,修改控件颜色 * @param view */public void onMeth ...
Spark GraphX实例(2)
5. 图的转换操作图的转换操作主要有以下的方法: (1) Graph.mapVertices():对图的顶点进行转换,返回一张新图: (2) Graph.mapEdges():对图的边进行转换,返回 ...

Spark学习笔记——读写MySQL

Spark学习笔记——读写MySQL的更多相关文章

随机推荐

热门专题