1、通过反射的方式 使用反射来推断包含特定数据类型的RDD,这种方式代码比较少,简洁,只要你会知道元数据信息时什么样,就可以使用了

代码如下:

  1. import org.apache.spark.sql.{SQLContext, SaveMode}
  2. import org.apache.spark.{SparkConf, SparkContext}
  3.  
  4. object RDD2DataFrame {
  5. def main(args: Array[String]): Unit = {
  6. val conf = new SparkConf().setAppName("DF").setMaster("local")
  7. val sc = new SparkContext(conf)
  8. val sQLContext = new SQLContext(sc)
  9. //创建一个普通的RDD
  10. val rdd = sc.textFile("D:\\data\\spark\\students.txt")
  11. var rdd2= rdd.map(t=>{
  12. val lines = t.split(",")
  13. studented(lines(0).toInt,lines(1),lines(2).toInt)
  14.  
  15. })
  16. //注意:需要导入隐式转换
  17. import sQLContext.implicits._
  18. val df = rdd2.toDF()
  19. //注册临时表
  20. df.registerTempTable("student")
  21. val dfs = sQLContext.sql("select name from student where age>18")
  22. dfs.write.mode(SaveMode.Append).text("D:\\result\\Rdd2DataFrame")
  23.  
  24. }
  25.  
  26. }
  27. case class studented(id:Int,name:String,age:Int)

  

2、通过编程接口的方式 你可以自己动态的构建一份元数据,这种代码比较多,但是适合你不知道元数据的时候使用,一般都用这种方式

代码如下:

  1. object RDD2DataFrame2 {
  2. def main(args: Array[String]): Unit = {
  3. val conf = new SparkConf().setAppName("df02").setMaster("local")
  4. val sc = new SparkContext(conf)
  5. val sqlContext = new SQLContext(sc)
  6. //val df = sqlContext.read.json("D:\\data\\spark\\students.json")
  7.  
  8. val rdd = sc.textFile("D:\\data\\spark\\students.txt")
  9. val rowRdd = rdd.map(t => {
  10. val str = t.split(",")
  11. Row(str(0).toInt, str(1), str(2).toInt)
  12. })
  13. //构建StructType
  14. val structType = StructType(Array(StructField("id", IntegerType, true),
  15. StructField("name", StringType, true),
  16. StructField("age", IntegerType, true)
  17. ))
  18. //创建DataFrame
  19. val df: DataFrame = sqlContext.createDataFrame(rowRdd,structType)
  20. df.registerTempTable("stu")
  21. val sql = sqlContext.sql("select * from stu where age>17")
  22. sql.rdd.foreach(println)
  23. }
  24. }

  

分别用反射、编程接口的方式创建DataFrame的更多相关文章

  1. JAVA SparkSQL初始和创建DataFrame的几种方式

    建议参考SparkSQL官方文档:http://spark.apache.org/docs/latest/sql-programming-guide.html 一.前述       1.SparkSQ ...

  2. 【Spark篇】---SparkSQL初始和创建DataFrame的几种方式

    一.前述       1.SparkSQL介绍 Hive是Shark的前身,Shark是SparkSQL的前身,SparkSQL产生的根本原因是其完全脱离了Hive的限制. SparkSQL支持查询原 ...

  3. Spark SQL初始化和创建DataFrame的几种方式

    一.前述       1.SparkSQL介绍 Hive是Shark的前身,Shark是SparkSQL的前身,SparkSQL产生的根本原因是其完全脱离了Hive的限制. SparkSQL支持查询原 ...

  4. Android 反射-换一种方式编程

    Android 反射-换一种方式编程 转载请标明出处:http://blog.csdn.net/zhaoyanjun6/article/details/59109933 本文出自[赵彦军的博客] 上一 ...

  5. mybatis --- 以接口的方式进行编程

    );  我们来学习下接口方式的编程. 接口类IBookDao.java package com.mybatis.dao; import com.mybatis.model.Book; public i ...

  6. VB 在Visio 2010 以编程方式创建子进程图

    在2010年Visio以编程方式创建子进程图 Office 2010  https://msdn.microsoft.com/en-us/library/gg650651.aspx   简介: 学习如 ...

  7. Android开发之UI的编程方式创建

    我们知道,android中一个activity对应一个xml的UI配置文件,除了用xml文件配置的方式创建用户界面外,还可以使用代码编程的方式来创建一个用户界面.如果用户界面需要在运行过程中动态生成的 ...

  8. 使用Callable接口创建线程和使用线程池的方式创建线程

    1.使用Callable接口的方式实现多线程,这是JDK5.0新增的一种创建多线程的方法 package com.baozi.java2; import java.util.concurrent.Ca ...

  9. Java8内置的函数式编程接口应用场景和方式

    首先,我们先定义一个函数式编程接口 @FunctionalInterface public interface BooleanFunctionalInterface<T> { boolea ...

随机推荐

  1. Linux命令之查看服务进程(ps aux、ps -aux、ps -ef)的运用

    执行ps命令即可列出的是当前服务器进程的快照(时间点),如果想要实时动态的显示进程信息,就可以使用top命令. linux上进程有5种状态:  1. 运行(正在运行或在运行队列中等待)  2. 中断( ...

  2. Office加载项安装

    出自我的个人主页 Alvin Blog 前言 Excel加载项离不开安装,Excel加载项本身安装及其简单,但这是在申请下来Office开发者账户之后,再次之前都得自行安装 线上安装 微软申请开发者账 ...

  3. redhat7.3忘记root密码后如何重置root密码

    redhat7系如果忘记root密码,重置密码方法与redhat6系不同! 1.开机启动系统,在grub选择启动内核项时 按‘e’进入编辑模式 2.这时看到的参数并不全,要按上下键滚动显示, 3.在l ...

  4. 504. Inverted Index (Map Reduce) lintcode

    https://www.lintcode.com/problem/inverted-index-map-reduce/description -- decription of the map redu ...

  5. 触发transition的几种方式--转

    鼠标单击 获取焦点 或元素发生任何改变,怎么说呢,目前的理解是,元素发生了什么改变,使得它跟以前不一样了.比如同样是p元素,先有一个样式.后来这个p被hover了.被focus了.或者通过另外一条途径 ...

  6. percona-toolkit 工具集安装

    下载地址: www.percona.com/downloads/percona-toolkit     安装方法一,源码安装: perl Makefile.PL make:make install   ...

  7. framework7 手风琴页面有滚动条时再次点开手风琴item滑动里面内容消失的解决方法

    在手风琴的ul外面的div加入最小高度min-height:1000px,问题解决 示例代码: <div class="list-block accordion-list" ...

  8. 关于Content-Type: multipart/form-data的支持

    关于Content-Type: multipart/form-data的支持  发布于 537天前  作者 yzhang226  303 次浏览  复制  上一个帖子  下一个帖子  标签: 无 今天 ...

  9. Poj(2312),坦克大战,BFS的变形

    题目链接:http://poj.org/problem?id=2312 挺有趣的一道题目,然而很容易WA,我就WA了一次,虽然我Debug的时候已经知道哪里出问题了,就是比如说我搜到B和E时,从B搜第 ...

  10. sql server 基础

    1 .左连接 select a.* ,b.* from student as aleft join hobby as bon a.hobbyid=b.hobbyid 2. 右 连接 select a. ...