spark读写Sequoiadb

spark如何读写Sequoiadb,最近被客户问多了，这个记录下。

Spark读Sequoiadb数据：

package marketing

import com.sequoiadb.hadoop.io.BSONWritable

import com.sequoiadb.hadoop.mapreduce.SequoiadbInputFormat

import org.apache.hadoop.conf.Configuration

import org.apache.spark.{SparkContext, SparkConf}

/**

  * Created by joy on 2015/12/15.

  */

object Read extends App {

    val conf = new SparkConf().setAppName("cgbdata").

      setMaster("local").registerKryoClasses(Array(classOf[BSONWritable]))

    val sc = new SparkContext(conf)

    val hadoopConfig = new Configuration()

    hadoopConfig.set("sequoiadb.input.url","master:11810,slave1:11810,slave2:11810")

    hadoopConfig.set("sequoiadb.in.collectionspace","default")

    hadoopConfig.set("sequoiadb.in.collection","bar")

    val sdbRDD = sc.newAPIHadoopRDD[Object,BSONWritable,SequoiadbInputFormat](hadoopConfig,classOf[SequoiadbInputFormat],classOf[Object], classOf[BSONWritable])

    sdbRDD.map(_._2.getBson).collect.map(println)

    sc.stop()

}

Spark写Sequoiadb

package marketing

import com.sequoiadb.hadoop.io.BSONWritable

import com.sequoiadb.hadoop.mapreduce.SequoiadbOutputFormat

import org.apache.hadoop.conf.Configuration

import org.apache.hadoop.io.{NullWritable, IntWritable}

import org.apache.spark.{SparkConf, SparkContext}

import org.bson.BasicBSONObject

import org.bson.types.ObjectId

/**

 * Hello world!

 *

 */

object Save extends App {

  val sparkconf = new SparkConf().setMaster("local[2]").setAppName("save").registerKryoClasses(Array(classOf[BSONWritable]))

  val sc = new SparkContext(sparkconf)

  var data = sc.parallelize(List((NullWritable.get(),new BSONWritable(new BasicBSONObject("name","gaoxing")))))

  val config = new Configuration()

  config.set("sequoiadb.output.url","master:11810")

  config.set("sequoiadb.out.collectionspace","foo")

  config.set("sequoiadb.out.collection","bar")

  data.saveAsNewAPIHadoopFile("",classOf[NullWritable],classOf[BSONWritable],classOf[SequoiadbOutputFormat],config)

}

spark读写Sequoiadb的更多相关文章

Spark 读写hive 表
spark 读写hive表主要是通过sparkssSession 读表的时候,很简单,直接像写sql一样sparkSession.sql("select * from xx") 就 ...
Spark读写HBase
Spark读写HBase示例 1.HBase shell查看表结构 hbase(main)::> desc 'SDAS_Person' Table SDAS_Person is ENABLED ...
使用Spark读写CSV格式文件（转）
原文链接:使用Spark读写CSV格式文件 CSV格式的文件也称为逗号分隔值(Comma-Separated Values,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号.在本文中的CSV格 ...
spark读写mysql
spark读写mysql除官网例子外还要指定驱动名称 travels.write .mode(SaveMode.Overwrite) .format("jdbc") .option ...
Spark读写ES
本文主要介绍spark sql读写es.structured streaming写入es以及一些参数的配置 ES官方提供了对spark的支持,可以直接通过spark读写es,具体可以参考ES Spar ...
Spark读写Hbase的二种方式对比
作者:Syn良子出处:http://www.cnblogs.com/cssdongl 转载请注明出处一.传统方式这种方式就是常用的TableInputFormat和TableOutputForm ...
Spark读写Hbase中的数据
def main(args: Array[String]) { val sparkConf = new SparkConf().setMaster("local").setAppN ...
spark读写hbase性能对比
一.spark写入hbase hbase client以put方式封装数据,并支持逐条或批量插入.spark中内置saveAsHadoopDataset和saveAsNewAPIHadoopDatas ...
Spark读写HBase时出现的问题--RpcRetryingCaller: Call exception
问题描述 Exception in thread "main" org.apache.hadoop.hbase.client.RetriesExhaustedException: ...

随机推荐

Java-Runoob-面向对象：Java 继承-u1
ylbtech-Java-Runoob-面向对象:Java 继承 1.返回顶部 1. Java 继承继承的概念继承是java面向对象编程技术的一块基石,因为它允许创建分等级层次的类. 继承就是子类 ...
[Java][Web]利用 referer 防盗链
String referer = request.getHeader("referer"); if(referer == null || !referer.startsWith(& ...
WindowsPhone自定义控件详解（二） - 模板类库分析
转自:http://blog.csdn.net/mr_raptor/article/details/7251948 WindowsPhone自定义控件详解(一) - 控件类库分析上一节主要分析了控件 ...
使用GET方式提交的表单遇到的问题
经常使用表单,一直使用的都是POST方式,POST将数据封装到请求体中,相对于GET安全一点:而POST处理中文编码问题也比GET简单(GET需要将URL编码,后台接受到后还需要解码).今天我想要使用 ...
c++ 搜索二叉树插入，删除，遍历操作
搜索二叉树是一种具有良好排序和查找性能的二叉树数据结构,包括多种操作,本篇只介绍插入,排序(遍历),和删除操作,重点是删除操作比较复杂,用到的例子也是本人亲自画的用到的测试图数据例子第一.构建节点 ...
为什么 ReactJS 不适合复杂的前端项目？
问题一:ReactJS组件难以在复杂交互页面中复用 ReactJS中的最小复用单位是组件.ReactJS的组件比AngularJS的Controller和View 要轻量些. 每个组件只需要前端开发者 ...
OD 实验(十一) - 对一个程序的破解
程序: 点击安装程序这是一个拼图程序点击 Options -> Flash Sizes 程序会提示是未注册版本点击一些选项的时候会提示该程序只给注册的用户点击 Register 随便输入 ...
转--activemq的官方中文文档
1 JMS 在介绍ActiveMQ之前,首先简要介绍一下JMS规范. 1.1 JMS的基本构件 1．1．1 连接工厂连接工厂是客户用来创建连接的对象,例如ActiveMQ提供的ActiveMQCon ...
「小程序JAVA实战」小程序模板在外部页面引用（20）
转自:https://idig8.com/2018/08/09/xiaochengxu-chuji-20/ 不知道老铁还有印象吗?当时讲模板的时候,是在当前的页面进行模板的应用,如何外部的方式引用模板 ...
spring-boot-starter-security Spring Boot中集成Spring Security
spring security是springboot支持的权限控制系统. security.basic.authorize-mode 要使用权限控制模式. security.basic.enabled ...

spark读写Sequoiadb

spark读写Sequoiadb的更多相关文章

随机推荐

热门专题