在linux系统上安装solrCloud
  
  1.依赖:
  
  JRE solr7.3 需要 java1.8
  
  独立的zookeeper服务 ,zookeeper安装请参考:
  
  http://zookeeper.apache.org/doc/current/zookeeperStarted.html
  
  2.上传solr安装包
  
  3.从安装包中解出安装脚本
  
  tar xzf solr-7.3.0.tgz solr-7.3.0/bin/install_solr_service.sh --strip-components=2
  
  安装脚本可用于:CentOS, Debian, Red Hat, SUSE and Ubuntu Linux distributions
  
  4.安装脚本参数说明:
  
  ./install_solr_service.sh -help
  
  -i 指定软件安装目录。默认 /opt
  
  -d 指定数据目录(solr主目录):内核存储目录 。默认 /var/solr
  
  -u 指定要创建的拥有solr的用户名,出于安全考虑,不应以root来运行。默认 solr
  
  -s 指定系统服务名。默认 solr
  
  -p 指定端口。默认 8983
  
  5.目录规划
  
  6.以root身份运行安装脚本进行安装
  
  ./install_solr_service.sh solr-7.3.0.tgz
  
  等同:
  
  ./install_solr_service.sh solr-7.3.0.tgz -i /opt -d /var/solr -u solr -s solr -p 8983
  
  配置solr服务实例
  
  1.认识solr服务的配置文件
  
  问:如何启动一个solr服务实例?
  
  1,系统服务脚本: /etc/init.d/solr 请查看该脚本内容,看系统启动时是如何启动solr服务实例的。 可看到使用了如下三个变量:
  
  2.环境参数配置文件(官方叫法:include file)。它将覆盖 bin/solr启停控制脚本中的配置参数。我们通过该文件来配置修改solr服务实例的运行配置。
  
  请查看 /etc/default/solr.in.sh ,看我们可以在该文件中进行哪些配置。
  
  在 /etc/default/solr.in.sh 中可看到它配置了如下参数:
  
  map将RDD的元素一个个传入call方法,经过call方法的计算之后,逐个返回,生成新的RDD,计算之后,记录数不会缩减。示例代码,将每个数字加10之后再打印出来, 代码如下
  
  import java.util.Arrays;
  
  import org.apache.spark.SparkConf;
  
  import org.apache.spark.api.java.JavaRDD;
  
  import org.apache.spark.api.java.JavaSparkContext;
  
  import org.apache.spark.api.java.function.Function;
  
  import org.apache.spark.api.java.function.VoidFunction;
  
  public class Map {
  
  public static void main(String[] args) {
  
  SparkConf conf = new SparkConf(www.yongshiyule178.com/).setAppName( www.dfgjpt.com"spark map").setMaster("local[*]");
  
  JavaSparkContext javaSparkContext www.michenggw.com new JavaSparkContext(conf);
  
  JavaRDD<Integer> listRDD = javaSparkContext.parallelize(Arrays.asList(1, 2, 3, 4));
  
  JavaRDD<Integer> numRDD www.yongshi123.cn =www.tiaotiaoylzc.com listRDD.map(new Function<Integer, Integer>() {
  
  @Override
  
  public Integer call(Integer num) throws Exception {
  
  return num + 10;
  
  numRDD.foreach(new VoidFunction<Integer>(www.cmeidi.cn) {
  
  @Override
  
  public void call(Integer num) throws Exception {
  
  System.out.println(num);
  
  执行结果:
  
  2、flatMap
  
  flatMap和map的处理方式一样,都是把原RDD的元素逐个传入进行计算,但是与之不同的是,flatMap返回值是一个Iterator,也就是会一生多,超生
  
  import java.util.Arrays;
  
  import java.util.Iterator;
  
  import org.apache.spark.SparkConf;
  
  import org.apache.spark.api.java.JavaRDD;
  
  import org.apache.spark.api.java.JavaSparkContext;
  
  import org.apache.spark.api.java.function.FlatMapFunction;
  
  import org.apache.spark.api.java.function.VoidFunction;
  
  public class FlatMap {
  
  public static void main(String[] args) {
  
  SparkConf conf = new SparkConf().setAppName(www.mhylpt.com"spark map"www.ycjszpgs.com).setMaster("local[*]");
  
  JavaSparkContext javaSparkContext = new JavaSparkContext(conf);
  
  JavaRDD<String> listRDD = javaSparkContext
  
  .parallelize(Arrays.asList("hello wold", "hello java", "hello spark"));
  
  JavaRDD<String> rdd = listRDD.flatMap(new FlatMapFunction<String, String>() {
  
  private static final long serialVersionUID = 1L;
  
  @Override
  
  public Iterator<String>www.myzx1.com call(String input) throws Exception {
  
  return Arrays.asList(input.split()).iterator();
  
  rdd.foreach(new VoidFunction<String>() {
  
  private static final long serialVersionUID = 1L;
  
  @Override
  
  public void call(String num) throws Exception {
  
  System.out.println(num);

Spark RDD操作之Map系算子的更多相关文章

  1. Spark RDD操作(1)

    https://www.zybuluo.com/jewes/note/35032 RDD是什么? RDD是Spark中的抽象数据结构类型,任何数据在Spark中都被表示为RDD.从编程的角度来看,RD ...

  2. Spark RDD 操作

    1. Spark RDD 创建操作 1.1 数据集合   parallelize 可以创建一个能够并行操作的RDD.其函数定义如下: ) scala> sc.defaultParallelism ...

  3. spark RDD操作的底层实现原理

    RDD操作闭包外部变量原则 RDD相关操作都需要传入自定义闭包函数(closure),如果这个函数需要访问外部变量,那么需要遵循一定的规则,否则会抛出运行时异常.闭包函数传入到节点时,需要经过下面的步 ...

  4. Spark RDD API详解(一) Map和Reduce

    RDD是什么? RDD是Spark中的抽象数据结构类型,任何数据在Spark中都被表示为RDD.从编程的角度来看,RDD可以简单看成是一个数组.和普通数组的区别是,RDD中的数据是分区存储的,这样不同 ...

  5. Spark RDD API具体解释(一) Map和Reduce

    本文由cmd markdown编辑.原始链接:https://www.zybuluo.com/jewes/note/35032 RDD是什么? RDD是Spark中的抽象数据结构类型,不论什么数据在S ...

  6. Spark RDD API详解之:Map和Reduce

    RDD是什么? RDD是Spark中的抽象数据结构类型,任何数据在Spark中都被表示为RDD.从编程的角度来看, RDD可以简单看成是一个数组.和普通数组的区别是,RDD中的数据是分区存储的,这样不 ...

  7. Spark RDD Operations(1)

    以上是对应的RDD的各中操作,相对于MaoReduce只有map.reduce两种操作,Spark针对RDD的操作则比较多 ************************************** ...

  8. Apache Spark 2.2.0 中文文档 - Spark RDD(Resilient Distributed Datasets)论文 | ApacheCN

    Spark RDD(Resilient Distributed Datasets)论文 概要 1: 介绍 2: Resilient Distributed Datasets(RDDs) 2.1 RDD ...

  9. Apache Spark RDD(Resilient Distributed Datasets)论文

    Spark RDD(Resilient Distributed Datasets)论文 概要 1: 介绍 2: Resilient Distributed Datasets(RDDs) 2.1 RDD ...

随机推荐

  1. Luogu3191 HNOI2007 紧急疏散 二分答案、最大流

    传送门 题意:自己去看 考虑二分答案.$BFS$预处理出每一个人到每一扇门的最短时间,设二分的值为$mid$,那么把门拆成$mid$个点,每一个点代表第$1,2,...,mid$秒时的状态.$i-1$ ...

  2. Maven私有仓库: 发布release版本报错:Return code is: 400, ReasonPhrase: Repository does not allow upd ating assets: maven-releases.

    今天在将一个maven组件由SNAPSHORT升级为正式版本1.0.0,然后执行发布: mvn clean deploy -pl ielong-common -am -DskipTests, 报错:R ...

  3. RHEL7基本命令

    Terminal TTY TTY是TeleTYpe的一个老缩写. Teletypes,或者teletypewriters,原来指的是电传打字机,是通过串行线用打印机键盘通过阅读和发送信息的东西,和古老 ...

  4. System.Data.SqlClient.SqlException:“对象名 'customer' 无效。"

    连接数据库出错, 错误原因:表名错误.

  5. js中的栈、堆、队列、内存空间

    栈(stack) .堆(heap). 队列(queue)是js的三种数据结构. 栈(stack) 栈的特点是"LIFO,即后进先出(Last in, first out)".数据存 ...

  6. Bash : IO 重定向

    标准输入/输出(standard I/O)可能是软件设计原则里最重要的概念了.这个概念就是:程序应该有数据的来源端.数据的目的端(输出结果的地方)已经报告问题的地方,它们分别被称为标准输入(stand ...

  7. Redis Cluster日常操作命令梳理

    在之前的一篇文章已经介绍了Redis Cluster及其部署,下面说下Redis Cluster日常操作命令: 一.以下命令是Redis Cluster集群所独有的,执行下面命令需要先登录redis: ...

  8. MySQL高可用架构-MMM环境部署记录

    MMM介绍MMM(Master-Master replication manager for MySQL)是一套支持双主故障切换和双主日常管理的脚本程序.MMM使用Perl语言开发,主要用来监控和管理 ...

  9. cometd简单用例

    准备工作 整个例子的源码下载:http://pan.baidu.com/s/1gfFYSbp 下载服务端jar文件 Comet4J目前仅支持Tomcat6.7版本,根据您所使用的Tomcat版本下载[ ...

  10. vs感受,由于我的电脑装了俩年了!我直接写感受吧

    个人感受:最初的感觉,最开始装vs是因为我的电脑8.1不兼容vc6.0(一个挺坑的编程软件),最开始用vs的时候我还是一个小白什么都不懂,vs创建项目实在是太复杂,不看教程根本看不懂,也许是它能包容的 ...