pom.xml

点击查看代码
  1. <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/maven-v4_0_0.xsd">
  2. <modelVersion>4.0.0</modelVersion>
  3. <groupId>org.example</groupId>
  4. <artifactId>sparkwordcount2</artifactId>
  5. <version>1.0-SNAPSHOT</version>
  6. <inceptionYear>2008</inceptionYear>
  7. <properties>
  8. <scala.version>2.11.12</scala.version>
  9. </properties>
  10. <repositories>
  11. <repository>
  12. <id>scala-tools.org</id>
  13. <name>Scala-Tools Maven2 Repository</name>
  14. <url>http://scala-tools.org/repo-releases</url>
  15. </repository>
  16. </repositories>
  17. <pluginRepositories>
  18. <pluginRepository>
  19. <id>scala-tools.org</id>
  20. <name>Scala-Tools Maven2 Repository</name>
  21. <url>http://scala-tools.org/repo-releases</url>
  22. </pluginRepository>
  23. </pluginRepositories>
  24. <dependencies>
  25. <dependency>
  26. <groupId>org.scala-lang</groupId>
  27. <artifactId>scala-library</artifactId>
  28. <version>${scala.version}</version>
  29. </dependency>
  30. <dependency>
  31. <groupId>junit</groupId>
  32. <artifactId>junit</artifactId>
  33. <version>4.4</version>
  34. <scope>test</scope>
  35. </dependency>
  36. <dependency>
  37. <groupId>org.specs</groupId>
  38. <artifactId>specs</artifactId>
  39. <version>1.2.5</version>
  40. <scope>test</scope>
  41. </dependency>
  42. <dependency>
  43. <groupId>org.apache.spark</groupId>
  44. <artifactId>spark-core_2.11</artifactId>
  45. <version>2.4.7</version>
  46. </dependency>
  47. </dependencies>
  48. <build>
  49. <sourceDirectory>src/main/scala</sourceDirectory>
  50. <testSourceDirectory>src/test/scala</testSourceDirectory>
  51. <plugins>
  52. <plugin>
  53. <groupId>org.scala-tools</groupId>
  54. <artifactId>maven-scala-plugin</artifactId>
  55. <executions>
  56. <execution>
  57. <goals>
  58. <goal>compile</goal>
  59. <goal>testCompile</goal>
  60. </goals>
  61. </execution>
  62. </executions>
  63. <configuration>
  64. <scalaVersion>${scala.version}</scalaVersion>
  65. <args>
  66. <arg>-target:jvm-1.8</arg>
  67. </args>
  68. </configuration>
  69. </plugin>
  70. <plugin>
  71. <groupId>org.apache.maven.plugins</groupId>
  72. <artifactId>maven-eclipse-plugin</artifactId>
  73. <configuration>
  74. <downloadSources>true</downloadSources>
  75. <buildcommands>
  76. <buildcommand>ch.epfl.lamp.sdt.core.scalabuilder</buildcommand>
  77. </buildcommands>
  78. <additionalProjectnatures>
  79. <projectnature>ch.epfl.lamp.sdt.core.scalanature</projectnature>
  80. </additionalProjectnatures>
  81. <classpathContainers>
  82. <classpathContainer>org.eclipse.jdt.launching.JRE_CONTAINER</classpathContainer>
  83. <classpathContainer>ch.epfl.lamp.sdt.launching.SCALA_CONTAINER</classpathContainer>
  84. </classpathContainers>
  85. </configuration>
  86. </plugin>
  87. </plugins>
  88. </build>
  89. <reporting>
  90. <plugins>
  91. <plugin>
  92. <groupId>org.scala-tools</groupId>
  93. <artifactId>maven-scala-plugin</artifactId>
  94. <configuration>
  95. <scalaVersion>${scala.version}</scalaVersion>
  96. </configuration>
  97. </plugin>
  98. </plugins>
  99. </reporting>
  100. </project>

SparkWordCountLocal.scala

点击查看代码
  1. package org.example
  2. import org.apache.spark.{SparkConf, SparkContext}
  3. object SparkWordCountLocal {
  4. def main(args: Array[String]): Unit = {
  5. val conf = new SparkConf()
  6. .setAppName("WordCount")
  7. .setMaster("local")
  8. val sc = new SparkContext(conf)
  9. val data = sc.textFile("./hello.txt")
  10. data.flatMap(_.split(" "))
  11. .map((_, 1))
  12. .reduceByKey(_+_)
  13. .collect()
  14. .foreach(println)
  15. }
  16. }

执行打印的日志:

  1. (jiu,1)
  2. (scala,2)
  3. (this,1)
  4. (spark,1)
  5. (is,1)
  6. (wan,1)
  7. (am,1)
  8. (i,1)
  9. (le,1)
  10. (demo,1)
  11. (hello,3)
  12. (gan,1)
  13. (nihao,1)
  14. (world,1)

本地 maven + scala 跑spark wordcount的更多相关文章

  1. Eclipse+Maven+Scala Project+Spark | 编译并打包wordcount程序

    学习用Eclipse+Maven来构建并打包一个简单的单词统计的例程. 本项目源码已托管于Github –>[Spark-wordcount] 第一步 在EclipseIDE中安装Scala插件 ...

  2. idea配置scala编写spark wordcount程序

    1.创建scala maven项目 选择骨架的时候为org.scala-tools.archetypes:scala-aechetype-simple 1.2 2.导入包,进入spark官网Docum ...

  3. 在Yarn集群上跑spark wordcount任务

    准备的测试数据文件hello.txt hello scala hello world nihao hello i am scala this is spark demo gan jiu wan le ...

  4. MacOS使用IDEA+Maven+Scala+Spark进行本地调试

    参考:spark开发环境搭建(基于idea 和maven) 安装JDK 从这里下载Java 8的JDK 设置JAVA_HOME环境变量,在Mac上它大概会是/Library/Java/JavaVirt ...

  5. Spark编程环境搭建(基于Intellij IDEA的Ultimate版本)(包含Java和Scala版的WordCount)(博主强烈推荐)

    福利 => 每天都推送 欢迎大家,关注微信扫码并加入我的4个微信公众号:   大数据躺过的坑      Java从入门到架构师      人工智能躺过的坑         Java全栈大联盟   ...

  6. eclipse构建maven+scala+spark工程 转载

    转载地址:http://jingpin.jikexueyuan.com/article/47043.html 本文先叙述如何配置eclipse中maven+scala的开发环境,之后,叙述如何实现sp ...

  7. 如何在本地使用scala或python运行Spark程序

    如何在本地使用scala或python运行Spark程序   包含两个部分: 本地scala语言编写程序,并编译打包成jar,在本地运行. 本地使用python语言编写程序,直接调用spark的接口, ...

  8. Eclipse+maven+scala+spark环境搭建

    准备条件 我用的Eclipse版本 Eclipse Java EE IDE for Web Developers. Version: Luna Release (4.4.0) 我用的是Eclipse ...

  9. Scala Spark WordCount

    Scala所需依赖 <dependency> <groupId>org.scala-lang</groupId> <artifactId>scala-l ...

随机推荐

  1. Java 向数组中添加元素

    一般数组是不能添加元素的,因为他们在初始化时就已定好长度了,不能改变长度. 向数组中添加元素思路 第一步:把数组转化为集合 list = Arrays.asList(array); 第二步:向集合中添 ...

  2. NC19115 选择颜色

    NC19115 选择颜色 题目 题目描述 \(n\) 个人排成一个环形,每个人要从 \(c\) 种颜色中选择一个. 牛牛希望相邻的人选择的颜色是不同的 问有多少种方案. 输出方案数对 \(10007\ ...

  3. 【主流技术】Redis 在 Spring 框架中的实践

    前言 在Java Spring 项目中,数据与远程数据库的频繁交互对服务器的内存消耗比较大,而 Redis 的特性可以有效解决这样的问题. Redis 的几个特性: Redis 以内存作为数据存储介质 ...

  4. VIM学习笔记-1

    VIM vim主要分为3个模式: Normal 模式 Insert模式 command模式 Insert 模式就是普通的编辑模式,没有太多可以介绍的,vim的主要功能都在 Normal 模式和 Com ...

  5. 阻塞赋值-非阻塞赋值(LUT,FDC,BUF...)

    一.看RTL级综合网络 1.1 FDC FDPE FDRE FDSE均是XILINX FPGA片上资源中四种不同的触发器,具体功能可直接百度 1.2 LUT是实现组合逻辑功能的一张真值表,根据输入值直 ...

  6. 请问为啥计算器16进制FFFFFFFFFFFF时10进制是-1?

    请问为啥计算器16进制FFFFFFFFFFFF时10进制是-1?

  7. CSDN垃圾的没有底线!

    平时写代码,经常需要百度. 今天我输入搜索关键词"access sql字符串转日期"进行百度搜索: 然后点开第一条: 这个加粗的标题可以点的,再点开: 这个内容跟我的搜索关键词有什 ...

  8. 第二十天python3 正则表达式

    正则表达式 Regular Expression,缩写为regex.regexp.RE等:分类 1.BRE 基本正则表达式,grep.sed.vi等软件支持,vim有扩展: 2.ERE 扩展正则表达式 ...

  9. 用户认证(Authentication)进化之路:由Basic Auth到Oauth2再到jwt

    原文转载自「刘悦的技术博客」https://v3u.cn/a_id_98 用户认证是一个在web开发中亘古不变的话题,因为无论是什么系统,什么架构,什么平台,安全性是一个永远也绕不开的问题 在HTTP ...

  10. 无意苦争春,一任群芳妒!M1 Mac book(Apple Silicon)能否支撑全栈工程师的日常?(Python3/虚拟机/Docker/Redis)

    原文转载自「刘悦的技术博客」https://v3u.cn/a_id_187 就像大航海时代里突然诞生的航空母舰一样,苹果把玩着手心里远超时代的M1芯片,微笑着对Intel说:"不好意思,虽然 ...