Spark详解(01) - Scala编程语言
Spark详解(01) - Scala编程语言概述
Scala官网:https://www.scala-lang.org/
什么是Scala
从英文的角度来讲,Scala并不是一个单词,而是Scalable Language两个单词的缩写,表示可伸缩语言的意思。从计算机的角度来讲,Scala是一门完整的软件编程语言,那么连在一起就表示Scala是一门可伸缩的软件编程语言。之所以说它是可伸缩,是因为这门语言体现了面向对象,函数式编程等多种不同的语言范式,且融合了不同语言新的特性。
Scala编程语言是由联邦理工学院洛桑(EPFL)的Martin Odersky于2001年基于Funnel的工作开始设计并开发的。由于Martin Odersky之前的工作是开发通用Java和Javac(Sun公司的Java编译器),所以基于Java平台的Scala语言于2003年底/2004年初发布。
为什么学习Scala
- 大数据主要的批处理计算引擎框架Spark是基于Scala语言开发的
- 大数据主要的流式计算引擎框架Flink也提供了Scala相应的API
- 大数据领域中函数式编程的开发效率更高,更直观,更容易理解
Java and Scala
Martin Odersky是狂热的编译器爱好者,长时间的编程后,希望开发一种语言,能够让写程序的过程变得简单,高效,所以当接触到Java语言后,感受到了这门语言的魅力,决定将函数式编程语言的特性融合到Java语言中,由此产生了2门语言(Pizza & Scala),这两种语言极大地推动了Java语言的发展
JDK1.5的泛型,增强for循环,自动类型转换等都是从Pizza语言引入的新特性
JDK1.8的类型推断,λ(lambda)表达式是从Scala语言引入的新特性
由上可知,Scala语言是基于Java开发的,所以其编译后的文件也是字节码文件,并可以运行在JVM中。
Scala Hello Word
Windows安装Scala编译器
- 安装JDK 1.8(略)
- 安装Scala2.12
访问Scala官网http://www.scala-lang.org/下载Scala编译器安装包,本文以2.11.8版本为例,下载scala-2.11.8.msi后双击运行,选择安装目录,点击next选项完成安装
如果使用tgz安装包,直接解压文件scala-2.11.8.tgz,解压目录要求无中文无空格
- 配置环境变量
如果是使用的msi安装包安装的,在安装过程中会自动为本机电脑配置上环境变量如下图
如果是tgz安装包直接解压到方式,需要手动配置环境变量,配置方式如下:
新建环境变量SCALA_HOME
在Path中添加SCALA_HOME:%SCALA_HOME%\bin
- 环境测试
如果出现如下窗口内容,表示环境安装成功
IDEA中Scala插件安装
默认情况下IDEA不支持Scala的开发,需要安装Scala插件。
如果下载慢的,请访问网址:https://plugins.jetbrains.com/plugin/1347-scala/versions
Hello Word案例
- 创建Maven项目
- 增加Scala框架支持
默认情况,IDEA中创建项目时不支持Scala的开发,需要添加Scala框架的支持。
- 创建类
默认情况下,新建的项目的src/main目录下只有java文件夹,为了便于区分,新建一个scala文件夹
在src/main/scala文件目录中创建Scala类对象:com.zhangjk.bigdata.HelloScala
内容如下
- object HelloScala {
- def main(args: Array[String]): Unit = {
- System.out.println("Hello Scala")
- println("Hello Word")
- }
- }
代码的实现原理
源码关联
在使用Scala过程中,为了搞清楚Scala底层的机制,需要查看源码,那么就需要关联和查看Scala的源码包。
变量和数据类型
注释
Scala注释使用和Java完全一样。
单行注释
object ScalaComment{
def main(args: Array[String]): Unit =
{
// 单行注释
}
}
多行注释
object ScalaComment{
def main(args: Array[String]): Unit =
{
/*
多行注释
*/
}
}
文档注释
/**
* doc注释
*/
object ScalaComment{
def main(args: Array[String]): Unit =
{
}
}
变量
变量是一种使用方便的占位符,用于引用计算机内存地址,变量创建后会占用一定的内存空间。基于变量的数据类型,操作系统会进行内存分配并且决定什么将被储存在保留内存中。因此,通过给变量分配不同的数据类型,你可以在这些变量中存储整数,小数或者字母。
语法声明
变量的类型在变量名之后等号之前声明。
- object ScalaVariable {
- def main(args: Array[String]): Unit = {
- // var | val 变量名 :变量类型 = 变量值
- // 用户名称
- var username : String = "zhangsan"
- // 用户密码
- val userpswd : String = "000000"
- }
- }
变量的类型如果能够通过变量值推断出来,那么可以省略类型声明,这里的省略,并不是不声明,而是由Scala编译器在编译时自动声明编译的。
- object ScalaVariable {
- def main(args: Array[String]): Unit = {
- // 因为变量值为字符串,又因为Scala是静态类型语言,所以即使不声明类型
- // Scala也能在编译时正确的判断出变量的类型,这体现了Scala语言的简洁特性。
- var username = "zhangsan"
- val userpswd = "000000"
- }
- }
变量初始化
Java语法中变量在使用前进行初始化就可以,但是Scala语法中是不允许的,必须显示进行初始化操作。
- object ScalaVariable {
- def main(args: Array[String]): Unit = {
- var username // Error
- val username = "zhangsan" // OK
- }
- }
可变变量
值可以改变的变量,称之为可变变量,但是变量类型无法发生改变, Scala中可变变量使用关键字var进行声明
- object ScalaVariable {
- def main(args: Array[String]): Unit = {
- // 用户名称
- var username : String = "zhangsan"
- username = "lisi" // OK
- username = true // Error
- }
- }
不可变变量
值一旦初始化后无法改变的变量,称之为不可变变量。Scala中不可变变量使用关键字val进行声明, 类似于Java语言中的final关键字
- object ScalaVariable {
- def main(args: Array[String]): Unit = {
- // 用户名称
- val username : String = "zhangsan"
- username = "lisi" // Error
- username = true // Error
- }
- }
思考问题:
- val和var两个修饰符,哪一个会推荐使用?
val使用更多一些,当确实需要改变变量的值是才使用var
- Java中的字符串为何称之为不可变字符串?
https://www.programcreek.com/2013/04/why-string-is-immutable-in-java/
https://www.cnblogs.com/zjiacun/p/8290238.html
标识符
Scala 可以使用两种形式的标志符,字符数字和符号。
- 字符数字使用字母或是下划线开头,后面可以接字母或是数字,符号"$"在 Scala 中也看作为字母。然而以"$"开头的标识符为保留的 Scala 编译器产生的标志符使用,应用程序应该避免使用"$"开始的标识符,以免造成冲突。
- Scala 的命名规范采用和 Java 类似的 camel 命名规范,首字符小写,比如 toString。类名的首字符还是使用大写。此外也应该避免使用以下划线结尾的标志符以避免冲突。
- Scala 内部实现时会使用转义的标志符,比如:-> 使用 $colon$minus$greater 来表示这个符号。
// 和Java一样的标识符命名规则
val name =
"zhangsan"
// OK
val name1 =
"zhangsan0"
// OK
//val 1name = "zhangsan0" // Error
val name$ =
"zhangsan1"
// OK
val $name =
"zhangsan2"
// OK
val name_ =
"zhangsan3"
// OK
val _name =
"zhangsan4"
// OK
val $ =
"zhangsan5"
// OK
val _ =
"zhangsan6"
// OK
//val 1 = "zhangsan6" // Error
//val true = "zhangsan6" // Error
// 和Java不一样的标识符命名规则
val +
=
"lisi"
// OK
val -
=
"lisi"
// OK
val *
=
"lisi"
// OK
val /
=
"lisi"
// OK
val !
=
"lisi"
// OK
//val @ = "lisi" // Error
val @@ =
"lisi"
// OK
//val # = "lisi" // Error
val ## =
"lisi"
// OK
val %
=
"lisi"
// OK
val ^
=
"lisi"
// OK
val &
=
"lisi"
// OK
//val ( = "lisi" // Error
//val ( = "lisi" // Error
//val ) = "lisi" // Error
//val = = "lisi" // Error
val ==
=
"lisi"
// OK
//val [ = "lisi" // Error
//val ] = "lisi" // Error
//val : = "lisi" // Error
val ::
=
"lisi"
// OK
//val ; = "lisi" // Error
//val ' = "lisi" // Error
//val " = "lisi" // Error
val ""
=
"lisi"
// OK
val <
=
"lisi"
// OK
val >
=
"lisi"
// OK
val ?
=
"lisi"
// OK
val |
=
"lisi"
// OK
val \ =
"lisi"
// OK
//val ` = "lisi" // Error
val ~
=
"lisi"
// OK
val :->
=
"wangwu"
// OK
val :-<
=
"wangwu"
// OK
// 切记,能声明和能使用是两回事
Scala 中的标识符也不能是关键字或保留字,Scala中关键字或保留字如下:
问题:
- 如何在Java语言中访问Scala对象?
Java中直接可以调用scala的方法,对象.方法()
- 如果变量就想使用特定含义的关键字怎么办?
原则上禁止使用关键字例如
val private = "私有的"
println(private)
上述代码会报错,可以使用``字符对其转义例如
val `private` = "私有的"
println(`private`)
则可以正常运行
字符串
在 Scala 中,字符串的类型实际上就是 Java中的 String类,Scala本身是没有 String 类的。
在 Scala 中,String 是一个不可变的字符串对象,所以该对象不可被修改。这就意味着如果修改字符串就会产生一个新的字符串对象。
- object ScalaString {
- def main(args: Array[String]): Unit = {
- val name : String = "scala"
- val subname : String = name.substring(0,2)
- }
- }
字符串连接
- object ScalaString {
- def main(args: Array[String]): Unit = {
- // 字符串连接
- println("Hello " + name)
- }
- }
传值字符串
- object ScalaString {
- def main(args: Array[String]): Unit = {
- // 传值字符串(格式化字符串)
- printf("name=%s\n", name)
- }
- }
插值字符串
- object ScalaString {
- def main(args: Array[String]): Unit = {
- // 插值字符串
- // 将变量值插入到字符串
- println(s"name=${name}")
- }
- }
多行字符串
- object ScalaString {
- def main(args: Array[String]): Unit = {
- // 多行格式化字符串
- // 在封装JSON或SQL时比较常用
- // | 默认顶格符
- println(
- s"""
- | Hello
- | ${name}
- """.stripMargin)
- }
- }
输入输出
输入
- 从屏幕(控制台)中获取输入
- object ScalaIn {
- def main(args: Array[String]): Unit = {
- // 标准化屏幕输入
- val age : Int = scala.io.StdIn.readInt()
- println(age)
- }
- }
- 从文件中获取输入
- object ScalaIn {
- def main(args: Array[String]): Unit = {
- // 请注意文件路径的位置
- scala.io.Source.fromFile("input/user.json").foreach(
- line => {
- print(line)
- }
- )
- scala.io.Source.fromFile("input/user.json").getLines()
- }
- }
输出
Scala进行文件写操作,用的都是 java中的I/O类
- object ScalaOut {
- def main(args: Array[String]): Unit = {
- val writer = new PrintWriter(new File("output/test.txt" ))
- writer.write("Hello Scala")
- writer.close()
- }
- }
网络
Scala进行网络数据交互时,采用的也依然是 java中的I/O类
- object TestServer {
- def main(args: Array[String]): Unit = {
- val server = new ServerSocket(9999)
- while ( true ) {
- val socket: Socket = server.accept()
- val reader = new BufferedReader(
- new InputStreamReader(
- socket.getInputStream,
- "UTF-8"
- )
- )
- var s : String = ""
- var flg = true
- while ( flg ) {
- s = reader.readLine()
- if ( s != null ) {
- println(s)
- } else {
- flg = false
- }
- }
- }
- }
- }
- ...
- object TestClient {
- def main(args: Array[String]): Unit = {
- val client = new Socket("localhost", 9999)
- val out = new PrintWriter(
- new OutputStreamWriter(
- client.getOutputStream,
- "UTF-8"
- )
- )
- out.print("hello Scala")
- out.flush()
- out.close()
- client.close()
- }
- }
问题:java的序列化怎么回事?
- java将内存中的对象存储到磁盘文件中,要求对象必须实现可序列化接口
- 在网络中想要传递对象,这个对象需要序列化。
数据类型
Scala与Java有着相同的数据类型,但是又有不一样的地方
Java数据类型
Java的数据类型包含基本类型和引用类型
- 基本类型:byte,short,char,int,long,float,double,boolean
- 引用类型:Object,数组,字符串,包装类,集合,POJO对象等
数据类型
Scala是完全面向对象的语言,所以不存在基本数据类型的概念,有的只是任意值对象类型(AnyVal)和任意引用对象类型(AnyRef)
类型转换
自动类型转化(隐式转换)
- object ScalaDataType {
- def main(args: Array[String]): Unit = {
- val b : Byte = 10
- val s : Short = b
- val i : Int = s
- val lon : Long = i
- }
- }
问题:如下代码是否正确?
val c : Char = 'A' + 1
println(c)
答案:正确
scala> println(c)
B
强制类型转化
- Java语言
- int a = 10
- byte b = (byte)a
- Scala语言
- var a : Int = 10
- Var b : Byte = a.toByte
- // 基本上Scala的AnyVal类型之间都提供了相应转换的方法。
字符串类型转化
scala是完全面向对象的语言,所有的类型都提供了toString方法,可以直接转换为字符串
lon.toString
任意类型都提供了和字符串进行拼接的方法
val i = 10
val s = "hello " + i
运算符
scala运算符的使用和Java运算符的使用基本相同,只有个别细节上不同。
算数运算符
假定变量 A 为 10,B 为 20
关系运算符
假定变量A为10,B为20
思考一个问题:如下代码执行结果如何?
val a = new String("abc")
val b = new String("abc")
println(a == b)
println(a.equals(b))
println(a.eq(b))
答案:
scala> println(a == b)
true
scala> println(a.equals(b))
true
scala> println(a.eq(b))
false
3.3 赋值运算符
问题:为什么在scala运算符中没有 ++, --?
++运算有歧义,运算会出现错误,所以scala中没有这样的语法,而是采用 +=的方式来代替。
逻辑运算符
假定变量 A 为 1,B 为 0
位运算符
如果指定 A = 60; 及 B = 13; 两个变量对应的二进制为
A = 0011 1100
B = 0000 1101
运算符本质
在Scala中其实是没有运算符的,所有运算符都是方法。
- scala是完全面向对象的语言,所以数字其实也是对象
- 当调用对象的方法时,点.可以省略
- 如果函数参数只有一个,或者没有参数,()可以省略
- object ScalaOper {
- def main(args: Array[String]): Unit = {
- val i : Int = 10
- val j : Int = i.+(10)
- val k : Int = j +(20)
- val m : Int = k + 30
- println(m)
- }
- }
流程控制
Scala程序代码和所有编程语言代码一样,都会有特定的执行流程顺序,默认情况下是顺序执行,上一条逻辑执行完成后才会执行下一条逻辑,执行期间也可以根据某些条件执行不同的分支逻辑代码。
分支控制
让程序有选择的的执行,分支控制有三种:单分支、双分支、多分支
单分支
IF...ELSE 语句是通过一条或多条语句的执行结果(true或者false)来决定执行的代码块
if(布尔表达式)
{
// 如果布尔表达式为 true 则执行该语句块
}
如果布尔表达式为 true 则执行大括号内的语句块,否则跳过大括号内的语句块,执行大括号之后的语句块。
object ScalaBranch {
def main(args: Array[String]): Unit =
{
val b =
true
if
( b )
{
println("true")
}
}
}
双分支
if(布尔表达式)
{
// 如果布尔表达式为 true 则执行该语句块
}
else
{
// 如果布尔表达式为 false 则执行该语句块
}
如果布尔表达式为 true 则执行接着的大括号内的语句块,否则执行else后的大括号内的语句块。
def main(args: Array[String]): Unit =
{
val b =
true
if
( b )
{
println("true")
}
else
{
println("false")
}
}
多分支
if(布尔表达式1)
{
// 如果布尔表达式1为 true,则执行该语句块
}
else
if
(
布尔表达式2 )
{
// 如果布尔表达式2为 true,则执行该语句块
}...
}
else
{
// 上面条件都不满足的场合,则执行该语句块
}
实现一个小功能:输入年龄,如果年龄小于18岁,则输出"童年"。如果年龄大于等于18且小于等于30,则输出"青年",如果年龄大于30小于等于50,则输出"中年",否则,输出"老年"。
- object ScalaBranch {
- def main(args: Array[String]): Unit = {
- val age = 30
- if ( age < 18 ) {
- println("童年")
- } else if ( age <= 30 ) {
- println("青年")
- } else if ( age <= 50 ) {
- println("中年")
- } else {
- println("老年")
- }
- }
- }
实际上,Scala中的表达式都是有返回值的,所以上面的小功能还有其他的实现方式
- object ScalaBranch {
- def main(args: Array[String]): Unit = {
- val age = 30
- val result = if ( age < 18 ) {
- "童年"
- } else if ( age <= 30 ) {
- "青年"
- } else if ( age <= 50 ) {
- "中年"
- } else {
- "老年"
- }
- println(result)
- }
- }
问题: 怎么没有讲三元运算符?
Scala语言中没有三元运算符的,使用if分支判断来代替三元运算符
循环控制
有的时候,可能需要多次执行同一块代码。一般情况下,语句是按顺序执行的:函数中的第一个语句先执行,接着是第二个语句,依此类推。编程语言提供了更为复杂执行路径的多种控制结构。循环语句允许多次执行一个语句或语句组
Scala语言提供了以下几种循环类型
for循环
- 基本语法
for
(
循环变量
<-
数据集
)
{
循环体
}
这里的数据集可以是任意类型的数据集合,如字符串,集合,数组等,这里我们还没有讲到集合,数组语法,请大家不要着急,先能演示例子,后面咱们详细讲。
object ScalaLoop {
def main(args: Array[String]): Unit =
{
for
( i <- Range(1,5)
)
{
// 范围集合
println("i = "
+ i )
}
for
( i <-
1 to 5
)
{
// 包含5
println("i = "
+ i )
}
for
( i <-
1 until 5
)
{
// 不包含5
println("i = "
+ i )
}
}
}
- 循环守卫
循环时可以增加条件来决定是否继续循环体的执行,这里的判断条件我们称之为循环守卫
object ScalaLoop {
def main(args: Array[String]): Unit =
{
for
( i <- Range(1,5)
if i !=
3
)
{
println("i = "
+ i )
}
}
}
- 循环步长
scala的集合也可以设定循环的增长幅度,也就是所谓的步长step
object ScalaLoop {
def main(args: Array[String]): Unit =
{
for
( i <- Range(1,5,2)
)
{
println("i = "
+ i )
}
for
( i <-
1 to 5 by 2
)
{
println("i = "
+ i )
}
}
}
- 循环嵌套
object ScalaLoop {
def main(args: Array[String]): Unit =
{
for
( i <- Range(1,5); j <- Range(1,4)
)
{
println("i = "
+ i +
",j = "
+ j )
}
for
( i <- Range(1,5)
)
{
for
( j <- Range(1,4)
)
{
println("i = "
+ i +
",j = "
+ j )
}
}
}
}
请好好体会上面两种嵌套方式的区别。
- 引入变量
object ScalaLoop {
def main(args: Array[String]): Unit =
{
for
( i <- Range(1,5); j = i -
1
)
{
println("j = "
+ j )
}
}
}
- 循环返回值
scala所有的表达式都是有返回值的。但是这里的返回值并不一定都是有值的哟。
如果希望for循环表达式的返回值有具体的值,需要使用关键字yield
object ScalaLoop {
def main(args: Array[String]): Unit =
{
val result =
for
( i <- Range(1,5)
) yield {
i *
2
}
println(result)
}
}
问题:
Java中的线程有yield方法,Scala中该如何调用?
Thread.`yield`()
while循环
- 基本语法
当循环条件表达式返回值为true时,执行循环体代码
while(
循环条件表达式
)
{
循环体
}
一种特殊的while循环就是,先执行循环体,再判断循环条件是否成立
do
{
循环体
}
while
(
循环条件表达式
)
- while循环
def main(args: Array[String]): Unit =
{
var i =
0
while
( i <
5
)
{
println(i)
i +=
1
}
}
- do...while循环
object ScalaLoop {
def main(args: Array[String]): Unit =
{
var i =
5
do
{
println(i)
}
while
( i <
5
)
}
}
循环中断
scala是完全面向对象的语言,所以无法使用break,continue关键字这样的方式来中断,或继续循环逻辑,而是采用了函数式编程的方式代替了循环语法中的break和continue
object ScalaLoop {
def main(args: Array[String]): Unit =
{
scala.util.control.Breaks.breakable {
for
( i <-
1 to 5
)
{
if
( i ==
3
)
{
scala.util.control.Breaks.break
}
println(i)
}
}
}
}
嵌套循环
循环中有循环,就是嵌套循环。通过嵌套循环可以实现特殊的功能,比如说九九乘法表,
函数式编程
在之前Java学习中,一直就是面向对象编程,所以解决问题都是按照面向对象的方式来处理的。比如用户登陆等业务功能,但是接下来学习函数式编程,采用函数式编程的思路来解决问题。scala编程语言将函数式编程和面向对象编程完美地融合在一起了。
- 面向对象编程
分解对象,行为,属性,然后通过对象的关系以及行为的调用来解决问题
- 函数式编程
将问题分解成一个一个的步骤,将每个步骤进行封装(函数),通过调用这些封装好的功能按照指定的步骤,解决问题。
基础函数编程
基本语法
[修饰符] def 函数名
(
参数列表
)
[:返回值类型]
=
{
函数体
}
private def test( s : String )
: Unit =
{
println(s)
}
函数&方法
- scala 中存在方法与函数两个不同的概念,二者在语义上的区别很小。scala 方法是类的一部分,而函数是一个对象,可以赋值给一个变量。换句话来说在类中定义的函数即是方法。scala 中的方法跟 Java 的类似,方法是组成类的一部分。scala 中的函数则是一个完整的对象。
- Scala中的方法和函数从语法概念上来讲,一般不好区分,所以简单的理解就是:方法也是函数。只不过类中声明的函数称之为方法,其他场合声明的就是函数了。类中的方法是有重载和重写的。而函数可就没有重载和重写的概念了,但是函数可以嵌套声明使用,方法就没有这个能力了,千万记得。
函数定义
1)
无参,无返回值
object ScalaFunction {
def main(args: Array[String]): Unit =
{
def fun1(): Unit =
{
println("函数体")
}
fun1()
}
}
2)
无参,有返回值
object ScalaFunction {
def main(args: Array[String]): Unit =
{
def fun2(): String =
{
"zhangsan"
}
println( fun2()
)
}
}
3)
有参,无返回值
object ScalaFunction {
def main(args: Array[String]): Unit =
{
def fun3( name:String ): Unit =
{
println( name )
}
fun3("zhangsan")
}
}
4)
有参,有返回值
object ScalaFunction {
def main(args: Array[String]): Unit =
{
def fun4(name:String): String =
{
"Hello "
+ name
}
println( fun4("zhangsan")
)
}
}
5)
多参,无返回值
object ScalaFunction {
def main(args: Array[String]): Unit =
{
def fun5(hello:String, name:String): Unit =
{
println( hello +
" "
+ name )
}
fun5("Hello",
"zhangsan")
}
}
6)
多参,有返回值
object ScalaFunction {
def main(args: Array[String]): Unit =
{
def fun6(hello:String, name:String): String =
{
hello +
" "
+ name
}
println( fun6("Hello",
"zhangsan"))
}
}
函数参数
1)
可变参数
object ScalaFunction {
def main(args: Array[String]): Unit =
{
def fun7(names:String*): Unit =
{
println(names)
}
fun7()
fun7(
"zhangsan"
)
fun7(
"zhangsan",
"lisi"
)
}
}
2)可变参数不能放置在参数列表的前面,一般放置在参数列表的最后
oobject ScalaFunction {
def main(args: Array[String]): Unit =
{
// Error
//def fun77(names:String*, name:String): Unit = {
//}
def fun777( name:String, names:String*
): Unit =
{
println( name )
println( names )
}
}
}
3)
参数默认值
object ScalaFunction {
def main(args: Array[String]): Unit =
{
def fun8( name:String, password:String =
"000000"
): Unit =
{
println( name +
","
+ password )
}
fun8("zhangsan",
"123123")
fun8("zhangsan")
}
}
4)
带名参数
object ScalaFunction {
def main(args: Array[String]): Unit =
{
def fun9( password:String =
"000000", name:String ): Unit =
{
println( name +
","
+ password )
}
fun9("123123",
"zhangsan"
)
fun9(name="zhangsan")
}
}
函数至简原则
所谓的至简原则,其实就是Scala的作者为了开发人员能够大幅度提高开发效率。通过编译器的动态判定功能,帮助我们将函数声明中能简化的地方全部都进行了简化。也就是说将函数声明中那些能省的地方全部都省掉。所以这里的至简原则,简单来说就是:能省则省。
1)
省略return关键字
object ScalaFunction {
def main(args: Array[String]): Unit =
{
def fun1(): String =
{
return
"zhangsan"
}
def fun11(): String =
{
"zhangsan"
}
}
}
2)
省略花括号
object ScalaFunction {
def main(args: Array[String]): Unit =
{
def fun2(): String =
"zhangsan"
}
}
3)
省略返回值类型
object ScalaFunction {
def main(args: Array[String]): Unit =
{
def fun3()
=
"zhangsan"
}
}
4)
省略参数列表
object ScalaFunction {
def main(args: Array[String]): Unit =
{
def fun4 =
"zhangsan"
fun4// OK
fun4()//(ERROR)
}
}
5)
省略等号
如果函数体中有明确的return语句,那么返回值类型不能省略
object ScalaFunction {
def main(args: Array[String]): Unit =
{
def fun5(): String =
{
return
"zhangsan"
}
println(fun5())
}
}
如果函数体返回值类型明确为Unit,
那么函数体中即使有return关键字也不起作用
object ScalaFunction {
def main(args: Array[String]): Unit =
{
def fun5(): Unit =
{
return
"zhangsan"
}
println(fun5())
}
}
如果函数体返回值类型声明为Unit,
但是又想省略,那么此时就必须连同等号一起省略
object ScalaFunction {
def main(args: Array[String]): Unit =
{
def fun5()
{
return
"zhangsan"
}
println(fun5())
}
}
6)
省略名称和关键字
object ScalaFunction {
def main(args: Array[String]): Unit =
{
()
=>
{
println("zhangsan")
}
}
}
高阶函数编程
所谓的高阶函数,其实就是将函数当成一个类型来使用,而不是当成特定的语法结构。
函数作为值
object ScalaFunction {
def main(args: Array[String]): Unit =
{
def fun1(): String =
{
"zhangsan"
}
val a = fun1
val b = fun1 _
val c :
()=>Unit = fun1
println(a)
println(b)
}
}
函数作为参数
object ScalaFunction {
def main(args: Array[String]): Unit =
{
def fun2( i:Int ): Int =
{
i *
2
}
def fun22( f : Int => Int ): Int =
{
f(10)
}
println(fun22(fun2))
}
}
函数作为返回值
object ScalaFunction {
def main(args: Array[String]): Unit =
{
def fun3( i:Int ): Int =
{
i *
2
}
def fun33(
)
=
{
fun3 _
}
println(fun33()(10))
}
}
匿名函数
object ScalaFunction {
def main(args: Array[String]): Unit =
{
def fun4( f:Int => Int ): Int =
{
f(10)
}
println(fun4((x:Int)=>{x *
20}))
println(fun4((x)=>{x *
20}))
println(fun4((x)=>x *
20))
println(fun4(x=>x *
20))
println(fun4(_ *
20))
}
}
控制抽象
object ScalaFunction {
def main(args: Array[String]): Unit =
{
def fun7(op:
=> Unit)
=
{
op
}
fun7{
println("xx")
}
}
}
闭包
object ScalaFunction {
def main(args: Array[String]): Unit =
{
def fun5()
=
{
val i =
20
def fun55()
=
{
i *
2
}
fun55 _
}
fun5()()
}
}
函数柯里化
object ScalaFunction {
def main(args: Array[String]): Unit =
{
def fun6(i:Int)(j:Int)
=
{
i * j
}
}
}
递归函数
object ScalaFunction {
def main(args: Array[String]): Unit =
{
def fun8(j:Int):Int =
{
if
( j <=
1
)
{
1
}
else
{
j * fun8(j-1)
}
}
println(fun8(5))
}
}
惰性函数
当函数返回值被声明为lazy时,函数的执行将被推迟,直到我们首次对此取值,该函数才会执行。这种函数我们称之为惰性函数。
object ScalaFunction {
def main(args: Array[String]): Unit =
{
def fun9(): String =
{
println("function...")
"zhangsan"
}
lazy val a = fun9()
println("----------")
println(a)
}
}
面向对象编程
Scala是一门完全面向对象的语言,摒弃了Java中很多不是面向对象的语法。虽然如此,但其面向对象思想和Java的面向对象思想还是一致的
基础面向对象编程
包
- 基本语法
Scala中基本的package包语法和Java完全一致
package com.zhangjk.bigdata
- 扩展语法
Java中package包的语法比较单一,Scala对此进行扩展
- Scala中的包和类的物理路径没有关系
- package关键字可以嵌套声明使用
package com
package zhangjk {
package bigdata {
object ScalaPackage {
def test(): Unit =
{
println("test...")
}
}
}
}
- 同一个源码文件中子包可以直接访问父包中的内容,而无需import
package com
package zhangjk {
package bigdata {
class Test {
}
package scala {
object ScalaPackage {
def test(): Unit =
{
new Test()
}
}
}
}
}
- Scala中package也可以看作对象,并声明属性和函数
package com
package object zhangjk {
val name : String =
"zhangsan"
def test(): Unit =
{
println( name )
}
}
package zhangjk {
package zhangjk {
package scala {
object ScalaPackage {
def test(): Unit =
{
}
}
}
}
}
导入
- 基本语法import
Scala中基本的import导入语法和Java完全一致
import java.util.List
import java.util._ // Scala中使用下划线代替Java中的星号
- 扩展语法
Java中import导入的语法比较单一,Scala对此进行扩展
- Scala中的import语法可以在任意位置使用
object ScalaImport{
def main(args: Array[String]): Unit =
{
import java.util.ArrayList
new ArrayList()
}
}
- Scala中可以导包,而不是导类
object ScalaImport{
def main(args: Array[String]): Unit =
{
import java.util
new util.ArrayList()
}
}
- Scala中可以在同一行中导入相同包中的多个类,简化代码
import java.util.{List, ArrayList}
- Scala中可以屏蔽某个包中的类
import java.util._
import java.sql.{ Date=>_, Array=>_, _ }
- Scala中可以给类起别名,简化使用
import java.util.{ArrayList=>AList}
object ScalaImport{
def main(args: Array[String]): Unit =
{
new AList()
}
}
- Scala中可以使用类的绝对路径而不是相对路径
import _root_.java.util.ArrayList
- 默认情况下,Scala中会导入如下包和对象
import java.lang._
import scala._
import scala.Predef._
类
面向对象编程中类可以看成一个模板,而对象可以看成是根据模板所创建的具体事物
- 基本语法
// 声明类:访问权限 class 类名 { 类主体内容 }
class User {
// 类的主体内容
}
// 对象:new 类名(参数列表)
new User()
- 扩展语法
Scala中一个源文件中可以声明多个公共类
属性
- 基本语法
class User {
var name : String = _ // 类属性其实就是类变量
var age : Int = _ // 下划线表示类的属性默认初始化
}
- 扩展语法
Scala中的属性其实在编译后也会生成方法
class User {
var name : String = _
val age : Int =
30
private val email : String = _
@BeanProperty var address : String = _
}
访问权限
Scala中的访问权限和Java中的访问权限类似,但是又有区别:
private
:
私有访问权限
private[包名]:
包访问权限
protected
:
受保护权限,不能同包
默认:
公共访问权限
方法
Scala中的类的方法其实就是函数,所以声明方式完全一样,但是必须通过使用对象进行调用
object ScalaMethod{
def main(args: Array[String]): Unit =
{
val user =
new User
user.login("zhangsan",
"000000")
}
}
class User {
def login( name:String, password:String ): Boolean =
{
false
}
}
对象
Scala中的对象和Java是类似的
val | var 对象名
[:类型]
=
new
类型()
var user : User =
new User()
构造方法
和Java一样,Scala中构造对象也需要调用类的构造方法来创建。并且一个类中可以有任意多个不相同的构造方法。这些构造方法可以分为2大类:主构造函数和辅助构造函数。
class User()
{
// 主构造函数
var username : String = _
def this( name:String )
{
// 辅助构造函数,使用this关键字声明
this()
// 辅助构造函数应该直接或间接调用主构造函数
username = name
}
def this( name:String, password:String )
{
this(name)
// 构造器调用其他另外的构造器,要求被调用构造器必须提前声明
}
}
高阶面向对象编程
继承
和Java一样,Scala中的继承也是单继承,且使用extends关键字。
class Person {
}
class User extends Person {
}
构造对象时需要考虑构造方法的执行顺序
封装
封装就是把抽象出的数据和对数据的操作封装在一起,数据被保护在内部,程序的其它部分只有通过被授权的操作(成员方法),才能对数据进行访问。
- 将属性进行私有化
- 提供一个公共的set方法,用于对属性赋值
- 提供一个公共的get方法,用于获取属性的值
抽象
Scala将一个不完整的类称之为抽象类。
abstract
class Person {
}
Scala中如果一个方法只有声明而没有实现,那么是抽象方法,因为它不完整。
abstract
class Person {
def test():Unit
}
Scala中如果一个属性只有声明没有初始化,那么是抽象属性,因为它不完整。
abstract
class Person {
var name:String
}
子类如果继承抽象类,必须实现抽象方法或补全抽象属性,否则也必须声明为抽象的,因为依然不完整。
abstract
class Person {
var name:String
}
class User extends Person {
var name : String =
"zhangsan"
}
单例对象
- 所谓的单例对象,就是在程序运行过程中,指定类的对象只能创建一个,而不能创建多个。这样的对象可以由特殊的设计方式获得,也可以由语言本身设计得到,比如object伴生对象
- Scala语言是完全面向对象的语言,所以并没有静态的操作(即在Scala中没有静态的概念)。但是为了能够和Java语言交互(因为Java中有静态概念),就产生了一种特殊的对象来模拟类对象,该对象为单例对象。若单例对象名与类名一致,则称该单例对象这个类的伴生对象,这个类的所有"静态"内容都可以放置在它的伴生对象中声明,然后通过伴生对象名称直接调用
- 如果类名和伴生对象名称保持一致,那么这个类称之为伴生类。Scala编译器可以通过伴生对象的apply方法创建伴生类对象。apply方法可以重载,并传递参数,且可由Scala编译器自动识别。所以在使用时,其实是可以省略的。
class User {
// 伴生类
}
object User {
// 伴生对象
def apply()
=
new User()
// 构造伴生类对象
}
...
val user1 =
new User()// 通过构造方法创建对象
Val user2 = User.apply()
// 通过伴生对象的apply方法构造伴生类对象
val user3 = User()
// scala编译器省略apply方法,自动完成调用
特质
Scala将多个类的相同特征从类中剥离出来,形成一个独立的语法结构,称之为"特质"(特征)。这种方式在Java中称之为接口,但是Scala中没有接口的概念。所以scala中没有interface关键字,而是采用特殊的关键字trait来声明特质, 如果一个类符合某一个特征(特质),那么就可以将这个特征(特质)"混入"到类中。这种混入的操作可以在声明类时使用,也可以在创建类对象时动态使用。
- 基本语法
trait 特质名称
class
类名
extends
父类(特质1) with 特质2 with特质3
trait Operator {
}
trait DB{
}
class MySQL extends Operator with DB{
}
问题: 特质到底是什么?为什么又可以使用extends,又可以使用with?
- 特质是scala中代码复用的基础单元
- 它可以将方法和字段定义封装起来,然后添加到类中
- 与类继承不一样的是,类继承要求每个类都只能继承一个超类,而一个类可以添加任意数量的特质。
- 特质的定义和抽象类的定义很像,但它是使用trait关键字
使用extends来继承trait(scala不论是类还是特质,都是使用extends关键字),如果要继承多个trait,则使用with关键字
- 动态混入
object ScalaTrait{
def main(args: Array[String]): Unit =
{
val mysql =
new MySQL with Operator
mysql.insert()
}
}
trait Operator {
def insert(): Unit =
{
println("insert data...")
}
}
class MySQL {
}
- 初始化叠加
object ScalaTrait{
def main(args: Array[String]): Unit =
{
val mysql =
new MySQL
}
}
trait Operator {
println("operator...")
}
trait DB {
println("db...")
}
class MySQL extends DB with Operator{
println("mysql...")
}
- 功能叠加
object ScalaTrait {
def main(args: Array[String]): Unit =
{
val mysql: MySQL =
new MySQL
mysql.operData()
}
}
trait Operate{
def operData():Unit={
println("操作数据。。")
}
}
trait DB extends Operate{
override def operData(): Unit =
{
print("向数据库中。。")
super.operData()
}
}
trait Log extends Operate{
override def operData(): Unit =
{
super.operData()
}
}
class MySQL extends DB with Log {
}
问题: scala中的super是什么?
可以使用super来引用父类,使用super关键字来访问父类的成员方法
扩展
- 类型检查和转换
class Person{
}
object Person {
def main(args: Array[String]): Unit =
{
val person =
new Person
//(1)判断对象是否为某个类型的实例
val bool: Boolean = person.isInstanceOf[Person]
if
( bool )
{
//(2)将对象转换为某个类型的实例
val p1: Person = person.asInstanceOf[Person]
println(p1)
}
//(3)获取类的信息
val pClass: Class[Person]
= classOf[Person]
println(pClass)
}
}
问题: 字符串真的不可变吗?
字符串不可变一般指底层的char数组的内存地址不可变
但是内容是可以变得
在java和scala中没有提供任何方法去修改字符串的内容,可使用特殊的方式进行修改(反射)
- 枚举类和应用类
object Test {
def main(args: Array[String]): Unit =
{
println(Color.RED)
}
}
// 枚举类
object Color extends Enumeration {
val RED = Value(1,
"red")
val YELLOW = Value(2,
"yellow")
val BLUE = Value(3,
"blue")
}
// 应用类
object AppTest extends App {
println("application");
}
- Type定义新类型
使用type关键字可以定义新的数据数据类型名称,本质上就是类型的一个别名
object Test {
def main(args: Array[String]): Unit =
{
type S = String
var v : S =
"abc"
}
}
集合
简介
Scala的集合有三大类:序列Seq、集Set、映射Map,所有的集合都扩展自Iterable特质。对于几乎所有的集合类,Scala都同时提供了可变和不可变的版本。
可变集合可以在适当的地方被更新或扩展。这意味着你可以修改,添加,移除一个集合的元素。而不可变集合类,相比之下,永远不会改变。不过,你仍然可以模拟添加,移除或更新操作。但是这些操作将在每一种情况下都返回一个新的集合,同时使原来的集合不发生改变,所以这里的不可变并不是变量本身的值不可变,而是变量指向的那个内存地址不可变
可变集合和不可变集合,在scala中一般可以根据集合所在包名进行区分
scala.collection.immutable
scala.collection.mutable
数组
不可变数组
- 基本语法
object ScalaCollection{
def main(args: Array[String]): Unit =
{
//(1)数组定义
val arr01 =
new Array[Int](4)
println(arr01.length)
// 4
//(2)数组赋值
//(2.1)修改某个元素的值
arr01(3)
=
10
val i =
10
arr01(i/3)
=
20
//(2.2)采用方法的形式修改数组的值
arr01.update(0,1)
//(3)遍历数组
//(3.1)查看数组
println(arr01.mkString(","))
//(3.2)普通遍历
for
(i <- arr01)
{
println(i)
}
//(3.3)简化遍历
def printx(elem:Int): Unit =
{
println(elem)
}
arr01.foreach(printx)
arr01.foreach((x)=>{println(x)})
arr01.foreach(println(_))
arr01.foreach(println)
}
}
- 基本操作
object ScalaCollection{
def main(args: Array[String]): Unit =
{
// 创建数组的另外一种方式
val arr1 = Array(1,2,3,4)
val arr2 = Array(5,6,7,8)
// 添加数组元素,创建新数组
val arr3: Array[Int]
= arr1 :+
5
println( arr1 eq arr3 )
// false
val arr4: Array[Int]
= arr1 ++: arr2
// 添加集合
val arr5: Array[Int]
= arr1 ++ arr2
arr4.foreach(println)
println("****************")
arr5.foreach(println)
println("****************")
// 多维数组
var myMatrix = Array.ofDim[Int](3,3)
myMatrix.foreach(list=>list.foreach(println))
// 合并数组
val arr6: Array[Int]
= Array.concat(arr1, arr2)
arr6.foreach(println)
// 创建指定范围的数组
val arr7: Array[Int]
= Array.range(0,2)
arr7.foreach(println)
// 创建并填充指定数量的数组
val arr8:Array[Int]
= Array.fill[Int](5)(-1)
arr8.foreach(println)
}
}
可变数组
- 基本语法
import scala.collection.mutable.ArrayBuffer
object ScalaCollection{
def main(args: Array[String]): Unit =
{
val buffer =
new ArrayBuffer[Int]
// 增加数据
buffer.append(1,2,3,4)
// 修改数据
buffer.update(0,5)
buffer(1)
=
6
// 删除数据
val i: Int = buffer.remove(2)
buffer.remove(2,2)
// 查询数据
println(buffer(3))
// 循环集合
for
( i <- buffer )
{
println(i)
}
}
}
- 基本操作
import scala.collection.mutable.ArrayBuffer
object ScalaCollection{
def main(args: Array[String]): Unit =
{
val buffer1 = ArrayBuffer(1,2,3,4)
val buffer2 = ArrayBuffer(5,6,7,8)
val buffer3: ArrayBuffer[Int]
= buffer1 +=
5
println( buffer1 eq buffer3 )
// true
// 使用 ++ 运算符会产生新的集合数组
val buffer4: ArrayBuffer[Int]
= buffer1 ++ buffer2
// 使用 ++= 运算符会更新之前的集合,不会产生新的数组
val buffer5: ArrayBuffer[Int]
= buffer1 ++= buffer2
println( buffer1 eq buffer4 )
// false
println( buffer1 eq buffer5 )
// true
}
}
可变数组和不可变数组转换
import scala.collection.mutable
import scala.collection.mutable.ArrayBuffer
object ScalaCollection{
def main(args: Array[String]): Unit =
{
val buffer = ArrayBuffer(1,2,3,4)
val array = Array(4,5,6,7)
// 将不可变数组转换为可变数组
val buffer1: mutable.Buffer[Int]
= array.toBuffer
// 将可变数组转换为不可变数组
val array1: Array[Int]
= buffer.toArray
}
}
Seq集合
不可变List
- 基本语法
object ScalaCollection{
def main(args: Array[String]): Unit =
{
// Seq集合
val list = List(1,2,3,4)
// 增加数据
val list1: List[Int]
= list :+
1
println(list1 eq list)
list1.foreach(println)
val list2: List[Int]
=
1
+: list
list2.foreach(println)
println("*****************")
val list3: List[Int]
= list.updated(1,5)
println(list eq list3)
List3.foreach(println)
}
}
- 基本操作
object ScalaCollection{
def main(args: Array[String]): Unit =
{
// Seq集合
val list1 = List(1,2,3,4)
// 空集合
val list2: List[Nothing]
= List()
val nil = Nil
println(list2 eq nil)
// 创建集合
val list3: List[Int]
=
1::2::3::Nil
val list4: List[Int]
= list1 ::: Nil
// 连接集合
val list5: List[Int]
= List.concat(list3, list4)
list5.foreach(println)
// 创建一个指定重复数量的元素列表
val list6: List[String]
= List.fill[String](3)("a")
list6.foreach(println)
}
}
可变List
- 基本语法
import scala.collection.mutable.ListBuffer
object ScalaCollection{
def main(args: Array[String]): Unit =
{
// 可变集合
val buffer =
new ListBuffer[Int]()
// 增加数据
buffer.append(1,2,3,4)
// 修改数据
buffer.update(1,3)
// 删除数据
buffer.remove(2)
buffer.remove(2,2)
// 获取数据
println(buffer(1))
// 遍历集合
buffer.foreach(println)
}
}
- 基本操作
import scala.collection.mutable.ListBuffer
object ScalaCollection{
def main(args: Array[String]): Unit =
{
// 可变集合
val buffer1 = ListBuffer(1,2,3,4)
val buffer2 = ListBuffer(5,6,7,8)
// 增加数据
val buffer3: ListBuffer[Int]
= buffer1 :+
5
val buffer4: ListBuffer[Int]
= buffer1 +=
5
val buffer5: ListBuffer[Int]
= buffer1 ++ buffer2
val buffer6: ListBuffer[Int]
= buffer1 ++= buffer2
println( buffer5 eq buffer1 )
println( buffer6 eq buffer1 )
val buffer7: ListBuffer[Int]
= buffer1 -
2
val buffer8: ListBuffer[Int]
= buffer1 -=
2
println( buffer7 eq buffer1 )
println( buffer8 eq buffer1 )
}
}
可变集合和不可变集合转换
import scala.collection.mutable
import scala.collection.mutable.ListBuffer
object ScalaCollection{
def main(args: Array[String]): Unit =
{
val buffer = ListBuffer(1,2,3,4)
val list = List(5,6,7,8)
// 可变集合转变为不可变集合
val list1: List[Int]
= buffer.toList
// 不可变集合转变为可变集合
val buffer1: mutable.Buffer[Int]
= list.toBuffer
}
}
Set集合
不可变Set
- 基本语法
object ScalaCollection{
def main(args: Array[String]): Unit =
{
val set1 = Set(1,2,3,4)
val set2 = Set(5,6,7,8)
// 增加数据
val set3: Set[Int]
= set1 +
5
+
6
val set4: Set[Int]
= set1.+(6,7,8)
println( set1 eq set3 )
// false
println( set1 eq set4 )
// false
set4.foreach(println)
// 删除数据
val set5: Set[Int]
= set1 -
2
-
3
set5.foreach(println)
val set6: Set[Int]
= set1 ++ set2
set6.foreach(println)
println("********")
val set7: Set[Int]
= set2 ++: set1
set7.foreach(println)
println(set6 eq set7)
}
}
- 基本操作
object ScalaCollection{
def main(args: Array[String]): Unit =
{
val set1 = Set(1,2,3,4)
val set2 = Set(5,6,7,8)
// 增加数据
val set3: Set[Int]
= set1 +
5
+
6
val set4: Set[Int]
= set1.+(6,7,8)
println( set1 eq set3 )
// false
println( set1 eq set4 )
// false
set4.foreach(println)
// 删除数据
val set5: Set[Int]
= set1 -
2
-
3
set5.foreach(println)
val set6: Set[Int]
= set1 ++ set2
set6.foreach(println)
println("********")
val set7: Set[Int]
= set2 ++: set1
set7.foreach(println)
println(set6 eq set7)
}
}
可变Set
- 基本语法
import scala.collection.mutable
object ScalaCollection{
def main(args: Array[String]): Unit =
{
val set1 = mutable.Set(1,2,3,4)
val set2 = mutable.Set(5,6,7,8)
// 增加数据
set1.add(5)
// 添加数据
set1.update(6,true)
println(set1.mkString(","))
// 删除数据
set1.update(3,false)
println(set1.mkString(","))
// 删除数据
set1.remove(2)
println(set1.mkString(","))
// 遍历数据
set1.foreach(println)
}
}
- 基本操作
import scala.collection.mutable
object ScalaCollection{
def main(args: Array[String]): Unit =
{
val set1 = mutable.Set(1,2,3,4)
val set2 = mutable.Set(4,5,6,7)
// 交集
val set3: mutable.Set[Int]
= set1 & set2
println(set3.mkString(","))
// 差集
val set4: mutable.Set[Int]
= set1 &~ set2
println(set4.mkString(","))
}
}
问题: Scala中Array(数组), Seq(序列), List 区别
Scala数组与Scala序列是兼容的,在需要Seq[T]的地方可由Array[T]代替,并且Scala数组支持所有的序列操作。
Scala的Seq相当于Java的List,Scala的List相当于Java的LinkedList。
因为Seq是一个trait,它相当于Java的接口。 Scala的List是一个抽象类,由Nil和::扩展,这是List的具体实现。所以,在Java的List是一个接口,Scala的List是一个实现。
除此之外,Scala的List是不可变的,这不是LinkedList的情况。事实上,Java没有等价的不可变集合(只读的东西只保证新的对象不能改变,但仍然可以改变旧的)。
Scala的List是由编译器和库高度优化的,它是函数式编程中的基本数据类型。然而,它仍有限制就是不足以并行编程。所以,Vector是一个比List更好的选择,但习惯是很难打破。
Seq是一个很好的泛化序列,所以如果编程到接口,应该使用它。注意,实际上有三个:collection.Seq,collection.mutable.Seq和collection.immutable.Seq,最后一个
"默认"导入。
Map集合
Map(映射)是一种可迭代的键值对(key/value)结构。所有的值都可以通过键来获取。Map 中的键都是唯一的。
不可变Map
- 基本语法
object ScalaCollection{
def main(args: Array[String]): Unit =
{
val map1 = Map(
"a"
->
1,
"b"
->
2,
"c"
->
3
)
val map2 = Map(
"d"
->
4,
"e"
->
5,
"f"
->
6
)
// 添加数据
val map3 = map1 +
("d"
->
4)
println(map1 eq map3)
// false
// 删除数据
val map4 = map3 -
"d"
println(map4.mkString(","))
val map5: Map[String, Int]
= map1 ++ map2
println(map5 eq map1)
println(map5.mkString(","))
val map6: Map[String, Int]
= map1 ++: map2
println(map6 eq map1)
println(map6.mkString(","))
// 修改数据
val map7: Map[String, Int]
= map1.updated("b",
5)
println(map7.mkString(","))
// 遍历数据
map1.foreach(println)
}
}
- 基本操作
object ScalaCollection{
def main(args: Array[String]): Unit =
{
val map1 = Map(
"a"
->
1,
"b"
->
2,
"c"
->
3
)
val map2 = Map(
"d"
->
4,
"e"
->
5,
"f"
->
6
)
// 创建空集合
val empty: Map[String, Int]
= Map.empty
println(empty)
// 获取指定key的值
val i: Int = map1.apply("c")
println(i)
println(map1("c"))
// 获取可能存在的key值
val maybeInt: Option[Int]
= map1.get("c")
// 判断key值是否存在
if
(
!maybeInt.isEmpty )
{
// 获取值
println(maybeInt.get)
}
else
{
// 如果不存在,获取默认值
println(maybeInt.getOrElse(0))
}
// 获取可能存在的key值, 如果不存在就使用默认值
println(map1.getOrElse("c",
0))
}
}
可变Map
- 基本语法
import scala.collection.mutable
object ScalaCollection{
def main(args: Array[String]): Unit =
{
val map1 = mutable.Map(
"a"
->
1,
"b"
->
2,
"c"
->
3
)
val map2 = mutable.Map(
"d"
->
4,
"e"
->
5,
"f"
->
6
)
// 添加数据
map1.put("d",
4)
val map3: mutable.Map[String, Int]
= map1 +
("e"
->
4)
println(map1 eq map3)
val map4: mutable.Map[String, Int]
= map1 +=
("e"
->
5)
println(map1 eq map4)
// 修改数据
map1.update("e",8)
map1("e")
=
8
// 删除数据
map1.remove("e")
val map5: mutable.Map[String, Int]
= map1 -
"e"
println(map1 eq map5)
val map6: mutable.Map[String, Int]
= map1 -=
"e"
println(map1 eq map6)
// 清除集合
map1.clear()
}
}
- 基本操作
import scala.collection.mutable
object ScalaCollection{
def main(args: Array[String]): Unit =
{
val map1 = mutable.Map(
"a"
->
1,
"b"
->
2,
"c"
->
3
)
val map2 = mutable.Map(
"d"
->
4,
"e"
->
5,
"f"
->
6
)
val set: Set[(String, Int)]
= map1.toSet
val list: List[(String, Int)]
= map1.toList
val seq: Seq[(String, Int)]
= map1.toSeq
val array: Array[(String, Int)]
= map1.toArray
println(set.mkString(","))
println(list.mkString(","))
println(seq.mkString(","))
println(array.mkString(","))
println(map1.get("a"))
println(map1.getOrElse("a",
0))
println(map1.keys)
println(map1.keySet)
println(map1.keysIterator)
println(map1.values)
println(map1.valuesIterator)
}
}
元组
在Scala语言中,可以将多个无关的数据元素封装为一个整体,这个整体称之为:元素组合,简称元组。有时也可将元组看成容纳元素的容器,其中最多只能容纳22个
object ScalaCollection{
def main(args: Array[String]): Unit =
{
// 创建元组,使用小括号
val tuple =
(1,
"zhangsan",
30)
// 根据顺序号访问元组的数据
println(tuple._1)
println(tuple._2)
println(tuple._3)
// 迭代器
val iterator: Iterator[Any]
= tuple.productIterator
// 根据索引访问元素
tuple.productElement(0)
// 如果元组的元素只有两个,那么我们称之为对偶元组,也称之为键值对
val kv:
(String, Int)
=
("a",
1)
val kv1:
(String, Int)
=
"a"
->
1
println( kv eq kv1 )
}
}
问题:
- 元组只能放22个数据,是不是太少了呢?
scala的元祖个数最多为22个,通常情况下,个数上限能满足使用需求。但是极限情况下,处理大数据的过程中,通常要对超过22个字段进行解析。此时可以通过定义一个普通类继承Product类的方式实现。
- 函数的参数最多能放多少个?
22个
队列
Scala也提供了队列(Queue)的数据结构,队列的特点就是先进先出。进队和出队的方法分别为enqueue和dequeue。
import scala.collection.mutable
object ScalaCollection{
def main(args: Array[String]): Unit =
{
val que =
new mutable.Queue[String]()
// 添加元素
que.enqueue("a",
"b",
"c")
val que1: mutable.Queue[String]
= que +=
"d"
println(que eq que1)
// 获取元素
println(que.dequeue())
println(que.dequeue())
println(que.dequeue())
}
}
问题:
- kafka中如何保证消费数据的有序?
创建topic的时候只设置1个分区
Kafka在单个分区时能保证数据的有序,多个分区之前无法保证数据的有序
并行
Scala为了充分使用多核CPU,提供了并行集合(有别于前面的串行集合),用于多核环境的并行计算。
object ScalaCollection{
def main(args: Array[String]): Unit =
{
val result1 =
(0 to 100).map{x => Thread.currentThread.getName}
val result2 =
(0 to 100).par.map{x => Thread.currentThread.getName}
println(result1)
println(result2)
}
}
问题:
- 并发 & 并行?
并发的关键是有处理多个任务的能力,不一定要同时。
并行的关键是有同时处理多个任务的能力。
- 什么是线程安全问题?如何解决?
线程安全问题:
在操作系统中,进程之间的数据是隔离的。但是注意:如果是一个进程里面多个线程,线程之间是共享一个进程的
在Java中,如果使用多个Thread线程启动同一个Runable的线程对象,此时这些线程会共享Runable对象中的属性,就容易出现线程安全问题(非线程安全问题)。
什么是线程安全的?
如果代码所在的进程中有多个线程在同时运行,而这些线程可能会同时运行这段代码。如果每次运行结果和单线程运行的结果是一样的,而且其他的变量的值也和预期的是一样的,就是线程安全的。或者说:一个类或者程序所提供的接口对于线程来说是原子操作或者多个线程之间的切换不会导致该接口的执行结果存在二义性,也就是说我们不用考虑同步的问题。
出现线程安全问题是因为在一个进程里面当多个线程对同一个线程对象进行启动,此时就容易出现线程安全问题。
怎么解决?
使用加锁解决,在Java中目前加锁有两种
1、synchronized关键字
2、Lock(1.5JDK)
- ThreadLocal能解决线程安全问题吗?共享数据
ThreadLocal能够解决线程安全的问题,但无法共享数据
ThreadLocal是JDK提供的,它提供了线程本地变量。
什么是线程本地变量呢?其实就是你创建了一个Threadlocal变量,每个访问Threadlocal变量的线程复制一个副本到本地。
线程操作的都是本地的副本,这也就是说每个线程都是操作的自己本地的变量,那就完美的避免了线程安全的问题。
常用方法
- 常用方法
object ScalaCollection{
def main(args: Array[String]): Unit =
{
val list = List(1,2,3,4)
// 集合长度
println("size =>"
+ list.size)
println("length =>"
+ list.length)
// 判断集合是否为空
println("isEmpty =>"
+ list.isEmpty)
// 集合迭代器
println("iterator =>"
+ list.iterator)
// 循环遍历集合
list.foreach(println)
// 将集合转换为字符串
println("mkString =>"
+ list.mkString(","))
// 判断集合中是否包含某个元素
println("contains =>"
+ list.contains(2))
// 取集合的前几个元素
println("take =>"
+ list.take(2))
// 取集合的后几个元素
println("takeRight =>"
+ list.takeRight(2))
// 查找元素
println("find =>"
+ list.find(x => x %
2==
0))
// 丢弃前几个元素
println("drop =>"
+ list.drop(2))
// 丢弃后几个元素
println("dropRight =>"
+ list.dropRight(2))
// 反转集合
println("reverse =>"
+ list.reverse)
// 去重
println("distinct =>"
+ list.distinct)
}
}
- 衍生集合
object ScalaCollection{
def main(args: Array[String]): Unit =
{
val list = List(1,2,3,4)
val list1 = List(1,2,3,4)
val list2 = List(3,4,5,6)
// 集合头
println("head => "
+ list.head)
// 集合尾
println("tail => "
+ list.tail)
// 集合尾迭代
println("tails => "
+ list.tails)
// 集合初始值
println("init => "
+ list.init)
// 集合初始值迭代
println("inits => "
+ list.inits)
// 集合最后元素
println("last => "
+ list.last)
// 集合并集
println("union => "
+ list.union(list1))
// 集合交集
println("intersect => "
+ list.intersect(list1))
// 集合差集
println("diff => "
+ list.diff(list1))
// 切分集合
println("splitAt => "
+ list.splitAt(2))
// 滑动(窗口)
println("sliding => "
+ list.sliding(2))
// 滚动(没有重复)
println("sliding => "
+ list.sliding(2,2))
// 拉链
println("zip => "
+ list.zip(list1))
// 数据索引拉链
println("zipWithIndex => "
+ list.zipWithIndex)
}
}
- 计算函数
object ScalaCollection{
def main(args: Array[String]): Unit =
{
val list = List(1,2,3,4)
val list1 = List(3,4,5,6)
// 集合最小值
println("min => "
+ list.min)
// 集合最大值
println("max => "
+ list.max)
// 集合求和
println("sum => "
+ list.sum)
// 集合乘积
println("product => "
+ list.product)
// 集合简化规约
println("reduce => "
+ list.reduce((x:Int,y:Int)=>{x+y}))
println("reduce => "
+ list.reduce((x,y)=>{x+y}))
println("reduce => "
+ list.reduce((x,y)=>x+y))
println("reduce => "
+ list.reduce(_+_))
// 集合简化规约(左)
println("reduceLeft => "
+ list.reduceLeft(_+_))
// 集合简化规约(右)
println("reduceRight => "
+ list.reduceRight(_+_))
// 集合折叠
println("fold => "
+ list.fold(0)(_+_))
// 集合折叠(左)
println("foldLeft => "
+ list.foldLeft(0)(_+_))
// 集合折叠(右)
println("foldRight => "
+ list.foldRight(0)(_+_))
// 集合扫描
println("scan => "
+ list.scan(0)(_+_))
// 集合扫描(左)
println("scanLeft => "
+ list.scanLeft(0)(_+_))
// 集合扫描(右)
println("scanRight => "
+ list.scanRight(0)(_+_))
}
}
- 功能函数
object ScalaCollection{
def main(args: Array[String]): Unit =
{
val list = List(1,2,3,4)
// 集合映射
println("map => "
+ list.map(x=>{x*2}))
println("map => "
+ list.map(x=>x*2))
println("map => "
+ list.map(_*2))
// 集合扁平化
val list1 = List(
List(1,2),
List(3,4)
)
println("flatten =>"
+ list1.flatten)
// 集合扁平映射
println("flatMap =>"
+ list1.flatMap(list=>list))
// 集合过滤数据
println("filter =>"
+ list.filter(_%2
==
0))
// 集合分组数据
println("groupBy =>"
+ list.groupBy(_%2))
// 集合排序
println("sortBy =>"
+ list.sortBy(num=>num)(Ordering.Int.reverse))
println("sortWith =>"
+ list.sortWith((left, right)
=>
{left < right}))
}
}
模式匹配
简介
Scala中的模式匹配类似于Java中的switch语法,但是scala从语法中补充了更多的功能,可以按照指定的规则对数据或对象进行匹配, 所以更加强大。
int i =
20
switch
(i)
{
default
:
System.out.println("other number");
break;
case
10
:
System.out.println("10");
//break;
case
20
:
System.out.println("20");
break;
}
基本语法
模式匹配语法中,采用match关键字声明,每个分支采用case关键字进行声明,当需要匹配时,会从第一个case分支开始,如果匹配成功,那么执行对应的逻辑代码,如果匹配不成功,继续执行下一个分支进行判断。如果所有case都不匹配,那么会执行case _分支,类似于Java中default语句。如果不存在case _分支,那么会发生错误。
object ScalaMatch{
def main(args: Array[String]): Unit =
{
var a: Int =
10
var b: Int =
20
var operator: Char =
'd'
var result = operator match {
case
'+'
=> a + b
case
'-'
=> a - b
case
'*'
=> a * b
case
'/'
=> a / b
case _ =>
"illegal"
}
println(result)
}
}
匹配规则
- 匹配常量
def describe(x: Any)
= x match {
case
5
=>
"Int five"
case
"hello"
=>
"String hello"
case
true
=>
"Boolean true"
case
'+'
=>
"Char +"
}
- 匹配类型
def describe(x: Any)
= x match {
case i: Int =>
"Int"
case s: String =>
"String hello"
case m: List[_]
=>
"List"
case c: Array[Int]
=>
"Array[Int]"
case someThing =>
"something else "
+ someThing
}
- 匹配数组
for
(arr <- Array(Array(0), Array(1,
0), Array(0,
1,
0), Array(1,
1,
0), Array(1,
1,
0,
1), Array("hello",
90)))
{
// 对一个数组集合进行遍历
val result = arr match {
case Array(0)
=>
"0"
//匹配Array(0) 这个数组
case Array(x, y)
=> x +
","
+ y //匹配有两个元素的数组,然后将将元素值赋给对应的x,y
case Array(0, _*)
=>
"以0开头的数组"
//匹配以0开头和数组
case _ =>
"something else"
}
println("result = "
+ result)
}
- 匹配列表
for
(list <- Array(List(0), List(1,
0), List(0,
0,
0), List(1,
0,
0), List(88)))
{
val result = list match {
case List(0)
=>
"0"
//匹配List(0)
case List(x, y)
=> x +
","
+ y //匹配有两个元素的List
case List(0, _*)
=>
"0 ..."
case _ =>
"something else"
}
println(result)
}
val list: List[Int]
= List(1,
2,
5,
6,
7)
list match {
case first :: second :: rest => println(first +
"-"
+ second +
"-"
+ rest)
case _ => println("something else")
}
- 匹配元组
for
(tuple <- Array((0,
1),
(1,
0),
(1,
1),
(1,
0,
2)))
{
val result = tuple match {
case
(0, _)
=>
"0 ..."
//是第一个元素是0的元组
case
(y,
0)
=>
""
+ y +
"0"
// 匹配后一个元素是0的对偶元组
case
(a, b)
=>
""
+ a +
" "
+ b
case _ =>
"something else"
//默认
}
println(result)
}
- 匹配对象
class User(val name: String, val age: Int)
object User{
def apply(name: String, age: Int): User =
new User(name, age)
def unapply(user: User): Option[(String, Int)]
=
{
if
(user ==
null)
None
else
Some(user.name, user.age)
}
}
val user: User = User("zhangsan",
11)
val result = user match {
case User("zhangsan",
11)
=>
"yes"
case _ =>
"no"
}
样例类
样例类就是使用case关键字声明的类
样例类仍然是类,和普通类相比,只是其自动生成了伴生对象,并且伴生对象中自动提供了一些常用的方法,如apply、unapply、toString、equals、hashCode和copy。
样例类是为模式匹配而优化的类,因为其默认提供了unapply方法,因此,样例类可以直接使用模式匹配,而无需自己实现unapply方法。
构造器中的每一个参数都成为val,除非它被显式地声明为var(不建议这样做)
case
class User(name: String, var age: Int)
object ScalaCaseClass {
def main(args: Array[String]): Unit =
{
val user: User = User("zhangsan",
11)
val result = user match {
case User("zhangsan",
11)
=>
"yes"
case _ =>
"no"
}
println(result)
}
}
应用场景
- 变量声明
object ScalaMatch {
def main(args: Array[String]): Unit =
{
val (x, y)
=
(1,
2)
println(s"x=$x,y=$y")
val Array(first, second, _*)
= Array(1,
7,
2,
9)
println(s"first=$first,second=$second")
val Person(name, age)
= Person("zhangsan",
16)
println(s"name=$name,age=$age")
}
case
class Person(name: String, age: Int)
}
- 循环匹配
object ScalaMatch {
def main(args: Array[String]): Unit =
{
val map = Map("A"
->
1,
"B"
->
0,
"C"
->
3)
for
((k, v)
<- map)
{
//直接将map中的k-v遍历出来
println(k +
" -> "
+ v)
//3个
}
println("----------------------")
//遍历value=0的 k-v ,如果v不是0,过滤
for
((k,
0)
<- map)
{
println(k +
" --> "
+
0)
// B->0
}
println("----------------------")
//if v == 0 是一个过滤的条件
for
((k, v)
<- map if v >=
1)
{
println(k +
" ---> "
+ v)
// A->1 和 c->33
}
}
}
- 函数参数
object ScalaMatch {
def main(args: Array[String]): Unit =
{
val list = List(
("a",
1),
("b",
2),
("c",
3)
)
val list1 = list.map {
case
( k, v )
=>
{
(k, v*2)
}
}
println(list1)
}
}
偏函数
所谓的偏函数,其实就是对集合中符合条件的数据进行处理的函数
偏函数也是函数的一种,通过偏函数可以方便的对输入参数做更精确的检查。
基本语法
// 声明偏函数
val pf: PartialFunction[Int, String]
=
{
case
1
=>
"one"
}
。。。
// 应用偏函数
println(List(1,
2,
3,
4).collect(pf))
案例
将该List(1,2,3,4,5,6,"test")中的Int类型的元素加一,并去掉字符串。
- 不使用偏函数
List(1,2,3,4,5,6,"test").filter(_.isInstanceOf[Int]).map(_.asInstanceOf[Int]
+
1).foreach(println)
- 使用偏函数
List(1,
2,
3,
4,
5,
6,
"test").collect {
case x: Int => x +
1
}.foreach(println)
异常
简介
Scala异常语法处理上和Java类似,但是又不尽相同。
Java异常:
try
{
int a =
10;
int b =
0;
int c = a / b;
}
catch
(ArithmeticException e){
// catch时,需要将范围小的写到前面
e.printStackTrace();
}
catch
(Exception e){
e.printStackTrace();
}
finally
{
System.out.println("finally");
}
Scala异常基本语法:
object ScalaException {
def main(args: Array[String]): Unit =
{
try
{
var n=
10
/
0
}
catch
{
case ex: ArithmeticException=>{
// 发生算术异常
println("发生算术异常")
}
case ex: Exception=>{
// 对异常处理
println("发生了异常1")
}
}
finally
{
println("finally")
}
}
}
Scala中的异常不区分所谓的编译时异常和运行时异常,也无需显示抛出方法异常,所以Scala中没有throws关键字。
问题:
- 如果Java程序调用scala代码,如何明确异常?
增加注解 @throws(Exception)
隐式转换
简介
在之前的类型学习中,已经学习了自动类型转换,精度小的类型可以自动转换为精度大的类型,这个转换过程无需开发人员参与,由编译器自动完成,这个转换操作称之为隐式转换。
在其他的场合,隐式转换也起到了非常重要的作用。如Scala在程序编译错误时,可以通过隐式转换中类型转换机制尝试进行二次编译,将本身错误无法编译通过的代码通过类型转换后编译通过。慢慢地,这也形成了一种扩展功能的转换机制。
隐式函数
object ScalaImplicit {
def main(args: Array[String]): Unit =
{
implicit def transform( d : Double ): Int =
{
d.toInt
}
var d : Double =
2.0
val i : Int = d
println(i)
}
}
隐式参数 & 隐式变量
object ScalaImplicit {
def main(args: Array[String]): Unit =
{
def transform( implicit d : Double )
=
{
d.toInt
}
implicit val dd : Double =
2.0
println(transform)
}
}
10.4 隐式类
在Scala2.10后提供了隐式类,可以使用implicit声明类,隐式类非常强大,同样可以扩展类的功能,在集合的数据处理中,隐式类发挥了重要的作用。
- 其所带的构造参数有且只能有一个
- 隐式类必须被定义在"类"或"伴生对象"或"包对象"里,即隐式类不能是顶级的。
object ScalaImplicit {
def main(args: Array[String]): Unit =
{
val emp =
new Emp()
emp.insertUser()
}
class Emp {
}
implicit class User( emp : Emp)
{
def insertUser(): Unit =
{
println("insert user...")
}
}
}
隐式机制
所谓的隐式机制,就是一旦出现编译错误时,编译器会从哪些地方查找对应的隐式转换规则
当前代码作用域
当前代码上级作用域
当前类所在的包对象
当前类(对象)的父类(父类)或特质(父特质)
其实最直接的方式就是直接导入。
泛型
简介
Scala的泛型和Java中的泛型表达的含义都是一样的,对处理的数据类型进行约束,但是Scala提供了更加强大的功能
class Test[A]
{
private var elements: List[A]
= Nil
}
泛型转换
Scala的泛型可以根据功能进行改变
- 泛型不可变
object ScalaGeneric {
def main(args: Array[String]): Unit =
{
val test1 : Test[User]
=
new Test[User]
// OK
val test2 : Test[User]
=
new Test[Parent]
// Error
val test3 : Test[User]
=
new Test[SubUser]
// Error
}
class Test[T]
{
}
class Parent {
}
class User extends Parent{
}
class SubUser extends User {
}
}
- 泛型协变
object ScalaGeneric {
def main(args: Array[String]): Unit =
{
val test1 : Test[User]
=
new Test[User]
// OK
val test2 : Test[User]
=
new Test[Parent]
// Error
val test3 : Test[User]
=
new Test[SubUser]
// OK
}
class Test[+T]
{
}
class Parent {
}
class User extends Parent{
}
class SubUser extends User {
}
}
- 泛型逆变
object ScalaGeneric {
def main(args: Array[String]): Unit =
{
val test1 : Test[User]
=
new Test[User]
// OK
val test2 : Test[User]
=
new Test[Parent]
// OK
val test3 : Test[User]
=
new Test[SubUser]
// Error
}
class Test[-T]
{
}
class Parent {
}
class User extends Parent{
}
class SubUser extends User {
}
}
- 泛型边界
Scala的泛型可以根据功能设定类树的边界
object ScalaGeneric {
def main(args: Array[String]): Unit =
{
val parent : Parent =
new Parent()
val user : User =
new User()
val subuser : SubUser =
new SubUser()
test[User](parent)
// Error
test[User](user)
// OK
test[User](subuser)
// OK
}
def test[A]( a : A ): Unit =
{
println(a)
}
class Parent {
}
class User extends Parent{
}
class SubUser extends User {
}
}
- 泛型上限
object ScalaGeneric {
def main(args: Array[String]): Unit =
{
val parent : Parent =
new Parent()
val user : User =
new User()
val subuser : SubUser =
new SubUser()
test[Parent](parent)
// Error
test[User](user)
// OK
test[SubUser](subuser)
// OK
}
def test[A<:User]( a : A ): Unit =
{
println(a)
}
class Parent {
}
class User extends Parent{
}
class SubUser extends User {
}
}
- 泛型下限
object ScalaGeneric {
def main(args: Array[String]): Unit =
{
val parent : Parent =
new Parent()
val user : User =
new User()
val subuser : SubUser =
new SubUser()
test[Parent](parent)
// OK
test[User](user)
// OK
test[SubUser](subuser)
// Error
}
def test[A>:User]( a : A ): Unit =
{
println(a)
}
class Parent {
}
class User extends Parent{
}
class SubUser extends User {
}
}
- 上下文限定
上下文限定是将泛型和隐式转换的结合产物,以下两者功能相同,使用上下文限定[A : Ordering]之后,方法内无法使用隐式参数名调用隐式参数,需要通过implicitly[Ordering[A]]获取隐式变量,如果此时无法查找到对应类型的隐式变量,会发生出错误。
object ScalaGeneric {
def main(args: Array[String]): Unit =
{
def f[A : Test](a: A)
= println(a)
implicit val test : Test[User]
=
new Test[User]
f(
new User()
)
}
class Test[T]
{
}
class Parent {
}
class User extends Parent{
}
class SubUser extends User {
}
}
正则表达式
简介
正则表达式(regular expression)描述了一种字符串匹配的模式(pattern),可以用来检查一个串是否含有某种子串、将匹配的子串替换或者从某个串中取出符合某个条件的子串等。
基本语法
object ScalaRegex {
def main(args: Array[String]): Unit =
{
// 构建正则表达式
val pattern =
"Scala".r
val str =
"Scala is Scalable Language"
// 匹配字符串 - 第一个
println(pattern findFirstIn str)
// 匹配字符串 - 所有
val iterator: Regex.MatchIterator = pattern findAllIn str
while
( iterator.hasNext )
{
println(iterator.next())
}
println("***************************")
// 匹配规则:大写,小写都可
val pattern1 =
new Regex("(S|s)cala")
val str1 =
"Scala is scalable Language"
println((pattern1 findAllIn str1).mkString(","))
}
}
Spark详解(01) - Scala编程语言的更多相关文章
- Spark详解
原文连接 http://xiguada.org/spark/ Spark概述 当前,MapReduce编程模型已经成为主流的分布式编程模型,它极大地方便了编程人员在不会分布式并行编程的情况下,将自己的 ...
- scala 模式匹配详解 2 scala里是怎么实现的?
在这篇martin和另外两位模式匹配领域专家的论文里说了模式匹配的几种实现方式,以及scala是选择哪种方式来实现的.http://lampwww.epfl.ch/~emir/written/Matc ...
- 21个项目玩转深度学习:基于TensorFlow的实践详解01—MNIST机器学习入门
数据集 由Yann Le Cun建立,训练集55000,验证集5000,测试集10000,图片大小均为28*28 下载 # coding:utf-8 # 从tensorflow.examples.tu ...
- spark——详解rdd常用的转化和行动操作
本文始发于个人公众号:TechFlow,原创不易,求个关注 今天是spark第三篇文章,我们继续来看RDD的一些操作. 我们前文说道在spark当中RDD的操作可以分为两种,一种是转化操作(trans ...
- 小甲鱼PE详解之IMAGE_DOS_HEADER结构定义即各个属性的作用(PE详解01)
(注:最左边是文件头的偏移量.) IMAGE_DOS_HEADER STRUCT { +0h WORD e_magic // Magic DOS signature MZ(4Dh 5Ah) ...
- (Go)07.Go语言中strings和strconv包示例代码详解01
1.strings使用 前缀和后缀 HasPrefix判断字符串s是否以prefix开头: 示例: package main import ( "fmt" "string ...
- IO模型(epoll)--详解-01
写在前面 从事服务端开发,少不了要接触网络编程.epoll作为linux下高性能网络服务器的必备技术至关重要,nginx.redis.skynet和大部分游戏服务器都使用到这一多路复用技术. 本文会从 ...
- Spark框架详解
一.引言 作者:Albert陈凯链接:https://www.jianshu.com/p/f3181afec605來源:简书 Introduction 本文主要讨论 Apache Spark 的设计与 ...
- winxp计算机管理中服务详解
winxp计算机管理中服务详解01 http://blog.sina.com.cn/s/blog_60f923b50100efy9.html http://blog.sina.com.cn/s/blo ...
- yum的配置文件yum.conf详解
说明:经过网上抄袭和自己的总结加实验,非常详细,可留作参考. yum的配置一般有两种方式: 一种是直接配置/etc目录下的yum.conf文件, 另外一种是在/etc/yum.repos.d目录下 ...
随机推荐
- 最长公共前缀(Java)
编写一个函数来查找字符串数组中的最长公共前缀. 如果不存在公共前缀,返回空字符串 "". 示例 1: 输入:strs = ["flower","flo ...
- java多线程的两种创建方式
方式一:继承Thread类 1.创建一个继承于Thread类的子类 2.重写Thread类的run()方法---> 将此线程执行的操作声明在run()中 3.创建Thread类的子类的对象 4. ...
- CCS 2022 极客少年挑战赛 writeup
目录 题目一DSDS 操作内容: 题目二 easy_re 操作内容: flag值: 题目三 1+1=all 解题过程 题目一DSDS 操作内容: 开环境然后进入网址在网址后./目录 进入目录得到个 ...
- CSS clear both清除浮动
.clear{clear:both;} <div class="clear"></div>
- oracle expdp/exp ora-600/ora-39014报错处理
在一次数据迁移的时候,expdp导出报错,错误信息如下: 版本号:11.2.0.1 没有打PSU,查看报错的aler部分日志如下: 其中的某一些trc日志文件截图: Trace file d:\ora ...
- 2.Python封装练习及私有属性
面向对象三大特性 封装:根据职责将属性和方法封装到一个抽象的类中 继承:实现代码的重用,相同代码不需要重复的编写 1.单继承 2.多继承 多态:不同的对象调用相同的方法,产生不同的执行结果,增加代码的 ...
- 【单片机入门】(三)应用层软件开发的单片机学习之路-----UART串口通讯和c#交互
引言 在第一章博客中,我们讲了Arduino对Esp32的一个环境配置,以及了解到了常用的一个总线通讯协议,其中有SPI,IIC,UART等,今天我为大家带来UART串口通讯和c#串口进行通讯的一个案 ...
- Java多线程(4):ThreadLocal
您好,我是湘王,这是我的博客园,欢迎您来,欢迎您再来- 为了提高CPU的利用率,工程师们创造了多线程.但是线程们说:要有光!(为了减少线程创建(T1启动)和销毁(T3切换)的时间),于是工程师们又接着 ...
- Web自动化---解决登录页面随机验证码问题
一.抛出问题 在日常的测试工作中,遇到了这样一个登录页面,如下图: 像我们之前做过UI自动化的同学就知道,自动输入账号和密码,这个简单,但是怎么样来识别验证码呢?验证码的形式有多种,有纯数字的,纯字母 ...
- android学习 基础知识
布局管理器 大小用dp; 字体用sp 线性布局 与 相对布局是可以嵌套使用的,根据实际需求,灵活使用. 1.通用属性 # 大小相关 layout_width="100dp":宽度 ...