1. 集合

集合主要有三种:

  1. Sequence
  2. Map
  3. Set

sequence是一种线性元素的集合,可能会是索引或者线性的(链表)。map是包含键值对的集合,就像Java的Map,set是包含无重复元素的集合。

除了这三个主要的集合类之外,还有其他有用的集合类型,如Stack, Queue和Range。还有其他一些用起来像集合的类,如元组、枚举、Option/Some/None以及Try/Success/Failure类。

Scala通用的序列集合:

不可变(Immutable) 可变
索引(Indexed) Vector ArrayBuffer
线性链表(Linked lists) List ListBuffer

主要不可变序列集合类:

索引序列 线性序列 描述
List 一个单链表。适于拆分头和剩余链表的递归算法
Queue 先进先出数据结构
Range 整数值范围
Stack 后进先出
Stream 与链表相似,但是延迟并且持久。适用于大型或无限序列,与
Haskell的链表类似
String 可以被当作一个不可变的,索引的字符序列
Vector “定位”不可变,可索引的序列。Scaladoc这样描述它, “处
理split和join非常有效率的一组嵌套数组实现”

主要的可变序列集合:

索引序列 线性序列 描述
Array 依靠于Java的数组,其中元素是可变的,但不能改变大小
ArrayBuffer 一个可变的序列集合的“定位”类。成本是常数
ArrayStack 后进先出数据结构。在性能比较重要时Stack更好
DoubleLinkedList 像一个单链表,但有一个prev方法。文档说“额外的连
接让删除元素变得非常快。”
LinkedList 一个可变的单链表
ListBuffer 像ArrayBuffer,但依靠链表。文档说, 如果想把buffer
转成list,用ListBuffer而不是ArrayBuffer。前插后插开
销都是常数。其他的大部分操作都是线性的
MutableList 一个可变的,单链表,后插开销是常数
Queue 先进先出数据结构
Stack 后进先出数据结构。(文档建议ArrayStack的效率稍微好
些。)
StringBuilder 像在循环里构建字符串

常用到的map:

不可变 可变 描述
HashMap

不可变版本用“hash trie” (晗希线索)实现,可变版本用
“哈希表”实现
LinkedHashMap
“用哈希表实现可变map”,元素按插入顺序返回
ListMap

用链表数据结构实现的map。元素按插入的相反顺序返回,因
为每次插入的元素都放在head
Map

基础的map,有可变的和不可变的实现
SortedMap
接序存键的一个基本特质。(当前用5。rtedMap创建一个变量
返回TreeMap。)
TreeMap
不可变的,排序的map,由红黑树实现
WeakHashMap
一个java.util.WeakHashMap的包装,弱引用的hashmap

选择Set:

不可变 可变 描述
BitSet

非负整数表示为比特放入64位字节的可变尺寸数组。当有一组
整数时来节省内存空间
HashSet
不可变版本用“hash trie” (哈希线索),可变版本用“哈希
表” ( hashtable)
LinkedHashSet

一个由hashtable实现的可变Set,按照插入顺序返回元素
ListSet

用链表实现的set
TreeSet
不可变版本用树实现。可变版本基于不可变的AVL树作为数据结构的SortedSet
Set
一般的基础特质
SortedSet
一个基础特质

表现的像集合的类型:

Scala提供了很多其他的集合类型,还有一些表现的像集合的类型,尽管它们不是集合:

描述
Enumeration 一个包含常数值的有限集合(比如,一周的天数或一年的周数)
Iterator 迭代器不是一个集合,它可以访问集合中的元素.它也是集合,然而,定义许多方法便会发现一个普通的集合类,包括foreach, map, flatMap等。也可以在需要时把迭代器转换为一个集合
Option 包含一个或者零个元素的集合,Some和None继承自Option。
Tuple 支持异构的集合元素。没有一个“元组”类,元组由Tuple1 到Tuple22组成, 支持从1至22个元素

2. List

创建List:

val list = List(1,2,3)
val list1 = List[Number](1,2,3,4)
val list2 = List.range(1,10)
val list3 = List.range(1,20,2)
val list4 = List.fill[String](3)("list")
List[Char] list5 = "list".toList

创建可变列表:

var buffer = new ListBuffer[String]()
buffer.+=("you","have","a","child")
buffer += "。"
println(buffer.toList) 输出:
List(you, have, a, child, 。) Process finished with exit code 0

List基本方法的使用:

1.合并两个list:

val l3 = list ::: list1
val l7 = list ++ list1
val l8 = List.concat(list,list1)
println(l3,l7,l8) 结果:
(List(2, 3, 4, 5),
List(2, 3, 4, 5),
List(2, 3, 4, 5))

2.+:和:+ 的用法区别-连接两个列表:

val list = List(2,3)
val list1 = List(4,5)
val l2 = list +: list1
val l3 = list :+ list1
println(l2,l3)
输出:
(List(List(2, 3), 4, 5),
List(2, 3, List(4, 5)))

由结果可以看出+:和:+是根据”:”的方法来解析数据的,”:”朝向那一边,这一边的数据就会作为基数据,另一方的数据会被添加到这个List中。

3.使用Stream—-惰性计算元素周期

List通过::构造, Stream可以用#::方法构建,表达式的结尾用Stream.empty代替Nil:

val stream = 1#::2#::3#::Stream.empty
println(stream)
val iterator = stream.iterator
while (iterator.hasNext){
println(iterator.next())
}
输出:
Stream(1, ?)
1
2
3 Process finished with exit code 0

可以看到打印stream的时候只打出了1,后面的是?。这是因为流的结尾还没有执行,?表示惰性集合的结尾尚未被执行的表示方式。

2.数组

2.1 创建数组:

val array = Array(1,2,3)
val array1 = Array("I","am","a","boy")
val array2 = Array[String]("I","am","a","boy")
val array3 = new Array[Number](3)
array3(0) = 1
array3(1) = 2
array3(2) = 3 println(array.toList,array1.toList,array2.toList,array3.toList) 输出:
(List(1, 2, 3),
List(I, am, a, boy),
List(I, am, a, boy),
List(1, 2, 3))

其他创建数组的方式:

val a1 = Array.range(1,10)
val a2 = Array.range(1,20,2)
val a3 = Array.apply(2,3,4,5,6)
val a4 = Array.fill[String](3)("oo")
val a5 = Array.tabulate(5)(n=>n+5) println(a1.toList,a2.toList,a3.toList,a4.toList,a5.toList) 输出:
(List(1, 2, 3, 4, 5, 6, 7, 8, 9),
List(1, 3, 5, 7, 9, 11, 13, 15, 17, 19),
List(2, 3, 4, 5, 6),
List(oo, oo, oo),
List(5, 6, 7, 8, 9))

创建可变数组:

Array既是可变的又是不可变的,可变的是他的内容,不可变的是他的大小。要想创建一个大小可变的数组,可以使用ArrayBuffer。

val a1 = ArrayBuffer[Number](1)
a1 += 2
a1 += 3
a1 += 4
println(a1) val a2 = List[Number](5,6)
a1 ++= a2
println(a1)
输出:
ArrayBuffer(1, 2, 3, 4)
ArrayBuffer(1, 2, 3, 4, 5, 6) Process finished with exit code 0

删除操作:

val a1 = ArrayBuffer[Number](1,2,3,4,5)
a1 -= 1
println(a1)
a1 -= (1,2)
println(a1)
a1 --= List(1,2,3)
println(a1)
val a2 = ArrayBuffer[Number](2,2,4,3,4,5)
#删除第一个位置的数据
a2.remove(1)
println(a2)
#从第三个位置开始,删除两个数据
a2.remove(3,2)
println(a2) 输出: ArrayBuffer(2, 3, 4, 5)
ArrayBuffer(3, 4, 5)
ArrayBuffer(4, 5)
ArrayBuffer(2, 4, 3, 4, 5)
ArrayBuffer(2, 4, 3) Process finished with exit code 0

3. Map

创建Map:

var a1 =  Map("name"->"xiaoming","age"->12)
val a2 = Map(("name","xiaoming"),("age",12))
a1 += ("address"->"xxxx")
println(a1,a2) 输出:
(Map(name -> xiaoming, age -> 12, address -> xxxx),
Map(name -> xiaoming, age -> 12)) Process finished with exit code 0

修改Map:

默认Map是immutable类型的,所以如果要修改Map,需要手动引入Mutable的Map。

var a1 =  mutable.Map("name"->"xiaoming","age"->12)
a1("name") = "xiaohong"
println(a1)
a1 ++= List("address"->"xxx","sex"->1)
println(a1)
a1 -= "name"
println(a1)
a1 --= List("age","sex")
println(a1)
a1.put("idCard","111")
a1.remove("address")
println(a1) 输出:
Map(age -> 12, name -> xiaohong)
Map(address -> xxx, age -> 12, name -> xiaohong, sex -> 1)
Map(address -> xxx, age -> 12, sex -> 1)
Map(address -> xxx)
Map(idCard -> 111)

遍历映射:

var a1 =  mutable.Map("name"->"xiaoming","age"->12,"address"->"xxx","sex"->1)
for((k,v) <- a1){
println(k,v)
}
a1.foreach(x=>{
println(x._1,x._2)
})

常用方法:

var a1 =  mutable.Map("name"->"xiaoming","age"->12,"address"->"xxx","sex"->1)
//判断某个key是否存在
if(a1.contains("name")){
println(a1("name"))
}
//过滤元素,a1直接就被改变为过滤后的值
a1 = a1.retain((k,v)=>k.length == 3)
println(a1)
//改变元素的值
a1.transform((k,v)=>v + "1")
println(a1)
a1 = mutable.Map("name"->"xiaoming","age"->12,"address"->"xxx","sex"->1)
//保留指定的key,一定要将返回结果赋值给新的变量,返回类型为MapLike
val a2 =a1.filterKeys(_.length > 3)
println(a2)
//也可以使用Set集合传递你需要的key
val a3 = a1.filterKeys(Set("name","age"))
println(a3)
//使用filter方法可以任意指定过滤key还是value
a1 = a1.filter(k=>k._1.length > 3)
println(a1)
//take方法可以提取map中的前n个元素,注意如果用Map因为是无序的,每次都不保证取出元素的顺序
a1 = mutable.LinkedHashMap("name"->"xiaoming","age"->12,"address"->"xxx","sex"->1)
a1 = a1.take(2)
println(a1) 输出:
xiaoming
Map(age -> 12, sex -> 1)
Map(age -> 121, sex -> 11)
Map(address -> xxx, name -> xiaoming)
Map(age -> 12, name -> xiaoming)
Map(address -> xxx, name -> xiaoming)
Map(name -> xiaoming, age -> 12)

4.Set

集合的基本操作:

val a1 = mutable.Set(1,2,3,4)
a1 += 5
//集合中的元素是无序的并且是唯一的
a1 += 1
println(a1)
a1 += (6,7)
println(a1)
a1 ++= List(8,9)
println(a1)
a1.add(10)
println(a1)
a1 -= 1
println(a1)
a1 -= (2,3)
println(a1)
a1 --=Array(4,5)
println(a1)
//过滤元素
a1.retain(_ > 9)
println(a1) 输出: Set(1, 5, 2, 3, 4)
Set(1, 5, 2, 6, 3, 7, 4)
Set(9, 1, 5, 2, 6, 3, 7, 4, 8)
Set(9, 1, 5, 2, 6, 3, 10, 7, 4, 8)
Set(9, 5, 2, 6, 3, 10, 7, 4, 8)
Set(9, 5, 6, 10, 7, 4, 8)
Set(9, 6, 10, 7, 8)
Set(10)

创建有序集合:

var a1 = SortedSet(1,2,3,4)
println(a1)
a1 = a1.filter(v=>v>3)
println(a1)
var a2 = mutable.LinkedHashSet(1,2,3,4)
a2 = a2.filter(v=>v>3)
println(a2) 输出:
TreeSet(1, 2, 3, 4)
TreeSet(4)
Set(4)

从输出类型上可以看到SortedSet被改变之后输出为TreeSet对象,这是因为SortedSet只有不可变的版本,如果想用可变的集合,可以使用TreeSet。

5.队列和堆栈
var a1 = mutable.Queue(1,2,3)
a1.enqueue(1)
var a2 = a1.dequeueAll(x=>x>0)
println(a2)
println(a1)
输出:
ArrayBuffer(1, 2, 3, 1)
Queue() var a1 = mutable.Stack(1,2,3,4)
a1.pop()
println(a1)
a1.push(1)
println(a1)
a1.pop()
println(a1) 输出:
Stack(2, 3, 4)
Stack(1, 2, 3, 4)
Stack(2, 3, 4) Process finished with exit code 0

6.强大的Range功能

var a1 = (1 to 10).toList
println(a1)
var a2 =(1 until(10)).toList
println(a2)
var a3 = (1 to 10 by(2)).toList
println(a3)
var a4 = ('a' to 'm').toList
println(a4) 输出:
List(1, 2, 3, 4, 5, 6, 7, 8, 9, 10)
List(1, 2, 3, 4, 5, 6, 7, 8, 9)
List(1, 3, 5, 7, 9)
List(a, b, c, d, e, f, g, h, i, j, k, l, m) Process finished with exit code 0

上面这些功能在for循环中经常用到。

Scala集合(四)的更多相关文章

  1. Scala集合操作

    大数据技术是数据的集合以及对数据集合的操作技术的统称,具体来说: 1.数据集合:会涉及数据的搜集.存储等,搜集会有很多技术,存储技术现在比较经典方案是使用Hadoop,不过也很多方案采用Kafka.  ...

  2. Spark:scala集合转化为DS/DF

    scala集合转化为DS/DF case class TestPerson(name: String, age: Long, salary: Double) val tom = TestPerson( ...

  3. Scala集合常用方法解析

    Java 集合 : 数据的容器,可以在内部容纳数据  List : 有序,可重复的  Set : 无序,不可重复  Map : 无序,存储K-V键值对,key不可重复 scala 集合 : 可变集合( ...

  4. Scala集合笔记

    Scala的集合框架类比Java提供了更多的一些方便的api,使得使用scala编程时代码变得非常精简,尤其是在Spark中,很多功能都是由scala的这些api构成的,所以,了解这些方法的使用,将更 ...

  5. Scala集合(一)

    Scala集合的主要特质 Iterator,用来访问集合中所有元素 val coll = ... // 某种Iterable val iter = col.iterator while(iter.ha ...

  6. Scala集合类型详解

    Scala集合 Scala提供了一套很好的集合实现,提供了一些集合类型的抽象. Scala 集合分为可变的和不可变的集合. 可变集合可以在适当的地方被更新或扩展.这意味着你可以修改,添加,移除一个集合 ...

  7. 再谈Scala集合

    集合!集合!一个现代语言平台上的程序员每天代码里用的最多的大概就是该语言上的集合类了,Scala的集合丰富而强大,至今无出其右者,所以这次再回过头再梳理一下. 本文原文出处:  还是先上张图吧,这是我 ...

  8. Spark记录-Scala集合

    Scala列表 Scala列表与数组非常相似,列表的所有元素都具有相同的类型,但有两个重要的区别. 首先,列表是不可变的,列表的元素不能通过赋值来更改. 其次,列表表示一个链表,而数组是平的. 具有类 ...

  9. scala集合与java集合的转换应用

    今天在业务开发中遇到需要Scala集合转为Java集合的场景: 因为业务全部是由Scala开发,但是也避免不了调用Java方法的场景,所以将此记录下来加深记忆: import scala.collec ...

  10. Scala集合学习总结

    遍历集合可以使用迭代器iterator的那套迭代方式.Seq是一个有先后次序的序列,比如数组或列表.IndexedSeq可以通过下标进行任意元素的访问.例如ArrrayBuffer. Set是一组没有 ...

随机推荐

  1. 常用的方法论-NPS

  2. elasticsearch 集群部署,版本 5.5.0

    准备说明: 两台服务器 Ip分别为 192.168.239.78(主),192.168.239.49(从) 主服务器上配置如下:1.上传es5.5.0版本至主服务器2.解压 unzipunzip el ...

  3. JAVA十大经典排序算法最强总结(含JAVA代码实现)

    十大经典排序算法最强总结(含JAVA代码实现)   最近几天在研究排序算法,看了很多博客,发现网上有的文章中对排序算法解释的并不是很透彻,而且有很多代码都是错误的,例如有的文章中在“桶排序”算法中对每 ...

  4. linux 不重启识别新添加的硬盘

    1.fdisk -l 看有没有新的磁盘 oebiotech@hadoop08:/media/nbc9$ sudo fdisk -l |grep sdl 2.查看主机总线 oebiotech@hadoo ...

  5. 数据库系统概念:JDBC

    import java.sql.*; public class DataBase { public static void main() { } } /* 5.1.1 JDBC */ class JD ...

  6. springcloud-高可用部署

    1.场景描述 前端时间只简单介绍了下springcloud的高可用方案(springcloud高可用方案),今天详细介绍下如何实施springcloud的高可用部署. 2.解决方案 2.1 架构方案 ...

  7. WMI_COM_API

    Win32_Processor // CPU 处理器 Win32_PhysicalMemory // 物理内存 Win32_Keyboard // 键盘 Win32_PointingDevice // ...

  8. 个人永久性免费-Excel催化剂功能第72波-序列规则下的数据验证有效性好帮手:快速录入窗体辅助录入

    Excel作为最好用的数据录入工具,没有之一,如果能够充分利用好Excel的灵活性和规范性,将带来极大的生产力提升,前面的几波功能也有做了几大数据录入的辅助功能,今天再次给大家带来一个特定的使用场景, ...

  9. 个人永久性免费-Excel催化剂功能第50波-批量打印、导出PDF、双面打印功能

    在倡导无纸化办公的今天,是否打印是一个碍眼的功能呢,某些时候的确是,但对于数据的留存,在现在鼓吹区块链技术的今天,仍然不失它的核心价值,数据报表.单据打印出来留存,仍然是一种不可或缺的数据存档和防篡改 ...

  10. C#2.0新增功能02 泛型

    连载目录    [已更新最新开发文章,点击查看详细] C# 语言和公共语言运行时 (CLR) 的 2.0 版本中添加了泛型. 泛型将类型参数的概念引入 .NET Framework,这样就可以设计具有 ...