Scala集合（四）

1. 集合

集合主要有三种：

Sequence
Map
Set

sequence是一种线性元素的集合，可能会是索引或者线性的（链表）。map是包含键值对的集合，就像Java的Map,set是包含无重复元素的集合。

除了这三个主要的集合类之外，还有其他有用的集合类型，如Stack, Queue和Range。还有其他一些用起来像集合的类，如元组、枚举、Option/Some/None以及Try/Success/Failure类。

Scala通用的序列集合：

	不可变(Immutable)	可变
索引(Indexed)	Vector	ArrayBuffer
线性链表(Linked lists)	List	ListBuffer

主要不可变序列集合类：

	索引序列	线性序列	描述
List		√	一个单链表。适于拆分头和剩余链表的递归算法
Queue		√	先进先出数据结构
Range	√		整数值范围
Stack		√	后进先出
Stream		√	与链表相似，但是延迟并且持久。适用于大型或无限序列，与 Haskell的链表类似
String	√		可以被当作一个不可变的，索引的字符序列
Vector	√		“定位”不可变，可索引的序列。Scaladoc这样描述它， “处理split和join非常有效率的一组嵌套数组实现”

主要的可变序列集合：

	索引序列	线性序列	描述
Array	√		依靠于Java的数组，其中元素是可变的，但不能改变大小
ArrayBuffer	√		一个可变的序列集合的“定位”类。成本是常数
ArrayStack	√		后进先出数据结构。在性能比较重要时Stack更好
DoubleLinkedList		√	像一个单链表，但有一个prev方法。文档说“额外的连接让删除元素变得非常快。”
LinkedList		√	一个可变的单链表
ListBuffer		√	像ArrayBuffer，但依靠链表。文档说，如果想把buffer 转成list，用ListBuffer而不是ArrayBuffer。前插后插开销都是常数。其他的大部分操作都是线性的
MutableList		√	一个可变的，单链表，后插开销是常数
Queue		√	先进先出数据结构
Stack		√	后进先出数据结构。（文档建议ArrayStack的效率稍微好些。）
StringBuilder	√		像在循环里构建字符串

常用到的map：

	不可变	可变	描述
HashMap	√	√	不可变版本用“hash trie” （晗希线索）实现，可变版本用 “哈希表”实现
LinkedHashMap		√	“用哈希表实现可变map”，元素按插入顺序返回
ListMap	√	√	用链表数据结构实现的map。元素按插入的相反顺序返回，因为每次插入的元素都放在head
Map	√	√	基础的map，有可变的和不可变的实现
SortedMap	√		接序存键的一个基本特质。（当前用5。rtedMap创建一个变量返回TreeMap。）
TreeMap	√		不可变的，排序的map，由红黑树实现
WeakHashMap		√	一个java.util.WeakHashMap的包装，弱引用的hashmap

选择Set：

	不可变	可变	描述
BitSet	√	√	非负整数表示为比特放入64位字节的可变尺寸数组。当有一组整数时来节省内存空间
HashSet	√	√	不可变版本用“hash trie” （哈希线索），可变版本用“哈希表” ( hashtable)
LinkedHashSet		√	一个由hashtable实现的可变Set，按照插入顺序返回元素
ListSet	√	√	用链表实现的set
TreeSet	√	√	不可变版本用树实现。可变版本基于不可变的AVL树作为数据结构的SortedSet
Set	√	√	一般的基础特质
SortedSet	√	√	一个基础特质

表现的像集合的类型：

Scala提供了很多其他的集合类型，还有一些表现的像集合的类型，尽管它们不是集合：

	描述
Enumeration	一个包含常数值的有限集合（比如，一周的天数或一年的周数）
Iterator	迭代器不是一个集合，它可以访问集合中的元素．它也是集合，然而，定义许多方法便会发现一个普通的集合类，包括foreach, map, flatMap等。也可以在需要时把迭代器转换为一个集合
Option	包含一个或者零个元素的集合，Some和None继承自Option。
Tuple	支持异构的集合元素。没有一个“元组”类，元组由Tuple1 到Tuple22组成，支持从1至22个元素

2. List

创建List：

val list = List(1,2,3)

val list1 = List[Number](1,2,3,4)

val list2 = List.range(1,10)

val list3 = List.range(1,20,2)

val list4 = List.fill[String](3)("list")

List[Char] list5 = "list".toList

创建可变列表：

var buffer = new ListBuffer[String]()

buffer.+=("you","have","a","child")

buffer += "。"

println(buffer.toList)

输出：

List(you, have, a, child, 。)

Process finished with exit code 0

List基本方法的使用：

1.合并两个list：

val l3 = list ::: list1

val l7 = list ++ list1

val l8 = List.concat(list,list1)

println(l3,l7,l8)

结果：

(List(2, 3, 4, 5),

List(2, 3, 4, 5),

List(2, 3, 4, 5))

2.+:和:+ 的用法区别-连接两个列表：

val list = List(2,3)

val list1 = List(4,5)

val l2 = list +: list1

val l3 = list :+ list1

println(l2,l3)

输出：

(List(List(2, 3), 4, 5),

List(2, 3, List(4, 5)))

由结果可以看出+:和:+是根据”:”的方法来解析数据的，”:”朝向那一边，这一边的数据就会作为基数据，另一方的数据会被添加到这个List中。

3.使用Stream—-惰性计算元素周期

List通过::构造， Stream可以用#::方法构建，表达式的结尾用Stream.empty代替Nil:

val stream = 1#::2#::3#::Stream.empty

println(stream)

val iterator = stream.iterator

while (iterator.hasNext){

  println(iterator.next())

}

输出：

Stream(1, ?)

1

2

3

Process finished with exit code 0

可以看到打印stream的时候只打出了1，后面的是?。这是因为流的结尾还没有执行,？表示惰性集合的结尾尚未被执行的表示方式。

2.数组

2.1 创建数组：

val array = Array(1,2,3)

val array1 = Array("I","am","a","boy")

val array2 = Array[String]("I","am","a","boy")

val array3 = new Array[Number](3)

array3(0) = 1

array3(1) = 2

array3(2) = 3

println(array.toList,array1.toList,array2.toList,array3.toList)

输出：

(List(1, 2, 3),

List(I, am, a, boy),

List(I, am, a, boy),

List(1, 2, 3))

其他创建数组的方式：

val a1 = Array.range(1,10)

val a2 = Array.range(1,20,2)

val a3 = Array.apply(2,3,4,5,6)

val a4 = Array.fill[String](3)("oo")

val a5 = Array.tabulate(5)(n=>n+5)

println(a1.toList,a2.toList,a3.toList,a4.toList,a5.toList)

输出：

(List(1, 2, 3, 4, 5, 6, 7, 8, 9),

List(1, 3, 5, 7, 9, 11, 13, 15, 17, 19),

List(2, 3, 4, 5, 6),

List(oo, oo, oo),

List(5, 6, 7, 8, 9))

创建可变数组：

Array既是可变的又是不可变的，可变的是他的内容，不可变的是他的大小。要想创建一个大小可变的数组，可以使用ArrayBuffer。

val a1 = ArrayBuffer[Number](1)

a1 += 2

a1 += 3

a1 += 4

println(a1)

val a2 = List[Number](5,6)

a1 ++= a2

println(a1)

输出：

ArrayBuffer(1, 2, 3, 4)

ArrayBuffer(1, 2, 3, 4, 5, 6)

Process finished with exit code 0

删除操作：

val a1 = ArrayBuffer[Number](1,2,3,4,5)

a1 -= 1

println(a1)

a1 -= (1,2)

println(a1)

a1 --= List(1,2,3)

println(a1)

val a2 = ArrayBuffer[Number](2,2,4,3,4,5)

#删除第一个位置的数据

a2.remove(1)

println(a2)

#从第三个位置开始，删除两个数据

a2.remove(3,2)

println(a2)

输出：

ArrayBuffer(2, 3, 4, 5)

ArrayBuffer(3, 4, 5)

ArrayBuffer(4, 5)

ArrayBuffer(2, 4, 3, 4, 5)

ArrayBuffer(2, 4, 3)

Process finished with exit code 0

3. Map

创建Map：

var a1 =  Map("name"->"xiaoming","age"->12)

val a2 = Map(("name","xiaoming"),("age",12))

a1 += ("address"->"xxxx")

println(a1,a2)

输出：

(Map(name -> xiaoming, age -> 12, address -> xxxx),

Map(name -> xiaoming, age -> 12))

Process finished with exit code 0

修改Map：

默认Map是immutable类型的，所以如果要修改Map，需要手动引入Mutable的Map。

var a1 =  mutable.Map("name"->"xiaoming","age"->12)

a1("name") = "xiaohong"

println(a1)

a1 ++= List("address"->"xxx","sex"->1)

println(a1)

a1 -= "name"

println(a1)

a1 --= List("age","sex")

println(a1)

a1.put("idCard","111")

a1.remove("address")

println(a1)

输出：

Map(age -> 12, name -> xiaohong)

Map(address -> xxx, age -> 12, name -> xiaohong, sex -> 1)

Map(address -> xxx, age -> 12, sex -> 1)

Map(address -> xxx)

Map(idCard -> 111)

遍历映射：

var a1 =  mutable.Map("name"->"xiaoming","age"->12,"address"->"xxx","sex"->1)

for((k,v) <- a1){

  println(k,v)

}

a1.foreach(x=>{

  println(x._1,x._2)

})

常用方法：

var a1 =  mutable.Map("name"->"xiaoming","age"->12,"address"->"xxx","sex"->1)

//判断某个key是否存在

if(a1.contains("name")){

  println(a1("name"))

}

//过滤元素,a1直接就被改变为过滤后的值

a1 = a1.retain((k,v)=>k.length == 3)

println(a1)

//改变元素的值

a1.transform((k,v)=>v + "1")

println(a1)

a1 =  mutable.Map("name"->"xiaoming","age"->12,"address"->"xxx","sex"->1)

//保留指定的key,一定要将返回结果赋值给新的变量，返回类型为MapLike

val a2  =a1.filterKeys(_.length > 3)

println(a2)

//也可以使用Set集合传递你需要的key

val a3 = a1.filterKeys(Set("name","age"))

println(a3)

//使用filter方法可以任意指定过滤key还是value

a1 = a1.filter(k=>k._1.length > 3)

println(a1)

//take方法可以提取map中的前n个元素，注意如果用Map因为是无序的，每次都不保证取出元素的顺序

a1 =  mutable.LinkedHashMap("name"->"xiaoming","age"->12,"address"->"xxx","sex"->1)

a1 = a1.take(2)

println(a1)

输出：

xiaoming

Map(age -> 12, sex -> 1)

Map(age -> 121, sex -> 11)

Map(address -> xxx, name -> xiaoming)

Map(age -> 12, name -> xiaoming)

Map(address -> xxx, name -> xiaoming)

Map(name -> xiaoming, age -> 12)

4.Set

集合的基本操作：

val a1 = mutable.Set(1,2,3,4)

a1 += 5

//集合中的元素是无序的并且是唯一的

a1 += 1

println(a1)

a1 += (6,7)

println(a1)

a1 ++= List(8,9)

println(a1)

a1.add(10)

println(a1)

a1 -= 1

println(a1)

a1 -= (2,3)

println(a1)

a1 --=Array(4,5)

println(a1)

//过滤元素

a1.retain(_ > 9)

println(a1)

输出：

Set(1, 5, 2, 3, 4)

Set(1, 5, 2, 6, 3, 7, 4)

Set(9, 1, 5, 2, 6, 3, 7, 4, 8)

Set(9, 1, 5, 2, 6, 3, 10, 7, 4, 8)

Set(9, 5, 2, 6, 3, 10, 7, 4, 8)

Set(9, 5, 6, 10, 7, 4, 8)

Set(9, 6, 10, 7, 8)

Set(10)

创建有序集合：

var a1 = SortedSet(1,2,3,4)

println(a1)

a1 = a1.filter(v=>v>3)

println(a1)

var a2 = mutable.LinkedHashSet(1,2,3,4)

a2 = a2.filter(v=>v>3)

println(a2)

输出：

TreeSet(1, 2, 3, 4)

TreeSet(4)

Set(4)

从输出类型上可以看到SortedSet被改变之后输出为TreeSet对象，这是因为SortedSet只有不可变的版本，如果想用可变的集合，可以使用TreeSet。

5.队列和堆栈

var a1 = mutable.Queue(1,2,3)

a1.enqueue(1)

var a2 = a1.dequeueAll(x=>x>0)

println(a2)

println(a1)

输出：

ArrayBuffer(1, 2, 3, 1)

Queue()

var a1 = mutable.Stack(1,2,3,4)

a1.pop()

println(a1)

a1.push(1)

println(a1)

a1.pop()

println(a1)

输出：

Stack(2, 3, 4)

Stack(1, 2, 3, 4)

Stack(2, 3, 4)

Process finished with exit code 0

6.强大的Range功能

var a1 = (1 to 10).toList

println(a1)

var a2 =(1 until(10)).toList

println(a2)

var a3 = (1 to 10 by(2)).toList

println(a3)

var a4 = ('a' to 'm').toList

println(a4)

输出：

List(1, 2, 3, 4, 5, 6, 7, 8, 9, 10)

List(1, 2, 3, 4, 5, 6, 7, 8, 9)

List(1, 3, 5, 7, 9)

List(a, b, c, d, e, f, g, h, i, j, k, l, m)

Process finished with exit code 0

上面这些功能在for循环中经常用到。

Scala集合（四）的更多相关文章

Scala集合操作
大数据技术是数据的集合以及对数据集合的操作技术的统称,具体来说: 1.数据集合:会涉及数据的搜集.存储等,搜集会有很多技术,存储技术现在比较经典方案是使用Hadoop,不过也很多方案采用Kafka. ...
Spark:scala集合转化为DS/DF
scala集合转化为DS/DF case class TestPerson(name: String, age: Long, salary: Double) val tom = TestPerson( ...
Scala集合常用方法解析
Java 集合 : 数据的容器,可以在内部容纳数据 List : 有序,可重复的 Set : 无序,不可重复 Map : 无序,存储K-V键值对,key不可重复 scala 集合 : 可变集合( ...
Scala集合笔记
Scala的集合框架类比Java提供了更多的一些方便的api,使得使用scala编程时代码变得非常精简,尤其是在Spark中,很多功能都是由scala的这些api构成的,所以,了解这些方法的使用,将更 ...
Scala集合(一）
Scala集合的主要特质 Iterator,用来访问集合中所有元素 val coll = ... // 某种Iterable val iter = col.iterator while(iter.ha ...
Scala集合类型详解
Scala集合 Scala提供了一套很好的集合实现,提供了一些集合类型的抽象. Scala 集合分为可变的和不可变的集合. 可变集合可以在适当的地方被更新或扩展.这意味着你可以修改,添加,移除一个集合 ...
再谈Scala集合
集合!集合!一个现代语言平台上的程序员每天代码里用的最多的大概就是该语言上的集合类了,Scala的集合丰富而强大,至今无出其右者,所以这次再回过头再梳理一下. 本文原文出处: 还是先上张图吧,这是我 ...
Spark记录-Scala集合
Scala列表 Scala列表与数组非常相似,列表的所有元素都具有相同的类型,但有两个重要的区别. 首先,列表是不可变的,列表的元素不能通过赋值来更改. 其次,列表表示一个链表,而数组是平的. 具有类 ...
scala集合与java集合的转换应用
今天在业务开发中遇到需要Scala集合转为Java集合的场景: 因为业务全部是由Scala开发,但是也避免不了调用Java方法的场景,所以将此记录下来加深记忆: import scala.collec ...
Scala集合学习总结
遍历集合可以使用迭代器iterator的那套迭代方式.Seq是一个有先后次序的序列,比如数组或列表.IndexedSeq可以通过下标进行任意元素的访问.例如ArrrayBuffer. Set是一组没有 ...

随机推荐

input的值为浅淡样式(点击值消失)
<input type="text" id="leftSearchValue" value="" placeholder=" ...
navicat中查重并删除
# 查询所有重复的数据 SELECT * FROM hao123 WHERE ir_url IN (SELECT ir_url FROM `hao123` GROUP BY ir_url having ...
RedisCrawlSpider
这个RedisCrawlSpider类爬虫继承了RedisCrawlSpider,能够支持分布式的抓取.因为采用的是crawlSpider,所以需要遵守Rule规则,以及callback不能写pars ...
Flags Over Objects
The Flags Over Objects anti-pattern occurs when behavior is written outside of an object by inspecti ...
Python入门基础(3 下)
接着讲列表里面的一些操作吧列表元素访问与计数 1.统计指定元素在列表中出现的次数使用count(),这就不必细说了,直接看代码,需要记住的是括号里面放的是元素 list = [1,5,5,5,5,8 ...
ES6中用&&跟||来简化if{}else{}的写法
目录 ES6中用&&跟||来简化if{}else{}的写法 1. if else的写法 2. ES6中 && ||的用法 3 ES6实例 4 开发环境 ES6中用&am ...
NOI 2011 兔农题解
事先声明,本博客代码主要模仿accepoc,且仅针对一般如本博主一样的蒟蒻. 这道题不得不说数据良心,给了75分的水分,但剩下25分真心很难得到,因此我们就来讲一讲这剩下的25分. 首先,有数据可知他 ...
[NOIP2013]华容道题解（搜索）
[NOIP2013]华容道 [题目描述] 这道题根据小时候玩华容道不靠谱的经验还以为是并查集,果断扑街.考后想想也是,数据这么小一定有他的道理. 首先由于是最小步数,所以BFS没跑了.那么我们大可把这 ...
【深入浅出-JVM】（8）：TLAB
概念 TLAB(Thread Local Allocation Buffer)线程本地分配缓冲区(线程私有分配区,私有分配,公共查看),占用 Eden 区(缺省 Eden 的1%),默认开启,JVM ...
ElasticStack学习（十）：深入ElasticSearch搜索之QueryFiltering、多/单字符串的多字段查询
一.复合查询 1.在ElasticSearch中,有Query和Filter两种不同的Context.Query Context进行了相关性算分,Filter Context不需要进行算分,同时可以利 ...