/** * 大数据技术是数据的集合以及对数据集合的操作技术的统称,具体来说: * 1,数据集合:会涉及数据的搜集.存储等,搜集会有很多技术,存储现在比较经典的是使用Hadoop,也有很多情况使用Kafka: * 2,对数据集合的操作技术:目前全球最火爆的是Spark: * * Spark的框架实现语言是Scala,首选的应用程序开发语言也是Scala,所以Scala对集合以及集合操作的支持就至关重要且必须异常强大: * 一个补充说明是:可能是巧合,Spark中对很多数据的操作的算子和Scala中