Java聚合操作(Aggregate Operations)是对一堆数据进行处理的新的操作方法,我们知道,如果想对一堆数据进行处理,比如一个List对象中的数据进行处理,传统的操作就是遍历List数据然后进行处理;现在有一种新的可以提供相同功能的操作方法,就是聚合操作(Aggregate Operations),它常与与lambda表达式绑定使用,在lambda表达式使用总结一节已经使用到了,这里举一个例子,如下代码,要求打印出List列表中性别为MALE的对象信息:

public class Main {
public static void main(String[] args) {
Person[] pers = {new Person(12, "h1",Person.Sex.FEMALE),
new Person(23, "h2",Person.Sex.MALE),
new Person(14, "h3",Person.Sex.FEMALE),
new Person(2, "h4",Person.Sex.MALE)};
List<Person> personList= Arrays.asList(pers);
//传统的for-each操作
for(Person p: personList){
if(p.getGender()== Person.Sex.MALE){
System.out.print(p+" ");
}
}
System.out.println("\n--------分割线--------");
//聚合操作
personList.stream().filter(obj->obj.getGender()==Person.Sex.MALE).forEach(obj->System.out.print(obj+" "));
}
}
@Data
@ToString
class Person{
int age;
String name;
Sex gender;
public Person(int age,String name,Sex gender){
this.age=age;
this.name=name;
this.gender=gender;
}
public Person(int age,String name){
this.age=age;
this.name=name;
}
public enum Sex {
MALE,FEMALE
}
}

上面的代码中,聚合操作的代码只一行就解决问题了,聚合操作涉及到两个概念:管道(pipeline)和流(stream),解释如下

管道(pipeline)是作用在源数据上的一些聚合操作,可以理解为数据源和多个聚合操作符号的组合,如上面的filter、forEach,一个管道包含以下内容:
1、一个数据源:可以是一个collection,array,生成函数,或则IO channel,本例中是一个集合。
2、0个或则多个中间操作,例如filter,可以产生一个新的流。
3、一个终止操作,例如forEach,产生一个非流的结果(non-stream result)。

流(stream)是一个个的元素,它不是某种数据结构,不用于存储数据,它的作用就是通过管道从数据源获取并传输数据,在上面的代码中集合personList通过调用stream()方法生成一个流。

归约操作:返回一个结果对象的操作,例如下面的示例:

double average = roster

    .stream()
.filter(p -> p.getGender() == Person.Sex.MALE)
.mapToInt(Person::getAge)
.average()
.getAsDouble(); 

上面的示例中,计算出所有男性对象的一个平均年龄,在聚合操作(aggregate operation)中有很多终止操作(terminal operation)只返回一个结果,这样的操作就是归约操作(reduction operation),除了返回一个值之外,还有一些归约操作返回一个集合对象。JDK提供了一个一般性的归约操作:reduce和collect方法。具体使用如下:

1、reduce方法,以一个示例引用使用方法,例如求所有人的年龄和:

Integer totalAge = roster
.stream()
.mapToInt(Person::getAge)
.sum();
Integer totalAgeReduce = roster
.stream()
.map(Person::getAge)
.reduce(
0,
(a, b) -> a + b);

上面的示例中的两种计算方法得出的结果是一样的,更多的使用案例可参考:https://www.cnblogs.com/qinhao517/p/9197885.html

2、collect方法,reduce是产生一个新值,而collect方法是来修改一个已经存在的值,还是上面的求平均年龄为例,我们可以创建一个对象用于存储计算结果:

class Averager implements IntConsumer{

    private int total = 0;
private int count = 0;
public double average() {
return count > 0 ? ((double) total)/count : 0;
}
public void accept(int i) { total += i; count++; }
public void combine(Averager other) {
total += other.total;
count += other.count;
}
}
Averager averageCollect = roster.stream()
.filter(p -> p.getGender() == Person.Sex.MALE)
.map(Person::getAge)
.collect(Averager::new, Averager::accept, Averager::combine); System.out.println("Average age of male members: " +
averageCollect.average()); 

上面的计算中,collect传入了三个参数,返回了一个Averager对象,传入的三个参数分别是:

supplier:是一个工厂函数,用于创建新的实例对象

accumulator:累加器函数用于将一个流元素合成一个结果容器,在这个示例中,它通过给count变量加一和将流元素(stream element)中的值(getAge方法获取到的年龄)加给total来修改Averager的结果

combiner:合并函数拿出两个结果容器(result container)来合并他们的内容,在这个示例中,它通过将其他结果容器的count值和total值累加到自己的(Averager::new 创建的对象)元素中来生成最终的结果

上面的示例中,filter方法过滤出所有男性的对象,map方法通过getAage获取年龄将人的对象单个的流对象映射成一个年龄值,collect方法通过这些年龄值的运算返回一个最终的结果,结果值是利用Averager对象最为媒介来返回的。

collect还可以将对象中的某个值抽取出来作为一个list返回给用户:

List<String> namesOfMaleMembersCollect = roster
.stream()
.filter(p -> p.getGender() == Person.Sex.MALE)
.map(p -> p.getName())
.collect(Collectors.toList());

除了上面的操作,下面还有其他的示例:

Map<Person.Sex, List<Person>> byGender =
roster
.stream()
.collect(
Collectors.groupingBy(Person::getGender));

上面的示例中,是通过性别,将不同的对象放到各自性别的List集合中,那我只想获取不同性别的对象的名字呢?

Map<Person.Sex, List<String>> namesByGender =
roster
.stream()
.collect(
Collectors.groupingBy(
Person::getGender,
Collectors.mapping(
Person::getName,
Collectors.toList())));

也可以获取每个性别的所有对象的年龄之和:

Map<Person.Sex, Integer> totalAgeByGender =
roster
.stream()
.collect(
Collectors.groupingBy(
Person::getGender,
Collectors.reducing(
0,
Person::getAge,
Integer::sum)));

上面的操作更复杂一些,reducing函数进行归约操作,上面的0是一个计算的基础标识,在此标识的基础上进行操作(operation),至于什么操作,第三个参数的Integer::sum给出了答案,Person::getAge对应的是一个mapper操作,该mapper利用getAge方法抽取出年龄。

Map<Person.Sex, Double> averageAgeByGender = roster
.stream()
.collect(
Collectors.groupingBy(
Person::getGender,
Collectors.averagingInt(Person::getAge)));

上面的是计算每个性别的年龄平均值。

还有其他很多类型的聚合操作,一个语法的熟练掌握还是需要靠实践来完成....

Java8-聚合操作的更多相关文章

  1. 大数据项目2(Java8聚合操作)

    前言:为很好的理解这些方法,你需要熟悉java8特性Lambda和方法引用的使用 一:简介 我们用集合的目的,往往不是简单的仅仅把数据保存哪里.而是要检索(遍历)或者去计算或统计....操作集合里面的 ...

  2. Java8中聚合操作collect、reduce方法详解

    Stream的基本概念 Stream和集合的区别: Stream不会自己存储元素.元素储存在底层集合或者根据需要产生.Stream操作符不会改变源对象.相反,它会返回一个持有结果的新的Stream.3 ...

  3. Java8之Stream 集合聚合操作集锦(含日常练习Demo)

    Stream 是用函数式编程方式在集合类上进行复杂操作的工具,其集成了Java 8中的众多新特性之一的聚合操作,开发者可以更容易地使用Lambda表达式,并且更方便地实现对集合的查找.遍历.过滤以及常 ...

  4. JDK1.8聚合操作

    在java8 JDK包含许多聚合操作(如平均值,总和,最小,最大,和计数),返回一个计算流stream的聚合结果.这些聚合操作被称为聚合操作.JDK除返回单个值的聚合操作外,还有很多聚合操作返回一个c ...

  5. 《Entity Framework 6 Recipes》中文翻译系列 (27) ------ 第五章 加载实体和导航属性之关联实体过滤、排序、执行聚合操作

    翻译的初衷以及为什么选择<Entity Framework 6 Recipes>来学习,请看本系列开篇 5-9  关联实体过滤和排序 问题 你有一实体的实例,你想加载应用了过滤和排序的相关 ...

  6. MongoDB 聚合操作

    在MongoDB中,有两种方式计算聚合:Pipeline 和 MapReduce.Pipeline查询速度快于MapReduce,但是MapReduce的强大之处在于能够在多台Server上并行执行复 ...

  7. .NET LINQ 聚合操作

    聚合操作      聚合运算从值集合计算单个值. 从一个月的日温度值计算日平均温度就是聚合运算的一个示例. 方法 方法名 说明 C# 查询表达式语法 Visual Basic 查询表达式语法 更多信息 ...

  8. Linq查询操作之聚合操作(count,max,min,sum,average,aggregate,longcount)

    在Linq中有一些这样的操作,根据集合计算某一单一值,比如集合的最大值,最小值,平均值等等.Linq中包含7种操作,这7种操作被称作聚合操作. 1.Count操作,计算序列中元素的个数,或者计算满足一 ...

  9. OpenStack/Gnocchi简介——时间序列数据聚合操作提前计算并存储起来,先算后取的理念

    先看下 http://www.cnblogs.com/bonelee/p/6236962.html 这里对于环形数据库的介绍,便于理解归档这个操作! 转自:http://blog.sina.com.c ...

  10. ElasticSearch 学习记录之ES几种常见的聚合操作

    ES几种常见的聚合操作 普通聚合 POST /product/_search { "size": 0, "aggs": { "agg_city&quo ...

随机推荐

  1. 【mysql练习】转置,总计,分组

    1,有如下一个表,要求把这个表按照2016,2017,2018,2019,把从1月到12月的金额展示出来. profit表: year month amount2019 1 52019 3 62018 ...

  2. cmd 备份 oracle 数据 dmp文件

    语法 :     exp 用户名/密码@数据库地址/数据库名 file=文件导出地址/文件名.dmp 实例:exp develop/123@localhost/orcl file=e:/2019-02 ...

  3. 064_Js常用的五大事件 onclick nochanger onload onsubmit onblur

    事件是电脑输入设备与页面交互的响应. onload加载完成事件:onload事件 是在页面被浏览器加载完成之后.自动触发的响应 onclick单击事件 onblur失去焦点事件 onchange内容发 ...

  4. 解决 使用 params 传递参数 必须 加上 name

    {path:'/blog',name:'blog',params:{is:true}}

  5. ESP8266-01S 烧录AT固件

    首先就是下载官网的下载软件和AT固件 这是下载好了的 然后就是硬件电路了 我是想把ESP8266用于Ardiuno板子的,然后网上有说买的USBTOTTL的3v3供电不够,所以我就用的Ardiuno板 ...

  6. Git、GitHub、GitLab三者之间的区别

    1.Git Git是一个版本控制系统. 版本控制是一种用于记录一个或多个文件内容变化,方便我们查阅特定版本修订情况的系统. 总结: (1)分布式版本控制系统下的本地仓库包含代码库还有历史库,在本地就可 ...

  7. uniapp 报错 签名不对 请检查签名是否与开放平台上填写的一致

    问题描述 用签名工具 输入包名   获取签名 在微信开放平台申请app 用获取的签名申请 申请成功后  在hbuilderx上云打包apk 分享 报  签名不对  请检查签名是否与开放平台上填写的一致 ...

  8. 执行Maven的test命令报错

    参考网址:https://blog.csdn.net/weixin_46688566/article/details/126470742 解决方案 在pom.xml文件中加入以下依赖: <plu ...

  9. 蓝桥2020 B组 第一场考试

    2. 纪念日 问题描述: 请问从 1921 年 7 月 23 日中午 12 时到 2020 年 7 月 1 日中午 12 时一共包 含多少分钟? 答案提交: 这是一道结果填空题,你只需要算出结果后提交 ...

  10. BGP反射器

    路由反射器是一种减少自治系统内IBGP对等体连接数量的方法. 根据BGP路由通告原则,要求一个AS内的所有BGP Speaker将建立全连接关系(BGP Speaker两两建立邻接关系).当AS内的B ...