【AICon】AI 基础设施、LLM运维、大模型训练与推理,一场会议,全方位涵盖! >>> 了解详情
写点什么

浅析 Java 8 的聚合操作

  • 2014-06-26
  • 本文字数:2817 字

    阅读完需:约 9 分钟

Oracle 在 2014 年 3 月 19 日如期发布了 Java 8。Java 8 版本被认为是具有里程碑意义的一个版本,Oracle 在该版本中添加了许多新特性,包括 Lambda 表达式、方法引用、加强了安全等等。

在众多的新特性中,聚合操作(Aggregate Operations)是针对集合类的一个比较大的变化。通过聚合操作,开发者可以更容易地使用 Lambda 表达式,并且更方便地实现对集合的查找、遍历、过滤以及常见计算等。

聚合操作与 Java 8 中的 Lambda 表达式、方法引用等新特性是相关的,一般一起组合使用,但这里只说明聚合操作的使用,下面就聚合操作的使用进行简单说明。

集合类的层次结构

集合类是 Java 语言提供的辅助类,是一种较为通用的数据结构,如 Map、Set、List 等。Java 中集合类层次关系如下:

图 1

如上图,Collection 是主要集合类的接口,其子接口(具化接口)有 Deque、Queue、Set、List 等。

Map 是另一种类型的集合,以 Key、Value 的键值对存储数据集。

在 Java 8 中,在 java.util.Collection 接口中添加了如下方法:

复制代码
Stream<E> stream() {
return StreamSupport.stream(spliterator(), false);
}

stream() 方法的可见性修饰符为 default,这又是 Java 8 的新特性。在接口中(Collection 为 interface),本不需要(也不能)进行方法实现,但引入 default 修饰后就不同了。开发者不但可以进行方法的实现,而且还不用考虑向后兼容的问题。关于 Default Method 的详细解释,读者可以参考 Java 8 的官方文档。

正是 stream 方法引出了集合类的聚合操作。

[注意]

Map 接口中并没有 stream() 方法,但是 Map 的 values() 和 keySet() 均返回集合对象,在集合对象上当然是可以使用 stream() 方法的。

聚合操作实例

为说明聚合操作的使用,首先定义一个数据元素类 Person,如下:

复制代码
import java.time.LocalDate;
public class Person {
String name;
LocalDate birthday;
Sex gender;
String emailAddress;
public int getAge() {
return LocalDate.now().getYear() - birthday.getYear();
}
public void setBirthday(LocalDate birthday){
this.birthday = birthday;
}
public void setGender(Sex sex){
this.gender = sex;
}
public void printPerson() {
System.out.println("The name is " + name);
}
public Sex getGender(){
return gender;
}
public enum Sex {
MALE, FEMALE
}
}

在 Java 8 以前的版本中,对 Person 集合的遍历往往采用以下方式:

复制代码
Set<Person> persons = new HashSet<Person>();
<p>// 传统遍历方式 for (Person person : persons) { if (person.getAge() > 18) { System.out.println(person.name + " is elder than 18."); } }</p>

同样的功能,在 Java 8 中使用聚合操作,可以实现如下:

复制代码
// 使用聚合操作
persons.stream().filter(new Predicate<Person>() {
@Override
public boolean test(Person person) {
if (person.getAge() > 18) {
return true;
} else {
return false;
}
}
}).forEach(new Consumer<Person>() {
@Override
public void accept(Person person) {
System.out.println(person.name + " is elder than 18.");
}
});

首先,在集合对象 persons 上调用 stream() 方法(聚合操作),取得 person 对象的数据集(elements),然后调用聚合操作 filter() 对集合中的元素进行过滤,再调用 forEach() 完成对符合条件的 person 的打印。

Predicate 和 Consumer 为 Java 8 中定义的函数接口 (Functional Interface),在 java.util.function 包下面,函数接口也是 Java 8 的新特性。在上述代码中,使用了两个匿名类分别对 Predicate 和 Consumer 进行了实现,这两个接口都只有一个方法,这也是函数接口的特征之一。

上述代码中的写法还是比较繁琐的,为进一步简化,可以使用 Lambda 表达式实现,如下:

复制代码
// 使用聚合操作及 Lambda
persons.stream()
.filter(p -> p.getAge() >= 18)
.forEach(p -> System.out.println(p.name + " is elder than 18."));

因为 filter()、forEach() 的参数均为函数接口,所以可以替换为 Lambda 表达式的方式。简单来理解,Lambda 表达式就是允许开发者将代码逻辑作为参数进行传递,关于 Lambda 表达式的详细内容,请参 Java 8 的官方文档。

聚合操作的使用

聚合操作是 Java 8 针对集合类,使编程更为便利的方式,可以与 Lambda 表达式一起使用,达到更加简洁的目的。

前面例子中,对聚合操作的使用可以归结为 3 个部分:

  1. 数据源部分:通过 stream() 方法,取得集合对象的数据集。
  2. 通过一系列中间(Intermediate)方法,对数据集进行过滤、检索等数据集的再次处理。如上例中,使用 filter() 方法来对数据集进行过滤。
  3. 通过最终(terminal)方法完成对数据集中元素的处理。如上例中,使用 forEach() 完成对过滤后元素的打印。

中间方法除了 filter() 外,还有 distinct()、sorted()、map() 等等,其一般是对数据集的整理(过滤、排序、匹配、抽取等等),返回值一般也是数据集。

最终方法往往是完成对数据集中数据的处理,如 forEach(),还有 allMatch()、anyMatch()、findAny()、findFirst(),数值计算类的方法有 sum、max、min、average 等等。最终方法也可以是对集合的处理,如 reduce()、collect() 等等。reduce() 方法的处理方式一般是每次都产生新的数据集,而 collect() 方法是在原数据集的基础上进行更新,过程中不产生新的数据集。

从上面的例子中可以看出,通过 stream() 方法,从集合对象获取的数据集与集合对象的迭代器(Iterator)有些类似,但他们也不完全相同:

  1. 迭代器提供 next()、hasNext() 等方法,开发者可以自行控制对元素的处理,以及处理方式,但是只能顺序处理;
  2. stream() 方法返回的数据集无 next() 等方法,开发者无法控制对元素的迭代,迭代方式是系统内部实现的,同时系统内的迭代也不一定是顺序的,还可以并行,如 parallelStream() 方法。并行的方式在一些情况下,可以大幅提升处理的效率。

除上述介绍的聚合操作外,Java 8 中还提供了其他更为丰富的聚合操作,读者可以参考 Java 8 的开发参考,了解更多内容。

总结

Java 8 提供的聚合操作,以及一起使用的 Lambda 表达式为开发者带来了便利,尤其在面向逻辑易变、开发迭代较快的项目应用时。但笔者个人认为,在带来方便的同时,可能也带来了一些麻烦,如相同逻辑的复用,以及代码的查错、修改等,当然这些问题也是相对而言的。毕竟,任何事物都有两面性,技术在不断的发展,Java 也在不断地调整自己的适应性,变得功能越来越多,越来越强大了。


感谢张龙对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ )或者腾讯微博( @InfoQ )关注我们,并与我们的编辑和其他读者朋友交流。

2014-06-26 01:207541

评论

发布
暂无评论
发现更多内容

软件测试|HTTPS 的通信

霍格沃兹测试开发学社

华为云助推武水集团项目成功入选住建部“智慧水务”典型案例!

华为云开发者联盟

云计算 后端 华为云 12 月 PK 榜

掌握这5大功能,解锁鲲鹏开发新发现

华为云开发者联盟

开发 华为云 12 月 PK 榜

MASA MAUI Plugin (七)应用通知角标(小红点)Android+iOS

MASA技术团队

blazor MASA MAUI MASA Blazor

时序引擎架构和实例演练

KaiwuDB

【Java技术专题】「原理专题」深入分析Java中finalize方法的作用和底层原理

洛神灬殇

Java JVM Finalizer 12月月更

浅谈权限系统在多利熊业务应用

百度Geek说

百度 权限系统 12 月 PK 榜 多利熊

uniapp 在微信小程序中图片宽度显示问题

ModStart

使用 ClusterResourceSet 为 Cluster API 集群自动安装 CNI 插件

Se7en

Gitea 的邮件通知

HoneyMoose

Java高手速成│Java程序怎样和数据库对话

TiAmo

JDBC 数据库· 12月月更

容器安全的三大挑战

SEAL安全

容器安全 12 月 PK 榜

PHP 中类自动加载相关文件分析

ModStart

活动预约报名系统怎么做?快来借鉴「苍山徒步之家」的经验做法

天天预约

微信小程序 SaaS 数据统计 预约工具 活动报名

说透IO多路复用模型

京东科技开发者

开发 系统 epoll poll Lunix

数字化时代,校园生活还可以这样过

华为云开发者联盟

数据库 后端 华为云 12 月 PK 榜

软件测试面试 | 一面试就紧张,怎么办?

霍格沃兹测试开发学社

MVP、原型、概念验证,傻傻分不清楚?

敏捷开发

开发 MVP 原型

信息安全等级测评师证书有效期是多久?谁能告诉一下?

行云管家

等保

非正式全面解析 NebulaGraph 中 Session 管理

NebulaGraph

图数据库 会话管理 session管理

Python图像处理丨详解图像去雾处理方法

华为云开发者联盟

Python 人工智能 华为云 12 月 PK 榜

龙蜥开发者说:众人拾柴火焰高!聊一聊我在社区的所思所想 | 第 14期

OpenAnolis小助手

开发者 开源社区 龙蜥开发者说 LoongArch 架构 红旗软件

软件测试简历书写 | 简历中应该如何描述才能体现出软技能的实力 ?

测试人

软件测试 自动化测试 简历 软技能 测试开发

参与Getaverse早期建设,成为节点验证者!!

Geek_Web3

#区块链# did #Web3

Triple 协议支持 Java 异常回传的设计与实现

Apache Dubbo

Java 开源 微服务 gRPC dubbo

2023年内蒙古等保测评公司有哪些?五家还是6家?

行云管家

等保 等保测评 内蒙古

如何通过Java应用程序将Word转为Excel

在下毛毛雨

Java Excel word 文档 转换

案例分享:硬件敏捷

ShineScrum捷行

Scrum 敏捷开发 TDD 硬件敏捷

多模态交互在数智化营销服中的技术实践

中关村科金

人工智能 算法 全栈 数字化转型 多模态

智能低代码平台,驱动企业数字化转型

元年技术洞察

低代码 数字化转型

上云节省 35%计算资源,420 个运维人天:运满满实时计算实践和思考

Apache Flink

大数据 flink 实时计算

浅析Java 8的聚合操作_Java_赵永_InfoQ精选文章