10 月 23 - 25 日,QCon 上海站即将召开,现在购票,享9折优惠 了解详情
写点什么

浅析 Java 8 的聚合操作

  • 2014-06-26
  • 本文字数:2817 字

    阅读完需:约 9 分钟

Oracle 在 2014 年 3 月 19 日如期发布了 Java 8。Java 8 版本被认为是具有里程碑意义的一个版本,Oracle 在该版本中添加了许多新特性,包括 Lambda 表达式、方法引用、加强了安全等等。

在众多的新特性中,聚合操作(Aggregate Operations)是针对集合类的一个比较大的变化。通过聚合操作,开发者可以更容易地使用 Lambda 表达式,并且更方便地实现对集合的查找、遍历、过滤以及常见计算等。

聚合操作与 Java 8 中的 Lambda 表达式、方法引用等新特性是相关的,一般一起组合使用,但这里只说明聚合操作的使用,下面就聚合操作的使用进行简单说明。

集合类的层次结构

集合类是 Java 语言提供的辅助类,是一种较为通用的数据结构,如 Map、Set、List 等。Java 中集合类层次关系如下:

图 1

如上图,Collection 是主要集合类的接口,其子接口(具化接口)有 Deque、Queue、Set、List 等。

Map 是另一种类型的集合,以 Key、Value 的键值对存储数据集。

在 Java 8 中,在 java.util.Collection 接口中添加了如下方法:

复制代码
Stream<E> stream() {
return StreamSupport.stream(spliterator(), false);
}

stream() 方法的可见性修饰符为 default,这又是 Java 8 的新特性。在接口中(Collection 为 interface),本不需要(也不能)进行方法实现,但引入 default 修饰后就不同了。开发者不但可以进行方法的实现,而且还不用考虑向后兼容的问题。关于 Default Method 的详细解释,读者可以参考 Java 8 的官方文档。

正是 stream 方法引出了集合类的聚合操作。

[注意]

Map 接口中并没有 stream() 方法,但是 Map 的 values() 和 keySet() 均返回集合对象,在集合对象上当然是可以使用 stream() 方法的。

聚合操作实例

为说明聚合操作的使用,首先定义一个数据元素类 Person,如下:

复制代码
import java.time.LocalDate;
public class Person {
String name;
LocalDate birthday;
Sex gender;
String emailAddress;
public int getAge() {
return LocalDate.now().getYear() - birthday.getYear();
}
public void setBirthday(LocalDate birthday){
this.birthday = birthday;
}
public void setGender(Sex sex){
this.gender = sex;
}
public void printPerson() {
System.out.println("The name is " + name);
}
public Sex getGender(){
return gender;
}
public enum Sex {
MALE, FEMALE
}
}

在 Java 8 以前的版本中,对 Person 集合的遍历往往采用以下方式:

复制代码
Set<Person> persons = new HashSet<Person>();
<p>// 传统遍历方式 for (Person person : persons) { if (person.getAge() > 18) { System.out.println(person.name + " is elder than 18."); } }</p>

同样的功能,在 Java 8 中使用聚合操作,可以实现如下:

复制代码
// 使用聚合操作
persons.stream().filter(new Predicate<Person>() {
@Override
public boolean test(Person person) {
if (person.getAge() > 18) {
return true;
} else {
return false;
}
}
}).forEach(new Consumer<Person>() {
@Override
public void accept(Person person) {
System.out.println(person.name + " is elder than 18.");
}
});

首先,在集合对象 persons 上调用 stream() 方法(聚合操作),取得 person 对象的数据集(elements),然后调用聚合操作 filter() 对集合中的元素进行过滤,再调用 forEach() 完成对符合条件的 person 的打印。

Predicate 和 Consumer 为 Java 8 中定义的函数接口 (Functional Interface),在 java.util.function 包下面,函数接口也是 Java 8 的新特性。在上述代码中,使用了两个匿名类分别对 Predicate 和 Consumer 进行了实现,这两个接口都只有一个方法,这也是函数接口的特征之一。

上述代码中的写法还是比较繁琐的,为进一步简化,可以使用 Lambda 表达式实现,如下:

复制代码
// 使用聚合操作及 Lambda
persons.stream()
.filter(p -> p.getAge() >= 18)
.forEach(p -> System.out.println(p.name + " is elder than 18."));

因为 filter()、forEach() 的参数均为函数接口,所以可以替换为 Lambda 表达式的方式。简单来理解,Lambda 表达式就是允许开发者将代码逻辑作为参数进行传递,关于 Lambda 表达式的详细内容,请参 Java 8 的官方文档。

聚合操作的使用

聚合操作是 Java 8 针对集合类,使编程更为便利的方式,可以与 Lambda 表达式一起使用,达到更加简洁的目的。

前面例子中,对聚合操作的使用可以归结为 3 个部分:

  1. 数据源部分:通过 stream() 方法,取得集合对象的数据集。
  2. 通过一系列中间(Intermediate)方法,对数据集进行过滤、检索等数据集的再次处理。如上例中,使用 filter() 方法来对数据集进行过滤。
  3. 通过最终(terminal)方法完成对数据集中元素的处理。如上例中,使用 forEach() 完成对过滤后元素的打印。

中间方法除了 filter() 外,还有 distinct()、sorted()、map() 等等,其一般是对数据集的整理(过滤、排序、匹配、抽取等等),返回值一般也是数据集。

最终方法往往是完成对数据集中数据的处理,如 forEach(),还有 allMatch()、anyMatch()、findAny()、findFirst(),数值计算类的方法有 sum、max、min、average 等等。最终方法也可以是对集合的处理,如 reduce()、collect() 等等。reduce() 方法的处理方式一般是每次都产生新的数据集,而 collect() 方法是在原数据集的基础上进行更新,过程中不产生新的数据集。

从上面的例子中可以看出,通过 stream() 方法,从集合对象获取的数据集与集合对象的迭代器(Iterator)有些类似,但他们也不完全相同:

  1. 迭代器提供 next()、hasNext() 等方法,开发者可以自行控制对元素的处理,以及处理方式,但是只能顺序处理;
  2. stream() 方法返回的数据集无 next() 等方法,开发者无法控制对元素的迭代,迭代方式是系统内部实现的,同时系统内的迭代也不一定是顺序的,还可以并行,如 parallelStream() 方法。并行的方式在一些情况下,可以大幅提升处理的效率。

除上述介绍的聚合操作外,Java 8 中还提供了其他更为丰富的聚合操作,读者可以参考 Java 8 的开发参考,了解更多内容。

总结

Java 8 提供的聚合操作,以及一起使用的 Lambda 表达式为开发者带来了便利,尤其在面向逻辑易变、开发迭代较快的项目应用时。但笔者个人认为,在带来方便的同时,可能也带来了一些麻烦,如相同逻辑的复用,以及代码的查错、修改等,当然这些问题也是相对而言的。毕竟,任何事物都有两面性,技术在不断的发展,Java 也在不断地调整自己的适应性,变得功能越来越多,越来越强大了。


感谢张龙对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ )或者腾讯微博( @InfoQ )关注我们,并与我们的编辑和其他读者朋友交流。

2014-06-26 01:208171

评论

发布
暂无评论
发现更多内容

打造“拉动式”企业培训管理方案,释放人才潜能

明道云

文盘Rust -- 给程序加个日志

TiDB 社区干货传送门

开发语言

CSS Houdini:用浏览器引擎实现高级CSS效果

vivo互联网技术

CSS 前端 引擎 css动画

使用Gitlab Jenkins Docker建立CI部署方案

沃德

程序员 jenkins 7月月更

浅入浅出Mybatis(一)

ES_her0

7月月更

ORACLE进阶(十三)using实现简化连接查询

No Silver Bullet

oracle 7月月更 using

Qt | 显示网络图片 QNetworkAccessManager

YOLO.

网络 图片 qt 7月月更

羊城“论剑”!大湾区百家AI企业共话如何打牢人工智能“长链”的发展根基

极客天地

阿里云机器学习平台PAI与华东师范大学论文入选SIGIR 2022

阿里云大数据AI技术

Transformer 机器学习/深度学习

iOS中的多态

NewBoy

ios 前端 移动端 iOS 知识体系 7月月更

Python|数据可视化——超星学习通助手后台数据的可视化处理

AXYZdong

Python 7月月更

作用域与作用域链

是乃德也是Ned

JavaScript 前端 7月月更

Python+JS逆向哪里多?必然是登录逻辑,投资界登录pwd参数解析

梦想橡皮擦

Python 7月月更

Git .ignore 文件规则不生效

攻城狮杰森

git IDEA 协同开发 7月月更

MFC|自绘Static控件

中国好公民st

c++ 7月月更

滴-EventBus快速使用介绍-新手考驾照

芝麻粒儿

android EventBus 7月月更

更贴心、更好学的Python自动化办公教程!

博文视点Broadview

低代码实现探索(四十四)检查器待研究

零道云-混合式低代码平台

微服务项目中,Spring Security 比 Shiro 强在哪?

冉然学Java

编程 微服务架构 spring security Java’

双目立体匹配之代价聚合

秃头小苏

7月月更

Spring Cloud源码分析之Eureka篇第八章:服务注册名称的来历

程序员欣宸

Java spring SpringCloud Eureka 7月月更

【C语言】进阶指针Four

謓泽

7月月更

js对象的key到底加不加引号?

南极一块修炼千年的大冰块

7月月更

利用ECS服务器搭建安防视频监控平台

DS小龙哥

7月月更

不习惯的Vue3起步三 の computed和watch

空城机

vue3.2 7月月更

麒麟v10上部署TiDBv5.1.2生产环境的最佳实践

TiDB 社区干货传送门

实践案例 安装 & 部署

面试突击64:了解 HTTP 协议吗?

王磊

Java 面试题

SAP ABAP 系统同微软 Office 套件进行 Desktop Integration 的工作原理

汪子熙

Office SAP abap Netweaver 7月月更

百花齐放的家居行业联盟,三翼鸟率先撬动三个赛点

脑极体

CSS 中 ::before 和 ::after 伪元素的几个实际用途

南城FE

CSS 前端 伪元素 7月月更

一站式 DevOps 平台,让开发大不同

飞算JavaAI开发助手

浅析Java 8的聚合操作_Java_赵永_InfoQ精选文章