2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

Java EE 7,Spring 标准化的 Batch

  • 2013-07-01
  • 本文字数:2068 字

    阅读完需:约 7 分钟

上月发布的 Java EE 7 平台包含了批处理编程模型的规范,它很大程度上由 VMware 的 Spring Batch 项目派生而来。上月 Spring Batch 也被广泛提及,因为它发布了一个值得关注的释放版本,这个版本带来了更为简洁的配置和最新的数据访问方式。

Java 平台上的批处理应用程序,也就是 JSR-352,为应用开发人员提供了一个开发健壮批处理系统的模型。这个编程模型的核心是借鉴于 Spring Batch 的开发模式,也就是它创造的 Reader-Processor-Writer 模式,在这个模式中鼓励开发人员遵循面向数据块的处理标准。

_Reader-Processor-Writer_ 模式可拆分为三个工作流程步骤,要求开发人员去遵循:

  • ItemReader_ 类被设计用来消费要处理数据的一个 _ 数据块(通常是一条记录);
  • ItemProcessor,业务和领域逻辑会基于 _ 数据块 _ 对其进行处理;
  • 最后,记录将会在处理后委托给 _ItemWriter_,然后进行聚集。

按照 JSR 规范,Job_ 要通过 XML 文档进行描述并且包含了处理流程中的 _Steps。每个 _Step_ 负责描述每个 _ 数据块 _ 将要进行怎样的处理以及提交要基于什么样的间隔进行注册。对于流程中某个更为复杂的 _Step_ 处理需求可以通过 JSR-352 的 _batchlet_ 来进行处理。JSR-352 中的 _batchlet_ 对应于 Spring Batch 的 _tasklet_,它提供了处理一个 _Step_ 的策略。

JSR-352 也借用了 Spring Batch 的模式来访问和控制任务。任务要通过 _JobOperator_ 来触发,而任务的结果要通过 _JobRepository_ 进行访问。在 Spring Batch 中,_JobRepository_ 的名字是相同的,而 JobOperator_ 被称之为 _JobLauncher

与 Spring Batch 定义任务的方式稍有差别,Java EE7 的应用开发人员需要将任务的 XML 文档放到工程的 META-INF/batch-jobs 目录之中。在 Spring Batch 中,开发人员可以将它们的任务配置放在 Spring 应用上下文的任何地方,只要在容器中能够访问到就可以。

Java EE 7 容器的任务 XML 要定义具体的 _Reader_、_Processor_ 以及 _Writer_ 类,除此之外,还有缓冲区的大小、提交的间隔以及检查点策略。检查点策略用于描述提交是如何进行处理的。默认值是“item”,但是开发人员也可以选择将“time”作为提交策略。在前一种场景中,提交间隔描述的是处理过的记录数,而后者描述的是秒数。

复制代码
<job id="myJob" xmlns="http://batch.jsr352/jsl">
<step id="myStep" >
<chunk
reader="MyItemReader"
writer="MyItemWriter"
processor="MyItemProcessor"
buffer-size="5"
checkpoint-policy="item"
commit-interval="10" />
</step>
</job>

Spring Batch 的任务描述与 Java EE7 基本上是相同的,需要说明的是步骤的定义要包含在 _tasklet_ 指令之中。chunk 配置中的 reader、process 以及 writer 属性引用了应用上下文中已有的 Bean。在 2.2.0 版本中,chunk 配置中的 commit-interval 描述了在进行一次提交之前必须要处理的记录数。

复制代码
<job id="myJob">
<step name="myStep">
<tasklet>
<chunk
reader="myItemReader"
processor="myItemProcessor"
writer="myItemWriter"
commit-interval="2" />
</tasklet>
</step>
</job>
<bean id="myItemReader" class="...MyItemReader" />
<bean id="myItemProcessor" class="...MyItemProcessor" />
<bean id="myItemWriter" class="...MyItemWriter" />

尽管目前的目标是要与 JSR-352 兼容,但是 Spring Batch 超出规范的一点在于,它为开发人员提供了一种与 Spring 生态系统中其他组件进行无缝集成的方式。在批处理的场景下,Spring Data 可以直接作为 _Reader-Processor-Writer_ 模式中的 _Reader_,从而允许开发人员从 Spring Data Repository 之中查询数据块。同样是在上月发布的 Spring Batch 2.2.0 版本中,为使用 Spring Data 的 MongoDB 和 Neo4j 数据存储,提供了改进后的接口。

除了简化 Reader 接口,最新的 Spring Batch 释放版本为 Spring Java 配置提供了扩展支持,从而可以简化批处理特性。为了启用这个简化的配置,开发人员需要为带有 @Configuration 注解的类再添加 @EnableBatchProcessing 注解。通过这种方式,像 JobRepository 和 JobLauncher 这样的批处理特性就能够直接进行装配,而无需额外的配置。

复制代码
@Configuration
@EnableBatchProcessing
public class AppConfig {
@Autowired
private JobBuilderFactory jobs;
@Bean
public Job job() {
return jobs.get("myJob").start(step1()).next(step2()).build();
}
@Bean
protected Step step1() {
...
}
@Bean
protected Step step2() {
...
}
}

Spring Batch 2.2.0 除了增强数据获取和配置以外,这个最新的释放版本也将对 Spring 框架的版本依赖升级到了 3.1.2。要使用最新版本 Spring Batch 的 Spring 开发人员在开发批处理应用的时候,需要满足这个最小版本要求。

原文英文链接: Java EE 7, Spring Standardize Batch

2013-07-01 10:596636

评论

发布
暂无评论
发现更多内容

短视频直播app源码——软件系统开发方案

开源直播系统源码

软件开发 直播系统源码 短视频直播源码 短视频直播

面向大规模数据的云端管理,百度沧海存储产品解析

百度Geek说

人工智能 数据

2min速览:从设计、实现和优化角度浅谈Alluxio元数据同步

Alluxio

元数据 数据同步 Alluxio 大数据 开源 8月月更

.NET 6 SignalR websocket 入门(一)

辣么大

.net SignalR 8月月更

java 环境的搭建原来如此简单,我这小白看完也学会了,建议收藏【带附件】

CRMEB

华为云构建云原生DevSecOps平台,保障软件供应链全流程安全可信

华为云开发者联盟

云计算 云原生 安全 后端 华为云

秒验丨Android端SDK API使用说明

MobTech袤博科技

android UI 秒验

加密市场的投资布局,Zebec实属价值洼地

西柚子

【限时领奖】消息队列 MNS 训练营重磅来袭,边学习充电,边领充电宝~

阿里巴巴中间件

阿里云 云原生 消息队列 课程 MNS

消息队列基本原理和选型对比

C++后台开发

中间件 消息队列 后端开发 C/C++后台开发 C/C++开发

秋招大厂必备面试题!Java八股文背诵版已助569人入职大厂

退休的汤姆

Java、 面经 社招 面试八股文 秋招+

融会贯通,并行不悖 | 2022年8月《中国数据库行业分析报告》精彩抢先看

墨天轮

数据库 greenplum MPP 国产数据库 HTAP

基于深度学习的细粒度分类研究及应用

之家技术

人工智能 深度学习 模型 图像 CVPR

动态尺寸模型优化实践之Shape Constraint IR Part I

阿里云大数据AI技术

深度学习 编译器

闲谈Serverless,价值和未来

白留明(Armin.Lionheart)

云计算 Serverless Faas

企业应用现代化实用教程 | 如何快、准、狠地进行应用容器化改造?

York

容器 云原生 数字化转型 架构设计 应用现代化

从阿里云全球实时传输网络GRTN出发,浅谈QOE优化实践

阿里云CloudImagine

边缘计算 直播 边缘云 全球加速

加密市场由阴转晴,Zebec或成2022后半段黑马

鳄鱼视界

mybatis入门案例

Geek_5829b6

Java 数据库 mybatis

mybatis基础的crud

Geek_5829b6

Java mybatis

阿里妈妈展示广告引擎新探索:迈向全局最优算力分配

阿里技术

经验分享 算力 性能提升

Solana上的结算协议龙头,Zebec潜力颇受看好

股市老人

我和谷歌共成长——我的Google Play上车之路

云村的泊

8月月更

全新物联网数据集成:Flow可视化编排&双向数据桥接

EMQ映云科技

物联网 IoT flow emqx 8月月更

关起门来搞开源,做不了开源世界的Leader

源字节1号

开源 软件开发

怎么理解后App时代的轻应用技术

FN0

App 小程序容器 轻应用 快应用

合合信息技术专家受邀出席RACV2022,探索计算机视觉与图形学未来增量

合合技术团队

计算机视觉 计算机

SLF4J多个jar在类路径问题

Geek_5829b6

Java 日志

4步教你学会使用Linux-Audit工具

华为云开发者联盟

Linux 工具 安全 监控 开发

泄露了,22年阿里巴巴秋招内部面试资料,看完之后剑指offer

Java面试那些事儿

Java 编程 程序员 面试 架构师

怎样评测对比报表工具的性能?

Bug终结者

Java sql SPL 8月月更

Java EE 7,Spring标准化的Batch_Java_Dan Woods_InfoQ精选文章