Spring Batch 使用场景
一个标准的批处理程序通常会从数据库,文件或者队列中读取大量的数据和记录,然后对获取的数据进行处理,然后将修改后的格式写回到数据库中。
通常 Spring Batch 在离线模式下进行工作,不需要用户干预就能自动进行基本的批处理迭代,进行类似事务方式的处理。批处理是大多数 IT 目的一个组成部分,而 Spring Batch 是唯一能够提供健壮的企业级扩展性的批处理开源框架。
业务场景
- 周期提交批处理任务
- 同时批处理进程:并非处理一个任务
- 分阶段的企业消息驱动处理
- 高并发批处理
- 失败后的手动或定时重启
- 按顺序处理任务依赖(使用工作流驱动的批处理插件)
- 部分处理:跳过记录(例如,回滚)
- 全批次事务:因为可能有小数据量的批处理或存在存储过程/脚本中
技术目标
- 批量的开发者使用 Spring 的编程模式:开发者能够更加专注于业务逻辑,让框架来解决基础的功能
- 在基础架构、批处理执行环境、批处理应用之间有明确的划分
- 以接口形式提供通用的核心服务,以便所有项目都能使用
- 提供简单的默认实现,以实现核心执行接口的“开箱即用”
- 通过在所有层中对 Spring 框架进行平衡配置,能够实现更加容易的配置,自定义和扩展服务。
- 所有存在的核心服务应该能够很容易的在不对系统架构层进行影响的情况进行替换或扩展。
- 提供一个简单的部署模块,使用 Maven 来进行编译的 JARs 架构,并与应用完全分离。