在数据仓库项目中实现敏捷-InfoQ

抖音技术能力大揭密！钜惠大礼、深度体验，尽在火山引擎增长沙龙，就等你来！立即报名>> 了解详情 



 写点什么

登录/注册

Warren Sifre 是来自于 Allegient 的一位 BI 解决方案架构师，他在博客中分享了关于在数据仓库项目中实现敏捷的观点。他表示，为了实现这一目标，正确的团队组成与心态是必不可少的。

按照 Warren 的说法，一个数据仓库项目包括以下开发任务

数据剖析与数据建模
ETL 开发与单元测试
语义层开发与 QA 测试
报表生成器开发

这些任务本质上存在着一些相互依赖，如果考虑在项目中实现敏捷，则应当考虑以下问题：

在没有完整的数据模型的条件下，如何设计报表？
在没有完整的数据模型的条件下，如何开发 ETL？
在没有完整的用例列表的条件下，如何设计数据模型？

为了实现敏捷，在项目启动之前必须要作出一些让步。Warren 提出了以下几点建议：

数据模型是永远不会一成不变的。
在整个项目或某个阶段中，会多次进行完整的历史数据加载。
对需求的变更可能会潜在影响你的一切。
在整个项目或某个阶段中，必须加入自动化测试开发的任务。

他表示，存在这些依赖的情况下，实施敏捷的关键在于协调，并将项目分解为多个阶段。每个阶段都应当设置一个针对该阶段目标的高层次概述。第一个阶段将对用户故事进行分解，提出验收标准并指出依赖所在。用户故事中还应当包括部署到 UAT 与生产环境所需的时间。将依赖与所需时间结合在一起，就能够得出该阶段所有待办事项的一个逻辑优先级顺序。

Mishkin Berteig 是 Berteig Consulting Inc. 的主席与联合创始人之一，他在最近的一篇博客中分享了他在一个数据仓库项目中实施Scrum 的经验。当时他担任了某个团队的教练，该团队当前的工作是将某个数据仓库从Oracle 迁移到Teradata，该公司为这个项目分配了30 个人。在实施Scrum 方法之前，该团队进行了大量的前期分析工作，并且完成了一份依赖图，其中包含了大约25000 张表、视图和ETL 脚本。这张依赖图保存在一个MS Access 数据库中。

Mishkin 建议该团队不要遵循这张依赖图，而是基于价值开展迁移工作。

我决定对他们基于依赖开展工作的方式提出质疑，因此我与产品经理进行了对话，以探讨是否有可能根据价值对工作进行排序：

淘汰 Oracle 数据仓库的许可与服务器，
清空磁盘空间、淘汰硬件
使用新硬件降低 CPU 占用

Mishkin 和产品经理一同根据商业价值对这个 MS Access 数据库进行了排序，他们对数据库中每项任务按照磁盘空间与 CPU 占用进行了一个非常简单的计算，这个具有 25000 个条目的数据库因而成为了产品待办清单。

Mishkin 要求团队将这些数据仓库表视为产品待办清单中的条目（PBI），并且（在生产环境中）同时运行 Oracle 和 Teradata，并在每个 Sprint 中及时更新，以实现数据在这两个平台中的迁移。该项目从这种方式中受益良多。

经过几轮 Sprint 之后，一共淘汰了 5 个 Oracle 许可。最终，这个为期两年，耗资两千万的项目获得了成功。每个 Sprint 都有新功能提交到生产环境中，并且让 Oracle 和 Teradata 保持同时运行，直到最后一个 Oracle 许可淘汰为止。由于早早地交付了价值，整个项目节约了很大的成本。

查看英文原文： Implementing Agile in Data Warehouse Projects

评论

发布

暂无评论

架构实战营模块三作业

架构实战营

使用MLlib进行机器学习（十-上）

数据与智能

机器学习 spark 线性回归

架构实战营模块8 作业

#架构实战营

大数据训练营 -0718课后作业

C# BS方向该如何规划学习？【学习路线指南】

C# 编程学习路线程序猿学习推荐

构建高效Presubmit卡点，落地测试左移最佳实践

ci 测试左移 Presubmit

在线诉讼区块链证据规则的理论逻辑与制度体系

CECBC区块链专委会

赶紧收藏！花了1万多买的软件测试教程全套，包含所有软件测试工程师全栈知识点(功能测试理论基础+接口测试+Python自动化+持续集成+性能测试+测试开发+面试简历)软件测试项目实战+训练营学习教程持

程序员阿沐

Python 软件测试自动化测试接口测试测试用例

架构实战营 1 期 - 模块三作业

#架构实战营

大数据训练营一期0718作业

web自动化测试(1):再谈UI发展史与UI、功能自动化测试

自动化测试 UI自动化测试 web测试前端测试

没有隐私计算，区块链这个美丽的梦想就不能落地

CECBC区块链专委会

究竟有没有世界上最好的编程语言？

极客时间学习笔记朱赟的技术管理课 7月日更

web自动化测试(2):选择selenium优势？与PhantomJS/QTP/Monkey对比

自动化测试 web测试 UI测试界面测试页面测试

架构实战营模块三作业

作业架构实战营模块三

Linux之wc命令

架构实战营 - 模块三作业

基于 Blazor 打造一款实时字幕

ASP.NET Core dotnet blazor

禁止在构造函数里调用虚函数

欢迎注册极客时间

Flutter 命令本质之 Flutter tools 机制源码深入分析

flutter android dart Gradle

OpenCV 形态学操作之腐蚀与膨胀，开运算与闭运算，顶帽与黑帽，图像梯度运算相关知识点回顾

梦想橡皮擦

python从入门到精通 7月日更

我不会写代码，但我能做系统

高基数数据特性是什么意思

Fact Table 数据表什么意思

Vite 搭建 Vue2 项目（Vue2 + vue-router + vuex）

JavaScript Vue 前端 vite 前端构建

Scrum Master的职责——《Scrum指南》重读有感(5)

Scrum 敏捷随笔 Agile

挑选TOP10关键时刻的九大原则

读书笔记用户体验商业洞察 7月日更体验设计

MySQL事务初始

MySQL 事务 7月日更

网络攻防学习笔记 Day85

穿过生命散发芬芳

网络攻防 7月日更

在线QuartzCron定时任务表达式在线生成

Study Go: From Zero to Hero

Study Go: From Zero to Hero