【ArchSummit架构师峰会】探讨数据与人工智能相互驱动的关系>>> 了解详情
写点什么

硬件也敏捷!

  • 2015-05-28
  • 本文字数:7219 字

    阅读完需:约 24 分钟

“没有人能够在硬件领域推动 2 周为单位的迭代循环!”当人们谈起在硬件 - 软件产品开发中的敏捷方法时,第一反应都是类似的论调。然而,现在已经有一些团队,正在将已有的可靠硬件开发理念与少量从敏捷软件中借鉴的新鲜思想结合,进而去应对——甚至已经解决了——进行快速迭代的挑战。

敏捷运动的硬件根源

当今我们称之为测试驱动开发(TDD)的方法,其起源正是来自 Ward Cunningham 在嵌入式系统方面的研究工作,以及在此过程中与他的合作伙伴 Kent Beck 协作的过程。上世纪 70 年代,Ward 在一家研究机构中任职,当时他正致力于找出一条测试新型硬件的切实可行的途径。对此他追忆到:“在那个时代,微处理器是件新鲜事物。而我得出了这样一个结论,必须让机器自己告诉我们,它正在干什么。而如果我们打算信任机器传递给我们的信息,那么这部分内容必须非常简单……自此之后,这个理念在我所做的每一项工作中都留下了它的影子。”同样地,Kent 的经验也折射出类似的本质。

我在某次早期的敏捷会议上与 Ward 结识。当时我很好奇,是什么吸引了他,让他走近由 Kent Beck 倡导、后来成为“极限编程”的敏捷实践集。Ward 告诉我,在上世纪八十年代,他与 Kent Beck 在 Tektronix 共同从事 Smalltalk 方面的工作时,发现如果将一些简单实践结合在一起,就会将生产力提高到令人惊艳的程度。

Ward 介绍到,当新产品理念推进到了特定节点的时候,就需要面对公司内部的官僚流程。为了避免陷入到相应流程带来的文书工作之中,他们俩首先找到一个新颖的产品构思,然后推动另一个团队采用它。接下来,他们重复这个过程,做好新产品构思的快速迭代,并展示足够的可行性,从而使得其他人也开始认识到这一产品构思的价值,并促使其顺利通过内部官僚体系的流程。

结对、简洁、测试优先(test first)等后来演化为 TDD 的实践和概念就此诞生和成长。就这样,在硬件相关的工作中,基础敏捷实践 TDD 便应运而生。

在敏捷 ASIC 设计中引入敏捷软件中的测试驱动开发理念

受到在软件开发中运用 TDD 的启发,硬件验证工程师 Neil Johnson 决定在他对 SoC(片上系统)进行验证的工作中进行尝试。

为了便于理解验证工程师的工作职责,我们可以观察一下,下面这幅来自另一个不同行业的类似工作模型。在 SoC 开发过程中,验证工程师与电路设计师并肩工作,采用与女裁缝和时尚设计师的协同方式相类似的工作模式。这幅图片展示了在设计并制作一套全新的外衣时,所需经历的工作步骤。在最后一步里,只有女裁缝完成了自己的工作,而且没有引入任何缺陷的情况下,设计师才能够对设计方案进行问题修正。而如果女裁缝使用了错误的织物,或是未能正确测量模特,那么设计师将不得不应对这些由她的设计方案以外的缺陷所引出的问题。

图 1. 验证工程师的工作内容——与时尚设计的工作模型的类比。设计师画出服装的设计图并选择织物。接下来女裁缝测量模特身材,在设计图的基础上打样并缝制服装。最后设计师查看模特服装穿着的效果,并对其设计进行“调试”。

图 2. 验证工程师与电路设计师协同工作时,需要做哪些事情。电路设计师首先使用 CAD 系统绘制电路,接下来明确标注组件数据。验证工程师编写测试代码,进行仿真设计并检查电路表现。最后电路设计师查看 SoC 电路表现,并对电路设计进行“调试”。

同样,电子工程师负责设计电路;而验证工程师负责编写测试代码,并对 SoC 承载的功能进行确认,从而完成设计的验证工作。因此,如果验证工程师编写的测试代码中出现了 Bug,那么显然会对测试效果的可靠性造成影响。

如果验证阶段引入了新的 Bug,那么整个工作流程中就不得不增加额外的循环来查错和修复,这将极大地增加硬件开发的时间。因此,Neil 希望弄清楚,如果在“编写测试代码”的阶段使用 TDD,那么与过去相比,他的验证工作能够变得有多“干净”。当 Neil 花费几周时间将 TDD 框架落实到位,而后又经过数周时间对 TDD 工作流进行了熟悉之后,他准备好了对采用 TDD 进行工作前后的情况进行评估和对比。

Neil 对使用 TDD 前后的结果进行了基准测试,发现当使用 TDD 的 SVUnit 框架时,他的测试代码只出现了 1 个 Bug;而在使用传统 SoC 验证方法的时候,会出现 15 个 Bug。诚然,这个结果只是基于一套数据样本,但依旧展现出了令人惊讶的提升——特别考虑到 Neil 是一位经验丰富的验证工程师,这一提升尤为显著。 1

敏捷 IC 开发——每个 Sprint 阶段都产出可用硬件

德州仪器德国分部的一位数字设计总监,对于使用 Scrum 加速定制化 IC(用于闪存和铁电存储器 FRAM 2 )的交付非常感兴趣。在当时,德州仪器的一般交付周期为 12 到 36 个月,而面对这种特殊用途的 IC,其最短交付周期是 18 个月。但一家新客户对交付周期提出了更高的要求。那么,德州仪器将如何使用 Scrum 来加速 IC 开发呢?

在项目启动阶段,他们尝试寻找一位能够与之共事的 Scrum 教练,但却根本找不到熟悉 IC 领域的人选。不过,他们依旧确信,至少可以将部分 Scrum 或敏捷实践引入到他们的硬件工作中。

最终,这支团队选择采用以下敏捷实践:

  • 跨职能团队
  • 四周迭代
  • 相对大小估算(与已知特性相比,目标任务更大还是更小?)
  • 每周进行两到三次立会
  • 每个迭代周期中都交付可用硬件
  • 回顾

此时,这里的关键问题是,当芯片制造流程超过四周,而且并不在团队掌控之中的情况下,究竟如何在“每个迭代中”将可用硬件交付给客户。除此之外,上述其他敏捷实践则可以非常容易地运用到硬件工作中。

要想以增量方式工作,可以采用的一个方法,是交付经过编程的 FPGA——它们具有与完整 IC 内部的每个 IP 块非常相似的表现(一般来说,每个 IP 块的内部循环时间是 6 到 12 个月)。团队有能力逐个交付已经完成的 FPGA,而且他们主动向客户建议采用这样的方法。不过,虽然这么做能够在一定程度上降低风险,但该外部客户依旧不希望不断被这些中间步骤打扰——他们只想看到完整的 IC。

由于不能与外部客户进行共同迭代,数字设计团队找到了愿意配合的 _ 内部 _ 客户:团队可以向德州仪器内部的软件工程团队交付 FPGA——其软件是在进行硅制造前的最后一步。

接下来,数字设计团队开始逐月向软件工程团队交付其 FPGA。通过使用可用硬件原型,而不是仅仅停留在设计阶段的方式,团队让 Bug 难以藏身。其 _“每个为期四周的 Sprint 完成一份可用硬件”_ 的目标得以实现,尽管只是通过将 FPGA 硬件作为 IP 块原型的方式。就这样,数字设计团队将循环时间从每个 IP 块“6 到 12 个月”,降低为“每四周”。

那么,面向外部客户的交付周期时间是否也有得到了优化?不幸的是,由于外部商业原因,这个项目在完成前就被终止了,因此我们无从看到数据,来了解面向外部的交付周期被缩短了多少。

除了有效减少 IP 块的周期时间外,敏捷实践还带来了其他一些意义重大的好处。数字设计团队在工作中需要面对一套全新的平台,仅该平台就极大增加了不确定性和复杂度。如果他们使用瀑布模型的话,意味着在开始工作前需要先投入为期 12 个月的规范工作。

领导数字设计团队的 Tobias Leisgang 发现,“规划扑克和相对大小估算,有助于工程师们找出沟通问题以及对范围的误解,同时也让整体工作更具有现实感,而不必经历为期数周的详细规划阶段。跨职能团队确保反馈回路得以缩短,我们不会遇到在制造出一块昂贵的硅片之后,测试工程师才发现模拟电路无法测试的情况。

采用原型电路板的敏捷电气

结合一些前期规划,我们可以采用迭代作为主要战略,特别是对于早期产品原型中的电路板和其他物理组件部分。施耐德电气的一支跨职能团队开发了一套照明控制系统,他们在一个 Sprint 里,整合了 3 块电路板和告警灯。

该团队的领导者 Timo Punkka 4 ,介绍了他们的射频控制照明调光系统是如何在 4 周 Sprint 中演进的:

“开发团队由固件、电气、PCB 布局和塑料方面的设计者组成。原型产品包括三块 PCB 板、一套电源、一套控制单元、一套 UI 以及射频转换器。在第一个迭代过程中,只有电源相关的 PCB 板就绪了,而其他两块 PCB 板则通过通用原型板代替。在第二个迭代周期中,所有 PCB 板均已可用,到了 Sprint 结束的时候,用于塑料部分的快速原型也已到位。在 Sprint 回顾中,原型帮助我们体会到,如果选择这一概念,那么产品外观的真实感受会是怎样。另外,固件提供了简单的开关功能。要想做到这一切,我们需要与原型制造商之间建立可靠的合作关系。在这个案例中,原型制造商同意,当按照先期约定的时间收到最终图稿后,就能够在次日交付制造好的硬件原型。

(点击图片以放大查看)

图 3. 4 周 Sprint 产出的调光系统原型。

这支团队使用负载弹簧连接器和磁铁,将每个模块连接到一起(类似 Mac 的电源连接器),以验证他们的想法。他们还试着将射频部分和天线构建在 PCB 尺寸的 SD 卡上。这两个实验,都涉及了大量的不确定性——最终这些硬件都能够运行,但没有人能够预先确保这一点。

对团队来说,这些实践的结果推动了实验的前进,结合其他一些敏捷实践的支持,使之成为一次具有前瞻性的尝试:

  • TDD 确保他们能够在早期就尝试测试并持续进行实验,而不会打破早期设计决策。
  • 模块化让他们能够分离出需要进行更多实验的区域。
  • 仿真使得及早进行实验成为可能,从而规避了针对实际目标进行实验带来的高昂成本。

Timo 观察到,“实验”或者说“逐步达成(Emergence)”,在敏捷思维中处于最核心的位置。它与“第一次就把事情做对”的思路截然相反。通过在一次 Sprint 中构建一份原型,让硬件、软件和需求能够以并行的步骤逐步实现。

汽车行业的敏捷研发

Wikispeed 项目为我们带来了一部可以合法上路的汽车,它由志愿者打造,且团队每周都会对它进行修订。现在,消费者们就可以购买 Wikispeed 汽车,而且它的百英里油耗仅为一加仑!面对“需要数年之久才能够将一部新车模型投放到市场”的传统理念,Wikispeed 项目向其发起了挑战。Wikispeed 汽车的研发仅仅耗时 3 个月,而且志愿者们持续构建和销售它。该项目的核心策略是模块化。得益于稳定的接口,他们每周都会修订 8 个模块中的一个或几个并进行快速集成。这要归功于他们采用的交错迭代的方法,它支持在每个模块中并行地进行实验和学习。

图 4. Wikispeed 汽车分解视图,展现了它的 8 个模块。

另一个关键策略是在材料类型和数量方面的简洁性:“核心 XM(极限制造,eXtreme Manufacturing)实践是只使用那些能够在不超过一周的时间里进行低成本迭代(重新制作)的材料,并确保在实际中采用的材料和工艺的类型都尽可能少,以快速积累丰富的经验。” 5

Wikispeed 团队的领导者是在西雅图工作的软件咨询顾问 Joe Justice,这是一支由国际化志愿者组成的团队,他们使用敏捷技术来构建汽车。在 2008 年,Justice 注意到 Progressive Insurance X 大奖的信息——这是一项奖金额度达到一千万美元的评选,旨在探寻是否有可能构建出油耗低至 100MPG(英里 / 加仑)且符合道路安全规范要求的汽车。他参加了这一活动,并在博客上公布了自己的想法——于是一些读者加入了他的团队。

Joe 感到非常吃惊:有如此多的人,愿意努力且免费地工作,只是为了构建一些东西,以开源的方式存在,并且能够让所有人受益。目前,已经有 23 个国家中出现了 Wikispeed 商店。其汽车售价大约为两万五千美元;消费者也可以选择花费一万美元,从套件开始自己搭建它。

Joe 从 Wikispeed 团队中获得的第二个关键认知是人们的动机。他表示,与其他志愿者相比, Daniel Pink 的思路在目标、掌握力和使命感方面都更胜一筹。他们积极主动地互相学习,并保持互相关注。

Wikispeed 汽车由八个模块组成(引擎、框架、碳纤维车身等等)。得益于这些模块之间的松耦合关系,人们可以便捷地替换每一个部分。团队每周都会对八个模块中的一个或几个进行修订。并保证随时都有一部能够运转的 Wikispeed 汽车版本,同时还能够快速实现任何升级。那些已经拥有 Wikispeed 汽车的人们,则可以购入新的模块,并自己动手替换原来的对应部分,而无需任何汽车领域的技术背景。

在 Progressive Insurance X 大奖的竞赛中,Wikispeed 在核心组别获得了并列第十名的位置,将超过一百款来自全球各地、得到了企业和大学的充裕资金支持的汽车甩在了身后。 6

Wikispeed 团队在运用“极限制造(XM)”过程中积累的经验,反映了这样一个现象:Joe Justice 和团队中的许多志愿者都具有敏捷软件开发的背景,他们把这一方向的背景知识引入到了 XM 中。当被问起在制造和工程领域运用敏捷方法的过程中,学到了哪些东西时,Joe 的回答是:

当我开始与 Jeff Sutherland 一起进行联合培养的时候,我建议工程师们使用面向对象的架构、契约优先的设计以及测试驱动开发(TDD)。我所学到的第一个要点,是 Jeff 告诉我,我需要在工程领域打造这些理念——对软件人士而言,这些都是显而易见的知识,但对工程师而言则必须经过“翻译“才能够掌握。

对于进行极限制造(XM):

第一步也即是第一个 Sprint,将产品或服务划分为 10 个以内的松耦合模块。

第二步:明确面向对象架构、每个模块的输入输出、这些模块在物理上或通过数据如何互相联结、以及冷却等等方面的内容;但要注意,这个阶段应避免涉及任何模块内部的设计或架构。此时应只关注模块之间的接口。

第三步:通过以团队方式对每个模块进行版本搭建和重建,进行迭代;同时以增量的方式从实践中学习。一旦他们开始进行概念验证工作,就会在每个模块中增加“illities(对非功能性需求的一些响应)”,就像持久性、可承受性等等。

大部分工程师团队都会遇到这样一个经典问题:他们希望提前做好全部架构工作——所有的接口及“箱子”(接口背后的子系统)中的全部内在。然而,这将产生巨大的前置时间并造成大量浪费。

还有部分团队希望甩开架构直接投入到具体工作中。这种方式起步固然迅速,但很快就会放缓节奏。

这两类团队都很少采用最佳的方式:预先进行架构设计,但只细化到接口层面,接下来停止架构工作,通过实践并构建“箱子”内部来学习。这似乎是产出可交付产品的最快方式,而且它能够保证持续的速度。

在一款复杂的物理产品中,最好综合运用一些迭代和并行方法。当工作性质中具有“发明部分”的时候,这一点尤为有用。以 Wikispeed 汽车为例,它的各个模块并行开发,错落添加各项变更,因此这些模块不会同时发生故障。这确保了团队每周都能够交付可用的软硬件。

总结

我们刚才已经浏览了一些硬件开发过程中使用的经典技术:

  • 仿真或原型设计(IC 开发领域与电气领域)
  • 模块化(电气领域与 Wikispeed 汽车)
  • 组成部分的简洁性(Wikispeed 汽车)

我们还看到了一些直接从敏捷软件实践中借鉴的内容:

  • TDD(ASIC 验证)
  • 短迭代(IC 开发、电气领域、Wikispeed 汽车)
  • 面向对象设计(Wikispeed 汽车)

长期以来,硬件领域一直向着更具灵活性的方向不断前进。部分硬件现已支持非常迅捷的变更,使得不必提前进行完整规划,即可让良好设计逐步浮现成为可能。而对于尚未达到这样灵活性水平的地方,我们会自然而然地混合运用模拟、模块化和预先规划。提前许久便锁定设计,是极具风险的策略,而综合运用这些技术则能够缓和这些风险。

这里还引出了另一个非常强大的缓和策略——众包(或者称之为:调动团队的集体智慧)能够在一些关键的敏捷实践中发挥作用,例如回顾、结对编程、每日立会、故事编写等等。在任何一支运行良好的敏捷团队中,集体智慧都能够发挥强大的作用。

是的,要想在采用短迭代方式的同时,还保证每次迭代都能产出可用硬件,是件困难的事情。不过,我们刚才讨论了一些有助于团队落实这一方式的策略:

  • 经典的硬件开发技术,例如仿真和模块化,能够极大提高灵活性和开发速度。
  • 可以将诸如 TDD 和短迭代等敏捷软件实践,引入硬件开发工作中,从而加速实验和学习的过程。
  • 有时候我们需要超越项目要求的范围(例如,在一个月内完成 ASIC)去看问题,并满足客户(或是内部客户)更大的需求。激发团队智慧将帮助我们获得达成目标所需的创造力。

借助我们手中的这些“思维工具”,硬件绝对可以“变得敏捷”。

补充报道:

帮助敏捷工程社区浮现!

在硬件开发工作中,你是否使用了一些符合敏捷准则的技术?向社区分享你的经验和心得吧!

敏捷工程项目的目标,是在敏捷联盟内部,收集关于正在使用的技术的简短经验报告,以便为那些专注于软件工程之外其他工程领域的敏捷教练提供支持。这些报告面向所有人免费提供,读者可以点击此链接以了解更多信息。

关于作者

作为一位工程师、管理者和顾问, Nancy Van Schooenderwoert率先将敏捷方法运用到嵌入式开发领域。从 1998 年开始,她一直在苛求安全、高度管制的行业中,引领软件开发领域里的敏捷变革活动,并为客户提供敏捷技术和管理艺术方面的培训。另外,她还是 Agile Times 和 Cutter IT 杂志的贡献者,以及 IEEE 1648 敏捷客户委员会的成员。她在全球诸多软件会议上发表过演讲,也曾在 Agile New England 担任大波士顿地区高级敏捷用户组的主席。Nancy 创立了 Lean-Agile Partners 有限公司并出任总裁。可以通过 nancyv@leanagilepartners.com 向她发送邮件,或在 Twitter 上通过 @vanschoo 与她联系。


1 Johnson,Neil;测试驱动与硬件验证的新范式(TDD and A New Paradigm for Hardware Verification);Agile 2014 大会,可前往以下网址阅读: http://www.AgileSOC.com

2 Leisgang,Tobias;如何与足球队一道打篮球(How to Play Basketball With a Soccer Team,论文);Agile 2012 大会。

3 Tobias Leisgang,德州仪器德国慕尼黑分公司系统工程经理;由作者进行采访。

4 Punkka,Timo:嵌入式敏捷(Embedded Agile,论文);发表于 2010 年嵌入式系统大会。

5 http://wikispeed.org/category/wikispeed_shop_manufacturing/

6 Denning,Steve,Wikispeed:如何在三个月内开发一部 100MPG 汽车(Wikispeed: How a 100 mpg Car Was Developed in 3 Months);福布斯杂志 20125 月,可前往以下网址阅读 http://www.forbes.com/sites/stevedenning/2012/05/10/wikispeed-how-a-100-mpg-car-was-developed-in-3-months/

查看英文原文: Yes, Hardware Can Be Agile!

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2015-05-28 01:136524
用户头像

发布了 256 篇内容, 共 68.4 次阅读, 收获喜欢 10 次。

关注

评论

发布
暂无评论
发现更多内容

darknet A版安装

Dreamer

全球首批搭载英特尔Xe MAX独显惊艳上市,非凡S3x尽显创作魅力

E科讯

英特尔进军独显领域,第一批搭载锐炬®Xe MAX独显轻薄本已问世!

E科讯

Flink 1.11 与 Hive 批流一体数仓实践

Apache Flink

flink 流计算 实时计算

「混合云」会是云计算的下一个战场吗?

ToB行业头条

阿里云

银行数字化转型:需建立起以体验为核心、数据为基础、技术为驱动的架构体系

CECBC

银行 数字经济

Week 5学习总结

balsamspear

极客大学架构师训练营

英特尔首批独显笔记本亮相,非凡S3x纵享轻薄新体验

E科讯

搭载设计师级独显英特尔Xe MAX,非凡S3x体验全能创作

E科讯

还在为算法烦恼?那你应该还没看过这份Git上70k标星的笔记

Java架构师迁哥

Android 一行代码接入 扫码 生成码

Java android kotlin zxing camera

央行数字货币为人民币国际化之路提供推动力

CECBC

数字货币

甲方日常 45

句子

工作 随笔杂谈 日常

蚂蚁金融推迟上市:互联网金融是否要遭遇滑铁卢

石头IT视角

架构师第一期作业(第 7 周)

Cheer

课程作业

在深夜加油站遇见哈利波特

脑极体

书写高质量SQL的30条建议

诸葛小猿

MySQL SQL优化

手动造轮子——为Ocelot集成Nacos注册中心

yi念之间

nacos ASP.NET Core Ocelot

性能测试,简单的压测工具

garlic

极客大学架构师训练营

直播预告 | 应用加固防破解,4.1折就够了

蚂蚁集团移动开发平台 mPaaS

安全攻防 App风险 mPaaS

high-performance-tidb-challenge 记录

程序员老王

天源迪科受邀出席“第四届央企电商化采购发展高峰论坛"

DT极客

【性能优化】纳尼?内存又溢出了?!是时候总结一波了!!

冰河

性能优化 内存泄露 高并发 高性能 内存溢出

Dubbo-go Server端开启服务过程

apache/dubbo-go

dubbo dubbo-go dubbogo

【Knative系列】一文读懂 Knative Serving扩缩容的原理

公众号:云原生Serverless

Serverless knative autoscaler kantive

手动造轮子——基于.NetCore的RPC框架DotNetCoreRpc

yi念之间

RPC ASP.NET Core

训练营第三周作业

大脸猫

极客大学架构师训练营

Week 7 命题作业

阿泰

DDIA 读书笔记(5)数据分区方案

莫黎

读书笔记

Week 5命题作业

balsamspear

极客大学架构师训练营

响应式编程简介之:Reactor

程序那些事

响应式编程 reactor Reactive 程序那些事 响应式系统

硬件也敏捷!_研发效能_Nancy Van Schooenderwoert_InfoQ精选文章