ArchSummit全球架构师峰会门票9折倒计时中~ 了解详情
写点什么

波士顿儿童医院如何利用开放云创新

  • 2018 年 9 月 06 日
  • 本文字数:5680 字

    阅读完需:约 19 分钟

本文要点

  • 开放云模型使企业可以在基础设施层面上创新。Massachusetts 开放云使顶尖的大学可以和业界在这种共享云上合作共建。
  • 开放云正成为昂贵、封闭的专有云如 AWS 的替代方案,创建了同样的研究、创新和协作场所。
  • 医学研究特别适合通过开放式混合云进行实时协作。把开源的可扩展性和共享性运用到医疗上,可以把图像处理时间从几小时缩短到几分钟,从而节省成本。
  • 除了上述成本节省外,应用场景仍然是基础设施决策的推动因素。
  • 借助开放云,你不仅可以把应用程序调整到云上,还可以调整云满足应用程序的要求。

开源软件的流行似乎会一直持续下去,而专有云合约通常运维成本较高而且不灵活,混合开放云模型上升为像 AWS Web Services 这样的巨头的一个有前途的创新替代方案。本文将深入介绍一个引人注目的的端到端案例,就是波士顿儿童医院放射科如何利用 Red Hat 开源的、基于容器的技术以及 Mass 开放云,通过更快地诊断和处理来改善患者的治疗效果。

开放式公有云成为一种在基础设施层面缩减成本和创新的可行方法

“基本的思想是都是由提供商控制的、专有且封闭的东西。”

Orran Krieger 是波士顿大学哲学博士及 Mass 开放云负责人,这是他在接受采访时对这个项目的动机的一个简单总结。

Krieger 表示,他们的设想是有多个云提供商在一个共享云中部署了不同的服务,创建一个公平的竞争环境。把麻萨诸塞州的学术大鳄如 Harvard 和 MIT 聚在一起,使一部分世界上最大的研究机构合并资源,构建一个 15 兆瓦的数据中心,他们可以在这里数据中心里部署一个共享的开放云,称为 Massachusetts 开放云或者 Mass 开放云或简称为 MOC。

Krieger 说,“对于希望在基础设施层面创新甚至是管理它的公司,开放云模型真得非常有好处。”他已经见证了类似波士顿儿童医院放射科项目的服务基于它构建。

“运行试验的成本相当高。当你是一所非营利性的大学时,成本就更高了,在一个规模足够的云上启动任何东西都需要巨大的资金投入。”

Krieger 认为,对于大学而言——至少在美国是如此——购买自己的设备总是比租用私有云服务器便宜。

但是,他也说,“如果业界参与的话,最终,成功只会来自像开放云这样的东西。”

Krieger 表示,只有所有这些大学都聚在一起,才能为创建一个规模足够在上面进行试验的云提供必要的资金投入。此外,他还说,早在现如今的公有云之前,大学已经有一段很长的部署大规模计算基础设施的历史了。

一旦他们参与进来,令人信服的端到端案例就推动项目向前发展,包括和 Red Hat 一起根据项目反馈和需求改造底层技术和云。

令人信服的端到端项目推动项目向前发展

最终,重要的是节省成本,但是,技术项目的发展是由故事推动的。对于儿童医学影像更快的响应无疑就是那种令人信服的案例。

Rudolph Pienaar 是一位哲学博士,波士顿儿童医院资深科学家,哈佛医学院放射学导师,同时也是这个项目的技术架构师。他使波士顿儿童医院和 Mass 开放云建立起伙伴关系,实现了一个端到端的案例。其中,Mass 开放云和 Red Hat 基础设施部门存在合作伙伴关系。

Pienaar 介绍了他们试图解决的问题:

“我们如何才能非常快速得分析放射数据,我们如何才能非常容易地做到那一点,使使用系统的人只需要付出最少的努力?鉴于我们是在架构一个数据主要在云计算上分析的基础设施,我们需要尽可能地隐藏这种复杂性。用户需要的仅仅是选择一个数据集,然后选择要对数据进行什么样的分析。至于数据如何打包、防护、去标识化,如何遵从合规性标准,如何发送到云上并分析,最终如何取回结果并展示给用户,这些细节,终端用户从来都不需要考虑。当然,这仍然是一个复杂的问题。”

他们给出的答案就是 ChRIS 研究集成服务,一个基于 Web 的医疗图像平台,使用了多种 BCH 自主开发的软件进行开发,然后在 Mass 开放云上借助 Red Hat 的技术进行了“无缝集成”。ChRIS 提供了一种部署成像应用程序的标准方式,这会减少当前存在于医疗应用开发人员和诸如医疗卫生技术人员这样的用户之间的障碍,这些用户需要快速访问工具,但具备的技术知识很少。ChRIS 在 Red Hat OpenShift kubernetes 容器平台上运行,所以,为 ChRIS 构建的应用容器自动存储了用户所需的所有库,他们从安装应用到开始处理医疗图像的时间有时候可以从几小时缩减到几分钟。

他们的成像应用场景是一个计算密集型过程,需要访问 GPU(图形处理单元),使用 MOC 硬件及 Red Hat OpenStack。

Pienaar 表示,这意味着 Red Hat 必须“改变云来适应应用程序,改变应用程序来适应云。我觉得,看着云基于这个项目的反馈来发展演化令人兴奋。”

当你为没有很深技术背景的用户构建应用程序时,采用一种简单直观的方式至关重要。Pienaar 表示,对于儿童医院而言,这是一种非同寻常的尝试,因为虽然临床医生对研究非常感兴趣,但是,“他们在如何启动 Linux 终端及如何分析数据时并不是非常熟练”。

为了做到这一点,他们必须客服一些运营方面的挑战,其中包括对复杂且古老的数据的多样化、分散式访问。从儿童医院创立至今将近 150 年的时间里,已经有了一个巨大的信息库,但是,这些数据通常分散在孤立的实验室里。这些数据需要清理和匿名化,以便可以跨越网络边界移动数据,同时保持合规性。还需要一个用户界面,使像放射科医生这样的用户可以有一个巨大的数据库用来分析。

Pienaar 还补充了另外一个问题,他们的软件通常是由博士后在与计算机有关的实验室里编写而成的,但是,通常只有在结果收集完成而论文已经发表之后,因此,几乎不会跨部门共享,或者,很长一段时间内不会共享。

有些人,如临床医师,他们可以从比较影像结果中获得巨大收益,尤其是利用他们背后的大数据,但是,他们通常几乎没有机会访问所有这些研究和影像。不要忘了,因为它的高度敏感性和高度隐私性,医疗行业是监管最严格的行业之一。这个项目的一部分就是努力实现这些数据的整体共享,同时要特意隐藏那些作为标识的数据点。现在,ChRIS 正预把那些数据安全地移到云上,在那里收集、分析和可视化。

开源技术是在云上进行创新的关键

Pienaar 指出,所有东西都是开源的,那非常重要,再说一遍,不仅仅是为了节省成本。他从项目一开始就一直在使用 Linux,他认为,如果他们被绑定到专有云上,那么他们就无法使用他们希望使用的另开一种开发环境和语言。

Pienaar 说,“借助这些开源方法,我们可以构建真正可以对数据产生影响的东西,而这些数据真正链接了其背后的世界,这个想法使我大受启发。”

“现在,如果我们要在 Amazon 云上深入合作下去,那么我就会想到,我们必须同 Amazon 达成许可协议。我无法下载 Amazon 云并在自己的环境里运行。由于 ChRIS 的全部能力都源自它与 Mass 开放云的连接,所以没有什么能阻止你下载 ChRIS 并且就在自己的笔记本上运行。整个 ChRIS 都可以使用。你获得的体验是完全相同的——虽然你的笔记本完全无法承受巨大的计算量。而且,你完全可以在自己小而完整的 ChRIS 上分析问题和开发,然后通过单击部署到云上其他任意数量的‘ChRIS’上。”

他说,他们当然也在和合适的大牌医疗技术供应商合作开展项目,但是,在这些情况下,开发周期和开发加速度都由于专有技术而慢一个等级,因为“完全隔离的沙箱”和“非常拘束的边界”。

Pienaar 举了一个例子,当他需要在专有云环境中部署应用或数据时,“我无法自己推送——我不得不获取许可或者使用专有 API。而且,一旦部署,我就无法再访问它。他们可能在云上提供了我不知道是什么的服务。”

他又举了一个更具体的 Python 库的例子,该库需要与云上的 Amazon 实例通信,使用证书进行身份验证。

“我总是害怕,Amazon 下周会推出另外一个版本的 API,改变数据的某个方面,或者做一些相关的调查。”Pienaar 说,这是双向的:“如果我不再喜欢 Amazon,我就会希望能够在本地机器上实例化 [启动] 我的整个服务。”

他表示,借助开源,他的团队唯一受限制的地方是时间和精力。

“借助 Red Hat 的 OpenStack 和 OpenShift,我可以在任何地方做。我们可以在自己的实验室中启动我们的基础设施,有些医院,他们可能特别不放心把数据放在其他地方,甚至是 Mass 开放云,他们可以在内部使用同样的经验和所有的透明度控制。那么,你为何不采取措施考虑去到 Mass 开放云上。”

Pienaar 认为,全开源技术栈使他们具备了更强的能力,但有着同等的控制权。

Hugh Brock 是 Red Hat 波士顿大学项目的负责人,在过去的 9 个月里,他负责把 Red Hat 一方的工作准备就绪,并在 Mass 开放云上运行。他说,他们对这种应用场景非常感兴趣,该场景涉及像快速图像处理这样的密集计算,需要使用类似 Red Hat OpenStack 平台这样的 Red Hat 软件访问 GPU。

他说,“在 Red Hat,我们希望可以展示我们如何帮助人们围绕这类问题创建一个社区,[那样我们可以] 设法使我们的软件更便于社区开发人员使用,尽量帮助他们了解他们可以做什么贡献。”

Brock 说的社区用户是指那些从事医疗图像如神经影像处理的用户,以及那些开发一点代码并希望在云上而不是本地机器上进行测试的用户。同时,也有些人是希望借助 Mass 开放云和容器基础设施软件节省资金,医疗场景迫使他们希望使其更易于分发,按照他的说法,这是 Red Hat OpenShift 促成的。

当问到,是否人们在上面开发的应用都必须开源时,Brock 说那不是必须的,但是,尽管如此,他所知道的神经影像领域的每个人都使用开源方法,从而避免落入“许可陷阱”。

在 Red Hat,“我们已经准备好了 Mass 开放云,从建立之初,它就一直运行在 Red Hat OpenStack 和 Red Hat OpenShift 上。当我们开始了解到 ChRIS 项目时,我们意识到,这对于容器和 OpenShift 是一个非常好的展示机会。”

他们下一步会做什么?

Brock 继续说道,“我们希望指出的是,在我们的云软件上,不仅图像处理代码可以运行得更快,也有其他一些东西会运行得更快,像跨不同的医疗数据集进行分组运算,加密安全数据而没有数据的完全访问权,利用影像库中可用的开放数据,如扩散的肿瘤细胞。”

“随着数据量越来越大,我们生成的数据越来越多,对于研究人员而言,能够以一种安全而不侵犯隐私的方式使用那些数据变得越来越重要。”

Brock 说,“如果你必须为了访问他们已经挖掘的医疗数据而向一个大型云付费,那么就会断送第三方访问那些推测性数据的机会,他们可能不希望付费。”这是另一个令人信服的基于混合云进行构建的理由。

在 Red Hat,他们既注重数据的开放访问,同时也控制受隐私约束的数据的访问。

ChRIS 借助 Red Hat OpenShift kubernetes 发行版在 Mass 开放云上运行。据 Brock 介绍,ChRIS 可以在原始的栈上运行,但是,为了提升速度,他们做了一些额外的工作,传递给来自硬件的 GPU。

“在 Mass 开放云上,我们有一个集群的所有机器都有 GPU 卡——那个卡可以从硬件传递给虚拟机。当你运行其中的一段图像处理代码时,如果它针对 GPU 处理进行了优化,那么它就可以运行得更快——从几天到几个小时。”

开放云加 ChRIS,通往影响决策的数据聚合

计算机科学博士 Ata Turk 领导着 Mass 开放云的大数据和医疗保健分析团队。对于这个合作项目,他的目标是向每个人提供医疗保健服务。他说,容器已经成为实现这个目标的一个关键部分,因为应用开发人员可以使用和运行多个容器,组织他们的输入、输出,并提供给其他开发人员。

Turk 说,“Red Hat OpenShift 以 Kubernetes 为基础——那使得我们可做多租户,和存储设施通信,以 OpenStack 为基础构建。在管理方面,OpenShift 针对 DevOps 和 kubernetes 做了很好的打包。容器使我们可以把它提供给所有的应用开发人员,使他们可以基于医院的真实数据运行。”

Turk 举了他妻子 Esra Abaci Turk 的例子。她是波士顿儿童医院的一名研究员,研究怀有双胞胎的妇女的子宫供氧问题,这是一个关于胎儿大脑发育和成长的重要问题。她已经收集了来自 BCH 的 9 个案例和来自麻萨诸塞州其他医院的 6 个案例,但是,目前没有技术或监管方法使这些实体可以共享数据。

还有另外一个潜在的应用场景(如附图所示),该作者 15 个月大的孩子是人脑发展项目(dHCP)的匿名贡献者,该项目的目标是绘制大脑发展图谱。目前,这包含一次孕期 32 周时的 MRI,另外一次是出生第二天。对于新生儿,他们可以让这个机械世界变得安静,但是,在对婴儿因为受到刺激而非常活跃的大脑生成快照时,这就不可能了。Turk 表示,需要花“好几个小时”的时间才能把那些 MRT 图像分层存储,消除移动噪声。借助并行计算和云,ChRIS 可以非常快速地处理这一切。

类似地,围绕特定的主题收集匿名数据可以拯救生命,不管是发现肿瘤转移模式,还是分析马萨诸塞州五个最顶尖的创伤中心在应对 2013 年波士顿马拉松爆炸事件过程中针对不同情况所做的处理和跟踪。

“这些问题有推动策略和决策的意义与价值,我们为此正在构建一个平台。”Turk 解释说,现在“我们有了这个框架,可以使人们分享来自不同实体的数据,而这些实体本身并不想分享数据”,实际上,这种分享符合监管标准,同时也无损于研究。

这种合作中还有医疗健康之外的应用场景。Turk 举了一个例子,企业希望了解男女之间工资差异,但又不想暴露工资数据本身。基于 ChRIS、Red Hat 技术栈和 Mass 开放云构建的应用程序可以聚合超过 500 家波士顿公司的工资数据。现在可以讨论缩小薪酬差距的方案了,因为现在已经积累了丰富、可靠的数据。

该场景和医疗场景都遵循同一种操作模式,引入数据和代码,在最佳数据量上运行,分享输入数据和应用程序本身所需的临时数据。ChRIS 还提供了机制,便于为临床医师可视化数据。

最终目标不只是使应用程序在单台机器上运行得更快,而是开源数据本身,同时保持合规性,如美国的 HIPAA 和欧洲的 GDPR。

你在哪里见过开放云?请在下面的评论中告诉我们。

关于作者

Jennifer Riggins 是一名科技故事讲述者兼撰稿人,当数字化转型遇到文化,她希望可以让世界变得更美好。她的 Twitter 账号是 @jkriggins。

查看英文原文: How the Boston Children’s Hospital Is Innovating on Top of an Open Cloud

2018 年 9 月 06 日 18:21956
用户头像

发布了 1008 篇内容, 共 342.7 次阅读, 收获喜欢 328 次。

关注

评论

发布
暂无评论
发现更多内容

真棒! 20 张图揭开内存管理的迷雾,瞬间豁然开朗

小林coding

Linux 操作系统 计算机基础 内存管理

链技术如何提升金融行业安全与互信

CECBC

百度 区块链技术 超级链 探索与实践

week04

Geek_2e7dd7

互联系统架构演化史之感

旭东(Frank)

架构 感悟 极客大学架构师训练营

大型互联网应用系统常用技术(持续更新)

2流程序员

极客时间第 0 期架构师训练营第四周总结

2流程序员

信创舆情一线--数据安全法草案提请初审

统小信uos

大数据 安全

架构师训练营作业 (第四周)

王海

极客大学架构师训练营

「架构师训练营」第 4 周作业

旭东(Frank)

架构师训练营第 04 周—— 练习

李伟

极客大学架构师训练营

愿景集团与聚盛国际达成战略合作共建外汇市场新篇章

Geek_116789

一个大型互联网应用采用的技术方案和手段

李白

第四周总结

赵龙

架构师训练营第四周作业

张锐

大型互联网应用系统的技术方案和手段

周冬辉

架构师训练营第4周——学习总结

极客大学架构师训练营 互联网架构模式 互联网架构的演进

架构师训练营——第四周总结

jiangnanage

互联网系统架构设计概览

dony.zhang

「架构师训练营」第 4 周作业 - 一个典型的大型互联网应用系统使用了哪些技术方案和手段,主要解决什么问题

guoguo 👻

极客大学架构师训练营

第三周总结

李白

架构师训练营 No.4 周总结

连增申

架构师训练营学习总结——系统架构【第四周】

王海

极客大学架构师训练营

浅谈比特币匿名的意义

CECBC

第四周学习总结

李白

第三周作业

李白

西博泰科携手中国电信共同抢占NB-IoT新赛道

Geek_116789

week04 总结

Geek_2e7dd7

第四周作业

赵龙

典型大型互联网应用系统的技术方案和手段

极客大学架构师训练营 第四周作业 互联网应用技术方案 互联网系统架构 互联网系统特点

写给大忙人看的操作系统(内附思维导图)

cxuan

后端 操作系统

AI在游戏反外挂中的应用与实践

AI在游戏反外挂中的应用与实践

波士顿儿童医院如何利用开放云创新_DevOps_Jennifer Riggins_InfoQ精选文章