NASA 的 OODT 被选为 Apache 顶级项目

  • Michael Stal
  • 侯伯薇

2011 年 2 月 17 日

话题:Java架构ApacheDevOps大数据语言 & 开发AI

Apache 软件基金会已经选择面向对象的数据技术(Object Oriented Data Technology)架构作为它的顶级项目之一。OODT 最初是由 NASA 的喷气推进实验室Pasadena 创建的,它支持地理上分布式的透明整合、异构计算以及通过元数据中间件实现的数据源。

OODT 试图解决的核心问题来自于科学领域,在其中会产生大量的数据,并且会在位于不同地理位置的数据库中分别存储。当用户需要分析或者检索这些数据的时候,他们就必须利用各种自定义的工具。为了解决那个问题,OODT 提供了对分布式资源的透明访问、数据恢复和查询优化功能以及分布式处理和虚拟存档。这样,使用 OODT 的应用程序就能够以统一的方式处理来自于不同来源的数据。OODT 的实现主要是用 Java 编写的,据它的开发者所说,他们使用 Maven“从而可以让组件的下载和依赖关系自动化。”

OODT 提供了以下主要功能:

  • 编目和存档  这是用于从资源中提取元数据的功能,然后把这些元数据存储在长期的存档中,并且对数据进行设置版本和存取。
  • 网格: 这是为了描述像资源这种带有元数据的实体的组件,并且会“以标准的格式获取产品(资源)或者元数据。”  除了 CORBA 和 RMI 之外,OODT 还包含了WebGrid  ,它使用 REST 来提供描述和产品服务。
  • 常用  提供了常用功能——像查询表达式、单点登录——的工具组件,它还提供了杂项  工具,像 IO 流、日志或者 XML 等。
  • OODT 的敏捷性: 使用 Python 语言对 Apache OODT 的重新实现,重点在于高性能,以及更快的开发和整合。

根据ApacheOODT站点所提到的,解决方案不仅适合于科学计算,而且还提供了一种通用的软件架构,能够用来创建模型以便于处理信息。此外,它引入了对知识搜索的支持,并提供统一的层,从而隐藏数据的异质性、技术和元数据。

2010 年 1 月,JPL 基于 Apache 许可把 OODT 作为孵化项目提交。不管是否有开发者对质量和代码的可用性作出改善,孵化项目都是有效的。仅仅 11 个月之后,OODT 就被提升为 TLP,那意味着 Apache 基金会认为 OODT 是它的技术库的重要组成部分。在这种情况下,Apache HADOOP(为可靠性、可伸缩性和分布式计算提供的开源软件)和 OODT 如何相互实现就会很有趣了。

查看英文原文:NASA’s OODT selected as an Apache Top Level Project
Java架构ApacheDevOps大数据语言 & 开发AI