SPARQL Update 将完善 REST 式 SOA 方案

  • Thomas Bandholtz
  • 徐涵

2008 年 5 月 14 日

话题:SOAREST架构

链接开放数据(Linking Open Data)合作计划已经完成了一个全球性的 REST 式 SOA 方案,人们可以通过它访问来自大约 50 个分布式提供者(如DBpediaGeonamesMusicBrainzWordNetDBLP bibliography2000 U.S. Census等)的超过 20 亿个相互链接着的断言(RDF 三元组(RDF triples))。所有这些数据都是以RDF(Resource Description Framework,资源描述框架)格式发布的。各数据集均具有具名图(named graph)的结构,你可以基于普通的 HTTP GET、通过Cool URI来访问它(参见之前的文章)。 关于如何参与贡献的具体说明可以参见《How to Publish Linked Data on the Web》这篇文章。因为数据集是在不同来源之间普遍互联着的,所有这一切造就了一个大(即便算不上巨大)的机器可读的(machine readable)Web。 如果提供者还实现了 SPARQL 端点(endpoint)的话(可能是用像D2R Server这种基于 RDBMS 的工具),客户端就可以针对这些数据使用强大的RDF 查询语言——SPARQL

人类可以利用像 Firefox 插件Tabulator这样的 RDF 浏览器来获得体会。关于 LinkedData 的最近一次演讲强调了更复杂的应用模式,比如特定领域的 LinkedData mashups、移动地理空间入口点(mobile geospatial entry-points)、语义搜索引擎(semantic search engines)、数据融合(data fusion)、聚合与深化工具(aggregation and drill down tools)等——这些肯定不久就会出现。

然而,目前有一个重大限制:这个帅呆了的网络只能提供只读访问。即将到来的SPARQL Update语言将解决这一问题。SPARQL 查询语言自从 2004 年由 W3C RDF 数据访问工作组(Data Access Working Group)开始开发、直至今年一月成为 W3C 推荐标准(Recommendation )以来, 有几个问题就一直没有得到解决,比如聚集函数(aggregate functions)和更新语言(update language)等。Andy Seaborne(知名的Jena开发者)和 Geetha Manjunath(二位均来自惠普公司)最近发布了RDF 图更新语言 SPARQL/Update(亦被称作“SPARUL”)的第五版,这可以推进这一问题。该语言拟提供以下功能:

* 往 RDF 图中插入新的三元组。

* 从 RDF 图中删除三元组。

* 以单个动作的粒度来执行一组更新操作。

* 在图库中创建新的 RDF 图。

* 从图库中删除 RDF 图。

这比较像链接数据(Linked Data)的 PUT、POST、DELETE 实现(implementation)。但什么是图库(Graph Store)呢?图库就是“在单个服务管理下的一个 RDF 图仓库(repository )”,其作用是作为发布 SPARQL 表达式的端点(endpoint)。要知道,每个图都是一个“应由 URI 本身表示的”RDF 数据集——那么为何不直接向那个“Cool URI”发送 HTTP POST/PUT/DELETE 呢?

惠普公司的 SPARQL Update 草案既没有提出、也没有回答这一问题,但SPARQL Update Wiki在其 Q&A 部分给出了一些提示:

SPARQL 是只读的,所以可将它映射为 URIs(因此采用 GET)而不会违反 Web 架构的太多原则。

REST 风格的 HTTP 操作应该可以在添加、更新、删除具名图(named graphs)的操作中起更重要的作用。

虽然 PUT 和 POST 通常比较有用,但 REST 和 Web 架构没有阻止使用其他方法——那也许更有助于实现“对大图进行原子更新”。

请尽量避免重蹈 Web 服务的覆辙;应用协议不是用于“被绑定的”,因为那会掩盖其大部分价值。

RDF 和 REST 的资源(resources)概念是可以不一样的。从 2006 年的《the trouble with “binding”》《REST without RDF is only half as bad as SOAP》,直到今年二月的《Bridging the semantic Web and Web 2.0 with REST》,一直在讨论这一问题,不过尚未得出任何定论。为什么这很重要?

链接开放数据(Linking Open Data )的 REST 式 Web 为 REST 式 SOA 树立了一个出色的真实世界模式——在仅提供只读访问时。设想一下,企业以同样的方式在内部容易地发布它们的数据;那么跨企业的机构也同样可以做到(假定安全需求同样得到满足的话)。至于链接开放数据(Linking Open Data)里的 UPDATE,这很可能将用 SPARQL Update 来实现。虽然这是一个语言,而不是一个应用协议,但它基于了对这样一个协议的假设,即标识图库(Graph Store)而不是图(Graph)。所以,“避免重蹈 Web 服务的覆辙”也许是值得的。

查看英文原文:SPARQL Update to Complete RESTful SOA Scenario
译者简介:徐涵,中文 W3C 技术推广网站 W3China(w3china.org)创始人,开放翻译计划(transwiki.org)发起人,W3C 特邀专家。2005 年毕业于东南大学,获计算机硕士学位。2003 年创办中文 W3C 技术推广网站 W3China(w3china.org),2004 年发起开放翻译计划(transwiki.org)致力于 W3C 技术文档的翻译,2006 年翻译出版国内首本中文 SOA 专著《Understanding SOA with Web Services 中文版》(荣获 2006 年度 CSDN 读书频道 SOA 先锋奖,入选 China-pub 2006 年度好书榜),2008 年翻译出版 REST 专著《RESTful Web Services 中文版》。研究兴趣包括:Web Architecture、Semantic Web、Web Services、SOA、Social Network 等。联系方式:hanxu@w3china.org。参与 InfoQ 中文站内容建设,请邮件至editors@cn.infoq.com
SOAREST架构