Gremlin,一门操作图表的语言

  • Abel Avram
  • 马国耀

2010 年 1 月 17 日

话题:Java编程语言架构语言 & 开发

Gremlin 是操作图表的一个非常有用的图灵完备的编程语言。它是一种 Java DSL 语言,对图表进行查询、分析和操作时使用了大量的 XPath。

Gremlin 可用于创建多关系图表。因为图表、顶点和边的元素含有由键值对定义的属性,所以图表被称之为属性图表,以下是一个示例:

它包含以下类型:

  • 图表:图表是由一组顶点和一组边构成的。
  • 顶点:顶点由一组出边(从顶点指出的边),入边(指向顶点的边),和属性表组成。
  • :边由出点,入点和属性表组成。
  • 布尔型:布尔型有 true 和 false。
  • 数字型:数字型可以是整数 (integer) 也可以是实数(double)。
  • 字符型:字符型是字符串数组。
  • 列表型:列表是一个有序可重复的对象集合。
  • map 型:map 是一个从一组键值对象到一组值对象的关联数组

除了 XPath 的数学计算(加,减,乘)之外,Gremlin 还提供了很多语句,如 If/Else,While,Repeat,Foreach 以及其他。

Gremlin 可用于任何实现了通用图表模型(General Graph Model)的框架。该模型包括一系列组件(如图、元素、顶点、边和索引)以及相应的 Java 接口,欲使用 Gremlin 结构来操作图片,则需要实现这些接口。

使用 Gremlin 操作图片的一个例子存在于MongoDB文档中。另一个是与资源描述框架(Resource Description Framework)存储一起用于OpenRDF, AllegroGraph, Open Virtuoso 或者 Neo4j等图数据库中。将来,Gremlin 团队将有意添加对 CouchDB 和 Terracotta 的支持。

示例

要理解 JSON 编码的图片,你就需要使用以下模式(schema)来描述顶点和边。

object {
   string "_id";
   array { string } inEdges;
   array { string } outEdges;
   object { }* properties;
 };
object {
   string "_id";
   string label;
   string inVertex;
   string outVertex;
   object { }* properties;
 };

然后,上述图片在用 JSON 编码后如下所示:

//// VERTEX COLLECTION ////
  {
   _id: "1",
    properties: {
      name : "marko",
      age : 29    },
    outEdges : ["7","8","9"]
  }
  {
   _id: "2",
    properties: {
      name : "vadas",
      age : 27
    },
    inEdges : ["7"]
    }   ... [section skipped for brevity]
    //// EDGE COLLECTION ////
  {
   _id: "12",
    label: "created",
    properties: {      weight : 0.2    },
    outVertex : "6",
    inVertex : "3"
  }

该数据存储到 MongoDB 时,数据库将创建两个集合,一个顶点集合,一个边集合,Gremlin 允许你通过通用图表模型接口操作这些集合,如添加 / 删除顶点或边,获取顶点或边的集合,获取 / 设置顶点或边的属性,通过查找顶点所关联的边或者查找边所关联的顶点在图片上导航。

向一个图片添加两个顶点并将它们通过边连接起来的动作称之为“related_to”,它是这么实现的:

 gremlin> $v := g:add-v($g) ==>v[0]
 gremlin> $u := g:add-v($g) ==>v[1]
 gremlin> $e := g:add-e($g, $v, 'related_to', $u) ==>e[2][0-related_to->1]

在电脑芯片设计,生物学,网络学等方面有相当多的图表应用。一个简单的例子是创建这样一个图,顶点表示网站中的网页,而边表示页面指向另一个页面的链接。在 Gremlin 中你可以对这样的页面图表进行更改和编辑其属性。

资源: TinkerGraph ——通用图表模型的参考实现,Gremlin 文档Gremlin 用户组.


查看英文原文:Gremlin, a Language for Working with Graphs

Java编程语言架构语言 & 开发