平台多样化:Gavin Grover 的 Groovy 之路

  • 宋玮

2009 年 6 月 12 日

话题:Java.NET开源C#DevOps语言 & 开发架构

最近,Gavin Grover 将其开发的 Groovy-DLR 1.0 的 beta 04 版源码上传到了codeflex站点,该版本对以前的版本作出了一些改进,包括就地(in-place)注释 lex 定义。

众所周知,Groovy 是在借鉴了众多语言如 Perl、Python、Ruby 以及 Smalltalk 的基础上发展而来的,最初是在运行于 Java 平台的,而且其支持 Java 的大部分语法,与 Java 有着天然的集成性,被称为 Super Java。在 Grails 出现之后,极大地推动了 Groovy 的发展。

随着 Groovy 的发展,一些 Groovy 的爱好者开始琢磨着扩展 Groovy 的生存空间,Gavin Grover 就是其中一位,他开始考虑使 Groovy 语言在.NET 的 DLR 环境下运行。从 3 月份开始,Gavin Grover 陆续在 codeplex 上发布了 Groovy-DLR-1.0 的几个 beta 版本。他在其博客上是这样描述的:

最近,Gavin Grover 开始给微软的动态语言运行时(DLR)增加 Groovy 语言。他的主要精力投入到用 combinator parser 创建一个全功能的句法外衣,这是 (J)Groovy 所缺乏的。Groovy 的语法是下一代 C 语言语系,旨在给语言句法带来自称性 (self-referentiality)。

Groovy 未来的目标平台还包括 Parrot VM、Google GWT AST 以及 Python VM。

不过,Gavin Grover 似乎放弃了 Groovy/DLR 的后续发展:

……我正在把语言切回到 JVM、(J)Groovy AST、SCALA 上……

虽说 Groovy-DLR 还未成熟就面临夭折的可能,但无论如何,Gavin Grover 给我们提供了一种在.NET 平台上运行 Groovy 的尝试,也给希望使用 DLR 创建其他语言的人们提供了一个实例教材,Groovy-DLR 1.0 beta 04 的源代码可以从这里下载。

Gavin Grover 还在其博文Groovy's Groovier Roadmap中提到了其 Groovy 路线图,说明了他已经实现及以后想要实现的 Groovy 特性:

就地 lex 定义(In-place lexing definitions)

Beta-4 提供了基本的就地注释 lex 定义。例如,源文件中的 addcomment "(?s:#{4}.*)"语句会给 whitespace lexer 增加这一注释定义,使其可以用于后续要解析的语句和文件。此处这一特例可以让我们在源文件加入 #### 以表示到达了文件尾部(文件在此注释之后的内容无需再解析)。

就地解析 hooks(In-place parsing hooks) 我们还将在 parser 中提供 hooks 以使 Groovy 程序员可以定义自己的基本表达式、路径元素(Path element)、操作符以及语句。我们将把后缀操作符(++ 和 --)修改到路径元素中。操作符将有 4 层定义良好的组:从右向左运算(right-associative)的一元前缀、从左向右运算(left-associative)的二元操作、从右向左运算的三元操作以及从右向左运算的赋值(assignment)。

多种语法形式 Python 使用了缩进吧语句组织成块(block),C 语法语言使用大括号。Groovy 将同时提供两种技术。在工作过程中,我们还将把该技术抽象到使用 (: 和 [: 的语法里的其他列表当中。Groovy 开发者将能够选择语法形式,甚至在同一部分代码中混用两种形式,就像在自然语言中一样。

别名 别名是最初在为 GrAST (Groovy AST) 编写另一个 lexer/parser 过程中最能引起我兴趣的。我很早以前就希望用中文字符作为英语名字和程序关键字的别名,这样可以让代码更短。我不喜欢这样写程序:

content.tokenize().groupBy{ it }. collect{ ['key':it.key, 'value':it.value.size()] }. findAll{ it.value > 1 }.sort{ it.value }.reverse(). each{ println "${it.key.padLeft( 12 )} : $it.value" }

我想这样写(注:国人看着可能有些别扭,领会其意图即可):

物. 割 (). 组{它}. 集{ ['钥': 它. 钥, '价': 它. 价. 夵 ()] }. 都{它. 价 >1}. 分{它. 价}. 向 (). 每{打"${它. 钥. 左 (12)}: $ 它. 价"}

Groovy 将允许程序的关键子及名字使用别名词汇。即使从右向左阅读的语言也将能够实现。所有 Unicode 的词汇将与 Groovy 语言紧密集成在一起。

自定义方法编辑器 我认为在 Groovy 提供 CJK 字符支持之后,CJK 字符将快速流行起来,我还想提供一种输入方法,可以让向我这样的非中国人可以容易的学习和使用。为 CJK 字符通工程易用的 IME 这只是第一步;最终该 IME 将能够支持每一种 Unicode 字符。10 年内,开发者就可以用埃及文字进行编程了!你能想像那是怎样的情景么?

虽然还有很长的路要走,但是 Gavin Grover 的一些思路也给了我们无限遐想,尤其是编写中文的 Groovy 程序,那种感觉一定不错吧!

Java.NET开源C#DevOps语言 & 开发架构