Groovy 中的 Actor 模型

  • 胡键

2009 年 1 月 19 日

话题:Java语言 & 开发

性能是所有程序开发人员无法回避的问题,性能糟糕的程序只会将客户拒之门外,让开发商的声誉受损,让投资人的金钱打水漂。然而优秀的性能表现并非能免费获得,即便在当今的多核时代,一个单线程程序也不会因部署到多核机器上而使性能自动提升。不错,在众多提升性能的手段中,使程序并行化是其中最容易想到且最有效的手段之一。然而对于大多数主流编程语言来讲,“说来容易,做起来难”这句老话在多线程编程上可谓体现得淋漓尽致。以 Java 这一无所不在的语言为例,死锁、资源分配、状态共享、调试、异步调用无一例外都是在多线程编程过程中的拦路虎。这一点想必有过 Java 多线程编程经验的开发者都有体会。而随着并行需求的越来越高,另一门有着悠久历史的语言也重新得到了主流世界的关注,它就是 Erlang。

Erlang 以其对并行编程天生的支持而闻名。在其他语言看来棘手的并行编程问题,对 Erlang 来说则显得是轻而易举。由于无共享、基于消息等特点,使得死锁、状态共享、异步调用等困扰多线程编程的问题在 Erlang 中不复存在。正是因为使用它编写并行程序容易,使得这些年来国内技术社区对 Erlang 的关注在不断地升温。当然,任何一门成功语言的背后都离不开坚实的理论基础。Erlang 也不例外。支撑其对并行编程有着良好支持的幕后功臣要归功于Actor 模型

Actor 模型并非什么新鲜事物,它由 Carl Hewitt 于上世纪 70 年代早期提出,目的是为了解决分布式编程中一系列的编程问题。其特点如下(摘自这个幻灯片):

  • 系统中的所有事物都可以扮演一个 Actor
  • Actor 之间完全独立
  • 在收到消息时 Actor 所采取的所有动作都是并行的,在一个方法中的动作没有明确的顺序
  • Actor 由标识和当前行为描述
  • Actor 可能被分成原始(primitive)和非原始(non primitive)类别
  • 非原始 Actor 有
    • 由一个邮件地址表示的标识
    • 当前行为由一组知识(acquaintances)(实例变量或本地状态)和定义 Actor 在收到消息时将采取的动作组成
  • 消息传递是非阻塞和异步的,其机制是邮件队列(mail-queue)
  • 所有消息发送都是并行的

幸运的是,Erlang 并非是实现了 Actor 模型的唯一语言。在 Java 平台上,开发者还能够选择 Scala。对于那些坚守“纯”Java 语言的开发者,他们则可以选择以下的框架:

关于这些框架的比较,可以参见这个帖子

出于对 Scala 的 Actor 库的“艳羡”,Vaclav Pech 在其项目

GParallelizer

中也实现了 Actor 模型。该项目是用 Groovy 实现的并行处理 DSL,当前版本为 0.4。GParallelizer 提供了多种 Actor 类,它们的区别在于所用消息队列的类型不同。GParallelizer 中 Actor 的主要方法有:

  • send,发送消息
  • receive,接收消息
  • start,启动 Actor
  • act,该方法是 protected 类型的,它由 Actor 的线程周期调用,直到 Actor 上的 stop 被调用为止。GParallelizer 提供了一种“即发即弃”的 Actor:OneShotActor,它的 stop 方法会在首次执行 act 之后自动被调用。
  • stop,停止 Actor

Actor 上的生命周期方法有:

  • afterStart
  • beforeStop
  • afterStop

Vaclav Pech 并在其博客对 Actor 的主要使用进行了说明

创建一个打印它收到的所有消息的一个 Actor。

 def actor = Actors.actor {

println receive()

}

启动并发送消息。

actor.start()

actor.send('Message')

扩展 Actor。

class CustomActor extends BoundedActor {
 @Override protected void act() {
 println receive()
 }
}

def actor=new CustomActor()

除了这些入门的例子,Vaclav Pech 还列举了相对实用的两个例子:计算器和并行归并排序。关于这些例子的详情可以从其博客了解一二。

除了 Actor,GParallelizer 的主要组件还包括:

  • Asynchronizer,基于 Java Executors 的并行集合处理器
  • Parallelizer,使用 JSR-166y 并行数组(Parallel Arrays)来对多线程集合处理提供支持。

欲了解该项目详情,请访问该项目主页

阅读更多 Groovy 和 Erlang 内容,请浏览 InfoQ 中文站Groovy 专题Erlang 专题

Java语言 & 开发