LLVM 团队昨日发布了 LLVM 2.8 ,包括下一代 C/C++ 编译器、优化器和运行时的低级虚拟机基础架构。
LLVM 实际上是一群项目的集合,能够支持 C、Objective-C 和 C++ 的编译。编译本身是由 Clang 来完成的,它早就可以编译 C 和 Objective-C 了。在 LLVM 2.7 时引入了对 C++ 的支持,而后 2.8 的发布则是对 C++ 规范的支持的更为完整,新增的 libc++ 让 C++ 应用得以使用标准库。全新的调试器 LLDB 也包含其中,它应用和编译器相同的解析器和源代码工具,目的是为了替代旧有的gdb
调试器。尽管 LLDB 早前已经可以下载使用了,这次 LLVM 2.8 中的 LLDB 却是其首次正式发布。
和基于 GPL 授权的单一编译器 GCC 不同的是,LLVM 工具族更为模块化。而且得益于更为宽松的 BSD 授权,LLVM 可以嵌入在商业工具中。因此,像苹果的 Xcode 这样的应用,在 Clang 的支持下能够比外部gcc
应用的性能更好。不仅如此,工具生成的 AST 还可以由所包含的工具进行自省,这给予了 IDE 更为强大的能力,来了解源代码的相关结构和编译码。
另外,模块化的架构使得 Clang 的静态分析器可以纵观源代码并指出潜在的 bug,比如 Klee ,它是一个符号化虚拟机,可以在一个程序之中给出事件发生的次序。Klee 的特性之一便是通过事件寻找 bug,它能够通过编程生成一个测试用例,而这个用例便可以用来演示 bug 被修正后的状态变化。
不仅是 C 语言
最终,LLVM 项目不仅是面向 C 或基于 C 的语言。因为前端解析器其实是符号化指令集,这种指令集实质上是一组可移植的汇编码,能够翻译到任何支持的机器架构之上。这使得构建其他的解析器和翻译器成为可能,只需生成相同的汇编码,便可支持所有 LLVM 族支持的平台。
不仅如此,优化的工作可以深入到汇编码级别,而非仅是在源代码级别,因此任何能够翻译成 LLVM IR 的语言都能够自然而然地享受到运行时优化的好处。运行时可以直接解释 IR,所以解释型语言也可以受益于此,根据接下来对 JIT 的调用来优化应用对应的部分。
目前 VMKit 已经在这样做了,它提供了 JVM 和 CLR 的通用运行时,其他语言运行时也有所涉及。 Mono 运行时现在已经发布了 2.8 版本,包含了对 LLVM 的支持,将其作为 JIT(使用mono-llvm
)来辅助运行时优化。其他运行时包括 Ruby on LLVM 、 MacRuby 和 Unladen Swallow 等。甚至在 Clam AV 内部也用到了它,来实现高效的病毒扫描。
你可以通过试用基于web 的演示,来观察代码是如何编译成LLVM IR 的,或通过查看 LLVM 博客和文档来获取更多的信息。
查看英文原文: LLVM 2.8 Released
评论