Python JIT 编译器 PyPy 4 引入 SMD 向量化并提升了性能

阅读数:1817 2015 年 11 月 10 日

话题:Python语言 & 开发

PyPy 是 Python 的一个即时编译器,PyPy 4.0 是其最新发布的一个大版本,带来很多新的特性,诸如支持 SIMD 矢量、预热时间的改进、以及对 Numpy 的改进。PyPy声称要比 Cpython 快 6 倍以上。

PyPy 4 的 SIMD 矢量会在追踪代码时启用,而且会自动探测到可用的 SIMD 硬件从而提高常见的向量和矩阵操作。根据版本的公告,实时矢量相比前置(ahead-of-time)矢量更具有领先优势,因为其更加的容易探测到可能的矢量。

在性能方面,PyPy 的内部进行重构从而能够更有效的使用guards。它能够减少 20% 的内存消耗,而且改进了 unrolling,这样可以较少 20% 的预热时间。

PyPy 中的Numpy和 Python 的 NumPy 扩展是一个道理。Python 的 NumPy 曾经谈及,NumPy 是能够将使用 PyPy 的开发者们纠回到 Python 本身的一个理由。在 PyPy 4.0,Numpy 带来了新的扩展支持,如 ndarray 和数字的 dtypes,这也就意味着 Numpy 的功能接近完善。对于 record、string、以及 unicode dtypes 的支持都有所改进。

PyPy 4.0 目的是兼容 CPython2.7。对于缺少对 Python3 的支持被认为是人们采用 PyPy 的一个限制因素。事实上,PyPy3 是兼容 Python3.2.5 的,而且 PyPy 团队正在尝试启动对 Python3.4 的支持。

在迁移到 PyPy 之前还应该考虑另外两个因素,一个是 PyPy 还缺乏像 C Python 那样的扩展如 Pandas,SciPy 等的等量支持,这样的话,若是用户使用了这些扩展的话,PyPy 就不如 C Python 效率更高;另外一个就是,PyPy 为其即时编译器带来的好处是对长时间运行的脚本支持,若是简单而短小的脚本的话,预热时间就显得长了点。

更多关于 PyPy 4.0 的细节请参考其官方声明。PyPy 4 可以在这里下载

查看英文原文:Python JIT Compiler PyPy 4 Brings SMD Vectorization,Performance Improvements,and More


感谢张龙对本文的审校。

给 InfoQ 中文站投稿或者参与内容翻译工作,请邮件至editors@cn.infoq.com。也欢迎大家通过新浪微博(@InfoQ@丁晓昀),微信(微信号:InfoQChina)关注我们,并与我们的编辑和其他读者朋友交流(欢迎加入 InfoQ 读者交流群)。