云计算与大片:基于阿里云的渲染农场

  • 贾国清

2013 年 5 月 31 日

话题:云计算大数据语言 & 开发阿里云AI

近期,喜欢看大片的朋友想必都有感触,不少电影都『云』了一把,先是甲骨文云计算与《钢铁侠 3》、然后是 Windows Azure 与《狄仁杰前传》,昨日,基于阿里渲染云计算的 3D 动画电影《昆塔:盒子总动员》也举行了发布会,本文将通过一些具体的数字来揭开渲染云的面纱。

5 月 30 日,博采传媒发布了中国首部在云计算上完成渲染的 3D 动画电影《昆塔:盒子总动员》。该片制作人兼导演李炼表示:

该片之所以能在 3D 画面和特效呈现上有媲美好莱坞制作的国际水准,恰恰得益于阿里云大规模分布式的高性能计算机集群,能够快速完成复杂的渲染任务和高分辨率真实感渲染的繁杂工作。

此外,阿里云 CEO 王坚博士也表示:

参与《昆塔. 盒子总动员》有三个愿望,第一,通过技术手段实现电影的高质量制作。第二,让云计算技术成为电影渲染中成本最低的选择。第三,自己给一百多位员工购买盒子总动员观影票,同时希望员工每人买一张送给朋友观看盒子总动员。

先来看看当年风靡全球的《阿凡达》中的一些数字:

该公司曾雇佣 900 人来为这部电影工作,为了渲染《阿凡达》,维塔数码动用了占地 10,000 平方英尺的服务器群,其中有 4,000 台服务器,共有 35,000 个处理器核心。在《阿凡达》制作过程中,单机渲染平均一帧(一层)的渲染时间为 2 小时,2K-4K 分辨率,160 分钟的影片,每分钟 9000 幅图片(60 秒 x30 帧 x5 层),整体渲染时间需要 2880000 小时,相当一台服务器要工作 328 年。3D 动画电影,每帧画面有两个图像,渲染需要超过 666 年才能完成。

《昆塔:盒子总动员》中的数字:

执行影片视效渲染工作使用了 6700 台计算机,累计计算量达 1000+ 万核小时,整体渲染工作历时 3 个月,相比过往,如果动画制作方自己购买服务器,自建渲染农场,大致需要 3+ 年才能完成。

从成本上来讲,对比自建渲染农场,在相同时间成本的前提下,需要一次性投入过亿元。而使用渲染云后,全片投入成本节省 90% 以上。

渲染农场(Renderfarm)是一种通俗的叫法,实际上是“分布式并行集群计算系统”,指利用现有 CPU、以太网和操作系统构建的超级计算机,它使用主流的商业计算机硬件设备达到或接近超级计算机的计算能力。

主要分为『传统渲染农场』和『自助式渲染农场』两种,传统式就是人工手动式,顾名思义就是人工在机房操作进行任务控制,弊端是渲染时间不透明,对于渲染进度,往往也无法进行有效及时的监控和干预。 2010 年前,国内所有的渲染农场均使用这种方式;自助式渲染农场则支持对 CPU 渲染能力的灵活分配。

渲染(Rendering)在电脑绘图中是指:将 2D 或 3D 模型变换为图像的一个过程。在图形流水线中,渲染是最后一项重要步骤,通过它得到模型与动画最终显示效果。每幅图片的渲染时间,根据模型复杂度的不同,相差很大,少则几秒,多则几天;模型越复杂,渲染时间就越长。

使用云计算技术可以将一个或者多个渲染任务分割成若干部分,由集群中各个节点同时渲染,从而降低整体渲染时间,缩短电影的制作过程。例如用户要渲染一部 60 秒的动画片,1 秒至少是 24 张图片,渲染云可以把这 1440 张图片分给 24 台机器,每台机器渲染 60 张图片。这样渲染的时间就是原来的 1/24。

经了解,阿里云所提供的渲染云计算是基于阿里云计算公司自主研发的飞天大规模分布式计算系统的弹性自助式渲染农场服务。主要使用了阿里云的 ECS(云服务器)、OSS(开放存储)和 SLB(负载均衡)服务。渲染云计算主要满足了用户在短时间内需要大量计算能力和实时释放计算能力的需求;简化了文件传输、参数设置、过程控制等繁琐步骤。浙江大学 CAD&CG 国家重点实验室参与了该系统的研发,提供了有关计算机图形学的技术支持。

目前,渲染农场的选择主要考量以下几点:

  • 看硬件(CPU、内存);
  • 是否需要排队等候;
  • 内网速度;
  • 价格
云计算大数据语言 & 开发阿里云AI