阿里庞俊英谈阿里云网络建设

  • 水羽哲

2012 年 12 月 4 日

话题:阿里巴巴语言 & 开发阿里云

阿里集团网络数据中心资深专家庞俊英在阿里云开发者大会上分享了阿里集团的网络建设方案,她把网络简单的比作奔向小康的那条“路”,这次主要探讨了“修路和维护”的问题。

她说道:

目前国内的运营商之间的互联互通问题还是没有得到很好的解决,不同的运营商之间的带宽都很小,而且网络运营商的链路大多数处于重载的状态。并且国家骨干、省网、城域网都各自为政这又是无法解决的问题。而有一种解决方案是采用 BGP 链路,但是成本过高。

她认为做互联网一定会出现的后果是:

将有限的时间和精力投入到无线的互联互通链路中。

庞俊英同时提到了一种新的解决方式“SDN”,但是认为目前的技术方案还不够成熟。针对如上的分析,她分享了阿里集团的网络建设方案。

目前阿里集团在杭州、北京、青岛都有机房和数据中心,地区内使用城域网连接、地区间使用长途网络连接,阿里正在建设自己的光传输网,用以保证上层的互动、异地机房与本地机房以及与运营商的互联。阿里的骨干网包括骨干网和数据中心网络两个层次。杭州每个 BU 和阿里云的交互是通过城域网来承载的,城域网里面每一个数据中心与骨干至少是四向接入,任何一个核心断电、断网都不会影响阿里集团整个脱网。阿里的光网络分为核心层和接入层,实现了真正的双环,能够达到 50ms 的收敛。

她随后罗列了云数据中心的云网络所应该具有的特质:

  1. 简化的运营
  2. 快速部署的效率
  3. 标准化
  4. 绿色

在这个原则之下,就需要构建统一的架构网络、统一的服务和统一的计算,即一种标准的模块化的云数据中心网络架构,整合计算网络资源,用单一的 POD 用于完整业务部署分配。对于单一 POD,她解释道:

POD 是一个逻辑数据中心功能模块,在一个模块里面它包括网络资源、服务器资源、存储资源,以及相应的空调、弱点资源等,在这个模块里面它存在完整的业务,存储、计算都会在这个模块里面。

通过多个模块的组合可以实现云业务的扩展和灵活性,主要体现在如下四个方面:

  1. 简化容量规划;
  2. 业务的适配比较容易
  3. 故障隔离容易;
  4. 一致高效运维;

目前阿里云所有的服务器全部是 2 个 G、双核心接入,任何一个链路上的抖动或者某台设备的失效都不会影响整个模块里面的每一台服务器的运行和服务。她还表示目前阿里维护了中国最大的一张二层网络。

针对安全问题,云网络有一个流量清洗中心,在这个中心里面和数据中心全部由光纤连接,可以完成 N×10G 的小包清洗能力,还有 N×100G 的清洗能力。

最后她总结了阿里云网络:

有上百 G 的运营商出口,我们所有的云数据中心出口互相之间进行交流的带宽有上 G,我们数据中心内部模块之间互联从百 G 到 T 级,网络无任何单点存在,从安全清洗中心到 VM 本地策略形成例题式云安全体系,目前阿里也在关注并投入力量在 SDN 的研发上。

阿里巴巴语言 & 开发阿里云