【ArchSummit 北京 2015】公有云平台发展与建设实战解析

  • 刘羽飞

2015 年 12 月 19 日

话题:云计算DevOps语言 & 开发架构物联网AIAPM容器

一年一度的岁末技术盛典 ArchSummit 北京 2015 已于 12 月 19 日顺利闭幕。在 18 日进行的“云平台应用选型与建设实践”专场中,来自青云、腾讯云、海云捷迅、微软、听云、SpeedyCloud 和七牛的 7 位工程师及技术专家分享了各自在技术实践中的心得与体会,其中内容涉及 SDN 架构、VPC 网络架构、OpenStack 高可用云服务、物联网架构、APM、网络节点部署、容器与微服务架构等多个领域,充分展示了云服务供应商在即将过去的 2015 年中的技术创新与进步。

SDN/NFV架构与 VPC 网络建设实践

从 SDN/NFV 的角度来看,青云可以说是业内为数不多的在早期就将 SDN/NFV 技术投入商用的云服务供应商。两年前当青云推出第一代 SDN 时,SDN 尚未完全被人们所接受,然而现在就连私有云企业也希望 SDN 能够部署在自己的企业内部系统中。而在本次分享中,青云则首次在公开演讲中透露了一些关于青云 SDN/NFV 2.0 的技术细节。

青云系统工程师陈海泉在演讲中表示,企业之所以需要 SDN,主要是因为两个原因,第一是虚拟网络,用户需要以虚拟化技术来代替物理服务器的不同的各种应用,当物理服务器坏掉的时候,企业就需要用到虚拟化技术进行迁移,而迁移的时候,IP 地址不能够发生变化,否则设备将不可用。

企业需要 SDN 的第二个原因则是 VPC,随着虚拟网络进一步普及,一个二层的虚拟网络已经难以满足企业的业务需求,因此用户希望把自己的大规模服务部署在一个与别人隔离的虚拟的二层网络甚至是三层网络中,而这就需要 VPC 来帮助用户把任意数量的虚拟主机都放进去,这些虚拟主机都是高速共享访问没有延时的。

目前业内的 SDN 方案主要是通过硬件或软件两种方式来实现,而青云在设计第二代 SDN 方案时最终选择了与 NFV 进行结合。之所以选择 NFV 是出于三方面的考虑,首先是成本问题,SDN 交换机要比普通交换机贵出很多倍,作为公有云服务供应商来说要节省硬件上的投入,第二是避免出现对设备的依赖,如果青云与某个硬件厂商绑定的话,无疑会损失很多私有云用户,第三是为了把产品做得更有竞争力,因此只有自己做方案才能做得更好,才能保证产品各个环节的品质,而使用现成的方案的话则很难做到这一点。

据陈海泉介绍,除了普通 SDN 功能以外,青云 SDN 在客户企业内部还会额外提供 VPC 主机直接绑定公网 IP、无限下载带宽并具备 HTTP 卸载能力同时 4 层 / 7 层协议全透明的负载均衡器、公有云基础网络 IP 地址任意迁移、VPC 和物理网络直连等功能。

在虚拟网络中,VXLAN 自有其优势,但却因为其在 SDN 使用中会出现大规模部署受网络设备组播路由限制,以及 ARP 广播扩大到三层网络这两大不足,因此青云 SDN 使用了一种 SDN 控制器主动下发规则,以便取消泛洪规则。

青云在设计 SDN 控制器时进行了多方面的考量,比如集群需要多少控制器?是使用集中控制器还是分布控制器?控制器同步范围是全局、VPC 还是子网?在考虑大规模同步时,青云尽量减少了同步规模,同时让没有同步的服务器规则之间能够高速访问,这就需要一个特殊的学习机制。另外考虑到的一点是控制器的高可用性,当物理机发生故障的时候,需要进行新的部署。

青云第二代 SDN 架构计划将于 1 月 6 号正式对外公布,届时将可以在发布会上亲身体验青云新的 VPC 及其他功能。

工业智能、云计算平台与物联网架构相融合

近年来随着工业智能化的发展,许多云服务供应商在几年前就已经开始提供物联网服务,而微软作为一家老牌 PaaS 服务供应商,同样也将物联网看做为一项重点服务。

微软开发体验与平台合作事业部首席技术顾问李婷表示,微软近几年在物联网方面已经进行了相当多的实践,一直致力于为客户提供平台级的解决方案,帮助客户在平台上搭建自己的物联网方案。比较典型的案例,就包括微软与全球第三大电梯供应商蒂森克虏伯的合作。

电梯的运维对于楼宇的安全来说至关重要,因此其运维机制不能是简单的轮班检修制。为了避免不必要的运维资源浪费以及安全疏忽,微软为蒂森克虏伯设计了一套具有预测分析能力、可以在电梯出现问题前先发制人的运维解决方案。其原理就是利用微软云平台收集每一部电梯的运行数据,再通过机器学习所构建的数据模型分析其运行状况,并预测可能出现问题的时间,以便维修人员能够提前更换电梯零部件或进行其他维修工作,维修团队中的每个维修人员都配备有联网的智能终端设备,可以随时看到每一部电梯的实时运维数据。

与德国著名瓶装水生产线供应商克朗斯的合作,是微软另一个在物联网领域的成功案例。瓶装水生产线和电梯一样,对运行的不间断性要求比较高。微软同样设计了一套具有针对性的运维解决方案——在每条生产线的核心部位上安装传感器检测收集相关的讯号,以便进行能耗数据分析,再根据分析结果预测哪些生产线部件将会在什么时间出现什么情况。

第三个案例是来自国内的和利时集团,和利时的业务主要是为化工厂、发电厂等能源行业工厂提供中控系统,而微软则帮助他们解决了监控数据可视化这一难题。在与微软合作之前,和利时主要混用自建数据中心与租用的电信数据中心,每天至少产生 10TB 的新数据。与微软合作后,则可将微软的后台作为数据的承载平台,所有端上的自动化设备上传的实时数据都会先送到微软后台,之后的数据一部分可放在数据库里通过手机等智能终端做实时展现,而另一部分数据可能会用来去做未来的大数据预测或者整体分析。

此外,李婷还将一台用于农场监测的物联网设备带到了演讲现场进行演示,该设备内置有可联网的 Windows 10 系统,带有 USB 通用接口,可通过鼠标直接进行操作,内置有温度、湿度等相关的指标传感器,指标异常时会发声报警,扫描机器上显示的二维码还可直接在手机上远程查看传感器所收集的相关数据与分析结果。

李婷认为在物联网应用领域有四个重点要素,分别是物体、连接、数据、分析。详细来说就是,首先物体要有感知能力,接着要能把数据传出来,有一些东西能够通过网关做连接转换,在数据平台要有可扩展的接收数据的能力,最后要具备对历史数据进行分析、评估、预测的能力。物联网应用,并不是简单的利用传感器收集讯号,再进行前台展示就足够的。传感器传输数据的方式、存储与分析海量数据的能力、工业物联网数据为自身生产能力所带来的提升,这些都是值得进一步思考的问题,也需要分布式的、大容量的并且可弹性扩展的计算资源来进行支持。

云计算DevOps语言 & 开发架构物联网AIAPM容器