红帽白皮书新鲜出炉!点击获取,让你的云战略更胜一筹! 了解详情
写点什么

PaaS,不是银弹

  • 2014-10-21
  • 本文字数:3476 字

    阅读完需:约 11 分钟

概要

首先这篇文章并非攻击 PaaS,也不是否定 PaaS 的价值。相反,笔者是想通过本文对 PaaS 有一个更加明确的界定,它是什么,能处理哪些问题,不能解决哪些问题。这样可以对所有正在探索 PaaS 或准备上 PaaS 的企业,能有一个参考。

本文作为笔者过去十年的工作总结,对 PaaS 的实践和思考。 笔者曾在新浪供职九年时间,参与并负责研发内部动态平台 (私有 PaaS) 的建设并在后来领导了整个 SAE(公有 PaaS) 项目的发展,因为有了动态平台的实践经验,也才有了后来 SAE 的诞生,两者有因果联系。

动态平台 (Dynamic Pool)

这个名词是和静态池相对的。因为新浪在很早就为新闻业务构建了一个静态池(目前仍在沿用)。

起源

动态平台的立项在 2004 年,当时 CTO 李嵩波先生负责新浪技术工作,他对这个项目非常支持。童剑当时是这个项目的带头人。

当时的动态平台解决的问题:

  • 资源共用 避免一个应用一堆机器
  • 开发有规范 不能按照每个开发人员的好恶
  • 统一的运维管理 开发人员不管理机器,只负责代码编写和数据库设计

发展

动态平台的发展初期,得益于公司领导的支持和成本管理的加强。这使得新项目申请设备预算变得困难,进而促进了动态平台的快速发展。

发展过程中遇到的主要难题:

  • 资源争抢冲突问题
  • 故障排查难度大
  • 数据库管理面临挑战
  • 开发和运维的协作配合

这些难题在动态平台不同的发展时期,表现程度也不尽相同。在不同时期,都有相应的流程或技术来解决这些问题。

壮大

2009 年,微博技术负责人决定使用动态平台,这使得动态平台的承载规模在随后几年都呈现了井喷式的高速发展。并使得动态平台的适应能力更强。

动态平台快速发展壮大的根本原因在于公司领导支持和严格的成本管理,削减业务部门 IT 预算。这一点可供想搞私有 IaaS 或私有 PaaS 的企业参考,如果你们的预算很多,那么搞私有云,十有八九是要失败的!很明显,业务部门的 IT 预算足够,是没有能动性去使用私有云的。

如果要问全球业务规模最大的 PaaS 是哪一家,那一定是新浪研发的动态平台!

SAE

2008 年 Google GAE 发布。笔者当时正负责动态平台的日常管理。当时的 GAE 我看到后非常惊艳,开发人员可以自助管理自己的应用,写好代码提交后就直接运行。而当时动态平台还是工单时代,开发人员需要提交应用申请,我们在后台进行手工配置后开通。当时就有一股冲动,想要搞一个类似的产品。这在 2009 年成为现实。2009 年 11 月 SAE 如愿上线,并很快发布了 alpha1、alpha2、beta 等多个版本。随着微博的蓬勃发展,2011 年微博开放平台应用的蓬勃发展,有力地带动了 SAE 的飞速发展,当时的微博投票、粉丝汇、微博数据分析、聊天工具等大量第三方的应用快速地在 SAE 上诞生,并且日访问量都可以轻松过千万。

挑战

SAE 的技术架构,很有多动态平台的影子。其运营维护也得益于过去多年成熟的经验。但外部用户和内部用户的差别,对 SAE 的影响很大,特别是后来 IaaS 和云主机在国内快速发展,SAE 发展速度放缓。

  • 外部业务的差异性大,内部业务相对要整齐
  • 外部客户的协作难度更高 外部客户数量庞大,在服务支持上只能侧重于重要的客户。
  • 敏感应用监管难度高
  • DDoS 攻击每日不绝 这是所有做公有云的人都面临的痛苦
  • 恶意应用多 比如恶意的淘宝客

用户使用 SAE 的理由

毫无疑问,SAE 是国内最早的 PaaS 平台,也是目前国内最成熟、用户规模最大的 PaaS 平台。即使是在目前云计算用户争抢越来越激烈的今天,每天仍然有大量用户注册使用 SAE 平台。之所以有用户愿意使用 SAE,核心的原因:

  • 快速获取 app 运行环境 虽然说用户搭建一套 Lamp 或 Tomcat 环境并不复杂,但如果不是很熟练,看文档去做,几个小时还是需要的。
  • 免运维 这个是最关键和核心的。使用 SAE 后,你完全不需要关心运维了,只要负责写代码,这对很多开发人员来说,很有吸引力。
  • 便宜 SAE 的实现方式,决定了它的密度最高,目前没有其他模式可以相比。这也是为什么使用 SAE 会很便宜的原因。这对很多个人开发者而言很有吸引力。

PaaS 解密

定义

维基百科的解释: In this model, the consumer creates the software using tools and/or libraries from the provider. The consumer also controls software deployment and configuration settings. The provider provides the networks, servers, storage, and other services that are required to host the consumer’s application

上面的定义,应该是对多家 PaaS 供应商的产品的一个总结。包括 GAE、Heroku、CloudFoundry、OpenShift、SAE 等。翻译为中文的意思就是:使用者只要提交应用代码,其余所有事由 PaaS 供应商搞定。

这是多么美好的愿景!我想这也是所有开发者的梦想,只关心代码,其他的都不用管,服务还都能运行得很好,99.99% 的可用性,不用担心半夜出故障还得爬起来,不用担心数据库忘记了备份导致数据丢失,不用担心访问量突然倍增,服务抗不住,不用担心网络故障来回切换服务。世界变得好有秩序。

上面描述的愿景,令人十分向往。如果真的有这样的 PaaS 存在,如果 GAE 真的做到了这些,为何云计算的领导者是 AWS,不是 GAE?

我不禁怀疑,这样的万能的包治百病的 PaaS 真的存在吗?不论是作为先行者的 GAE、Heroku、SAE,还是后来的 CloudFoudry、OpenShift,还是现在的基于 Docker 的 Flynn、Deis。

如果让我现在给一个 PaaS 的定义,我会这样写:PaaS是一套开发、运维的规范和流程,可以通过一些辅助工具将规范、流程沉淀下来。但同时业务和技术总是处于不断变化的时代。流程和规范也需要适应变化。没有一套流程规范能让你用一辈子,也没有什么工具可以帮助你一劳永逸地解决所有问题。新浪动态平台已经有不到 10 年的历史,一直都处于不断的演进、变化、调整中,之所以需要不断演进变化,因为技术在变化、业务在变化、组织在变化,不要期待不变,那是不可能也是做不到的。

PaaS 解决什么问题

要谈 PaaS 能够解决哪些问题,取决于 PaaS 提供哪些能力,一般而言,目前的 PaaS 提供:

  • 代码部署能力
  • 代码运行时环境,如 Java、PHP、Ruby 等
  • 各种应用运行所需的服务 典型的是数据库

从上面的功能看,PaaS 主要解决的问题是应用的部署以及执行。

PaaS 不能解决什么

  • PaaS 不能做到全自动、无故障的运维管理
  • PaaS 也不能代替你实施开发和运维流程的梳理,而这个我认为对企业才是最核心的,是一个开发和运维观念的变化,光有工具是不行的。
  • PaaS 需要的运营维护工具,仍然是需要你自己开发或者购买的。PaaS 无法提供全套的管理工具。
  • PaaS 提供的服务仍然是有限的。比如你需要 LBS 服务,或者消息推送服务,可能某个 PaaS 提供,但另外的就没有。没有全能厂商可以提供所有服务,如果他提供了,也一定是个花架子。

看到上面几点,大家是不是觉得 PaaS 没什么用?其实不是,PaaS 只是个工具,你需要首先变革你的理念,或者你不使用 CloudFoundry 这么复杂的系统,但如果你已经将你的开发和运维流程规范做得很到位,那么确实是不需要 PaaS 的,或者你在实施你的流程时,就已经自觉或不自觉地使用了某些工具,你可以非常快速地部署软件、实施监控、有条理地进行备份,那么你确实无需再去引入一个 PaaS 平台了。

PaaS 最终应该是解决方案,适应客户需求的解决方案,而且是需要随着业务需求的变化可以不断演变。而不是客户削足适履去适应 PaaS 这个工具。那样的话,PaaS 之路必定是多灾多难。

NiceScale

离开老东家新浪后,当时我立志做一个灵活性很强的 PaaS,可以支持任意的软件栈,能够帮用户管理维护好他的所有软件栈。这个项目设定的目标比 CloudFoundry 要大,当然我们在 PaaS 运营上的经验足够。但是 Docker 发展如火如荼后,一个通用的 PaaS 意义还有多大?而且要解决 PaaS 的运管方面的需求,其复杂度也很高。但最关键还是,用户真的需要这么复杂的工具吗?

我重读 Unix 经典著作,思考前辈们是如何处理这样复杂的工程的。我们承认,服务运行的管理确实非常复杂,但是如果使用了复杂的工具去管理,那么也只能带来更高的复杂度。解决复杂的问题,只有简单,任何复杂的事情,都是可以分解为简单。

从简单入手,于是有了新的 NiceScale。但 NiceScale 的目标没有变,降低用户使用云计算的复杂度一直是我们的追求,是我们矢志不渝的目标!

这个新的产品,前期只解决一个小问题,帮助你非常容易地管理多个服务器。通过批量在多个机器上执行脚本,并将行为记录下来。功能虽少,但是相信你使用过后,会体验到它的强大与方便。

原来服务器管理也可以不再枯燥,变得有趣、很酷!

初心未变,但我们选择了另外一条路,简单的路。

Keep it simple, stupid …

本文作者: @IT 人 ,曾负责新浪研发私有 PaaS(动态平台) 和公有 PaaS(SAE)。混合云管理平台 NiceScale.com 创始人。

2014-10-21 12:582191

评论

发布
暂无评论
发现更多内容

工厂模式——猫粮公司的演进

蝉沐风

Java 设计模式 工厂模式 工厂方法模式

【Flutter 专题】19 图解【分享页面】底部对话框

阿策小和尚

Flutter 小菜 0 基础学习 Flutter Android 小菜鸟 11月日更

CSS架构之Theme层

Augus

CSS 11月日更

Python代码阅读(第52篇):返回列表的头部和尾部

Felix

Python List Code 列表 阅读代码

【LeetCode】有效的完全平方数Java题解

Albert

算法 LeetCode 11月日更

架构训练营毕业总结

Clarke

架构实战营

推荐学Java——初识数据库

逆锋起笔

Java MySQL 数据库 Java后端

Apache APISIX 在腾讯云智能钛平台中的落地实践

API7.ai 技术团队

腾讯云 网关 API网关 Apache APISIX

架构实战营 王者荣耀商城异地多活架构设计

💤 ZZzz💤

架构实战营

NEJ Build太慢怎么办?试试MOOC NEJ吧,只需两步,提升70%构建性能!

有道技术团队

算法

如何免费下载学术文献?

Jackpop

让华为举步维艰,Android曾距离成为国产系统仅一步之遥!

Jackpop

系统架构面临的三大挑战,看 Kubernetes 监控如何解决?

阿里巴巴云原生

阿里云 Kubernetes 云原生 系统架构

新书 | 这绝对是读起来最有趣的计算机科普绘本

图灵教育

少儿编程 绘本 逻辑启蒙

快手微服务架构技术交流会

快手中学

微服务 云原生 稳定性

Apache RocketMQ 荣获 2021 中国开源云联盟优秀开源项目

阿里巴巴云原生

Apache 开源 RocketMQ 资讯

一部亚马逊4.5高分的领域经典,首次落地中国

博文视点Broadview

☕【Java技术指南】「序列化系列」深入挖掘FST快速序列化压缩内存的利器的特性和原理

洛神灬殇

11月日更 FST 快速序列化

web技术分享| WebRTC 实现屏幕共享

anyRTC开发者

大前端 Web 音视频 WebRTC 屏幕共享

JAVA Annotation详解

平凡人生

尝鲜Windows 11一个月,被这3项巨变圈粉了....

Jackpop

把选择题变成问答题

FunTester

Java Python 测试 FunTester

实验室lims系统解决方案

低代码小观

实验室管理系统 企业管理 LIMS实验室信息管理系统 LIMS系统 信息管理系统

【设计模式】第十篇 - 外观模式 - 我来组成头部

Brave

设计模式 外观模式 11月日更

苏丹2021年10月25政变断网事件

郑州埃文科技

时代赋机遇,双十一电商盛会神助攻——中科柏诚

联营汇聚

没有性能瓶颈的无限级菜单树应该这样设计

Tom弹架构

Java 架构 设计模式

基于消息队列 RocketMQ 的大型分布式应用上云最佳实践

阿里巴巴云原生

阿里云 RocketMQ 云原生 消息队列 上云

iOS开发:用XIB拖控件关联时报错:“Could not insert new outlet connection…”解决方法

三掌柜

11月日更

Redis 日志篇:AOF 与 RDB 让数据持久化不丢失

码哥字节

redis 后端 Redis 核心技术与实战 11月日更

论层次架构风格

lazytortoise

PaaS,不是银弹_服务革新_王利俊_InfoQ精选文章