【AICon】探索八个行业创新案例,教你在教育、金融、医疗、法律等领域实践大模型技术! >>> 了解详情
写点什么

云计算就是服务:阿里云总裁王坚博士访谈录

  • 2012-11-15
  • 本文字数:4397 字

    阅读完需:约 14 分钟

又是一个双十一,很疯狂的季节,列出几个数据大体就可以了解何谓“疯狂”:去年双十一,淘宝交易额是 33.6 亿,已经让人咂舌,在同样的时间段里,今年双十一期间淘宝的交易额已经是 191 亿,出单量也达上亿次。在国外的一些技术交流网站上,很多技术人员也在好奇地问,这么短的时间,这么大的交易量,这家中国的公司是如何做到的?我们国家的 12306 火车票售票网站,每天的出票量不过数百万,还经常瘫痪,可想而知支撑双十一背后的技术储备需要多深厚。再想想阿里巴巴从几年前就开始的去 IBM 小型机,去 Oracle 数据库,去 EMC 高端存储设备等,并从 2010 年就开始的双十一购物狂欢活动,每一个改变都让业界小有震动。而这一系列技术动作都和自 2008 年加入阿里巴巴,并任首席架构师的王坚博士有着密切的关系。

相对于这些隐形的、可能并不为太多人所熟知的故事,也许技术圈内大家更关注的还是阿里云所做的事情,而这也正是带给王坚博士非议最多的地方。按照王坚自己的说法,阿里云已经不知道死过多少次,一代又一代人坚持不下来而倒下,一代又一代新生力量站起而坚持,这最终也慢慢让人看到了萌芽的诞生。在今年双十一的上亿次交易中,就有超过 20% 的运算是进行在阿里云平台上的。除此之外,数据量更大的雅虎邮箱数据,也将在年底前全部完成从专有存储设备到阿里云平台上的迁移。

和大多数热爱技术的人一样,王坚博士也有着自己的技术情节,愿意为开发人员的事情而奔走,这也是为什么他坚持从去年开始,每年举办“阿里云开发者大会和大赛”的主要原因之一。在阿里云开发者大会期间,和王坚博士的这次深度交流中,我们谈到阿里巴巴对技术人员外出分享的看法,对当前技术趋势的理解,对阿里云飞天平台的架构解释,以及飞天开放平台的起因和背景等。他也提到通过阿里云开发者大会,让他度过了平台和应用的纠结阶段,虽然应用为王,但是作为平台提供商,自己要不要去做应用是一个非常困难的选择,这也是一个鸡生蛋和蛋生鸡的问题。因为平台做得不好,大家就不会去用,而没人用,平台也就一定做不好。更多的开发者在飞天平台上做应用,可以帮助阿里云更专注于平台的建设,根据用户的反馈不断地去优化,而不是将精力放在和开发者相竞争的应用开发上。这样抉择的结果,也让阿里云逐渐走上了良性的发展道路。

图 1:阿里巴巴 CTO、阿里云总裁王坚博士

真正的云计算是以数据为中心的

InfoQ:阿里巴巴的技术比较开放,敢于让技术人员出去分享,作为阿里巴巴集团的 CTO,您如何看待这样的事情?

王坚博士:首先阿里巴巴是一家服务公司,不是软件公司。虽然不同的部门对技术分享这个事情理解还不太一样,开放程度也不同,但是整体上,对技术分享我们是非常支持的。一方面,阿里巴巴的业务大多数是平台性质,拿出去讲也没有什么关系,即使现在我们将飞天的源代码给你,你也不一定能用,在这方面,我们还是很有信心的;另外,这和企业的传统文化也有很大的关系,阿里巴巴是一家好打抱不平的公司,愿意帮助弱小者成长,可以说我们是有分享的基因在里面的。

InfoQ:在 09 年的时候我就看过您关于大数据分析的一些分享,当时很多人还不是很理解,三年过后,这已经是任何一个大公司发展过程中绕不开的话题,您的这些前瞻性的观点从何而来?

王坚博士:我认为我还是蛮有运气的。2006 年我在微软工作的时候,就成立了一个研究数据智能的小组,因为这个原因,当时看了很多和数据相关的东西,这些资料也帮助我去思考。我记得那时候微软的 Office 产品第一次有了收集用户反馈意见的功能,就是弹出一个框,询问你是否参与微软的用户体验改进计划。这也让我第一次认识到互联网对数据的影响,也明白了云计算的基本道理:云计算就是为数据处理而生的,而存放数据(Hosting)只是其中的一小部分。看一家公司的变化,只需要看 Hosting 在其业务中扮演的角色就知道了,我认为 50% 是一个临界点,而阿里巴巴目前已经远超过这个数值。

你可以理解,现在阿里云是一个数据处理公司,不是以计算为中心的,而是以数据为中心的,阿里云也有志成为一家真正的云计算公司。开始的时候很多同事不是很理解数据和处理之间的关系,经常被我搞疯掉,辛辛苦苦做的一个系统,可能很快就被否决掉,后来到了盘古这一层才算通了。所以说,云计算的真正意义还是在数据业务,数据沉淀在哪里就应该在哪里处理,而不是将数据和处理这两件事情分开。

云计算提供的应该是综合性服务

InfoQ:飞天项目的愿景也非常大,这个云计算的平台上包括云 OS,包括内核,也包括存储服务。那么这个平台除了为阿里巴巴内部使用外,对外还提供什么服务?

王坚博士:飞天的架构还是非常大的,这在当时我们开始做飞天的时候,也引起了非常大的争议。很多人说我们做的东西太多了,太大了,不符合现实。这让我当时也非常纠结,但云计算就是一个综合服务,你让客户在这家公司买 Hosting,在那家公司买 CDN,然后再找一家公司做数据处理,他们肯定搞不定。中国网络电视台 / 央视网 CNTV 就是一个很好的例子,就是大多数情况下,你不能只提供一项服务,而是要帮助客户做完整的生意。其实不论是基础设施,还是平台,还是存储,都是天然整合在一起的,云计算的鼻祖亚马逊现在也是沿着这条路走的。

另外,阿里云飞天项目还有一点是需要说明的,就是不论是对外,还是对像天猫、支付宝这样的内部公司,阿里云所提供的基础服务都是一样的,我们并没有为天猫、支付宝单独定制什么功能,从版本升级,到系统兼容性,对内、对外都是一样的。在这次双十一购物狂欢节中,将有超过 20% 的订单是在我们的弹性计算上进行的,这可是每天 1000 万的 PV 量。换句话说,我们能够支撑双十一这样的业务,那么其他的互联网服务我们也是可以做的。

图 2:阿里云飞天•云 OS

InfoQ:目前有没有一些已经接到飞天平台上的案例,他们是如何使用的,或者说飞天是如何帮助他们的?

王坚博士:虽然我们的平台可以支持 Hosting、CDN 和数据处理,但是坦白来说,目前我们的客户主要用的还是 Hosting 的服务,稍大一点的客户会用到负载均衡,但像 InfoQ 这样的传媒行业,可能会用到 CDN 等,能使用到综合性服务的客户并不是很多,但这一定是一个趋势。这儿需要解释一下的是,在阿里云的产品里,并没有 CDN 这一项产品,但是我们是支持这个服务的。

另外,现在我们考虑的是如何让大数据也变成一个服务,这一点也是我们的客户,很多传统的客户教会我们的。基本上来看,Hosting 是一头,数据处理是另外一头,现在 Hosting 占得比例比较大,但总有一天会是大数据。比如我们和 CNTV 的合作,从 ODS(开放架构化数据服务)、RDS(关系型数据库服务)到 CDN 等能用的功能他们全用上了。

还有一个例子,我们有一个客户,做中间件的,开始的时候只是想把中间件从专有的存储设备迁移到我们的云计算平台上,最后发现不仅中间件,其实其工作平台也是可以用在云上的,员工甚至在家里就可以办公了,从而引起了其现有组织的变革,给公司的发展带来的新的机遇。这并不是说我们想做一个什么生态链,而是像福特生产线一样,很多结果都是自然而然到来的。就像电气化一样,电的出现改变了社会,但电网公司顺带也挣了点钱。阿里云也是一样,我们在改变整个生态,顺带也可能挣了点钱。

飞天开放平台不自己做应用

InfoQ:我看了飞天开放平台的一些介绍,也听一些朋友在谈,都认为这是阿里云的一个大动作,请帮助介绍一下飞天开放平台的起因、背景,以及能够解决的问题。

王坚博士:如果说阿里云的开放平台有什么不一样之处,那么这个开放平台的特点就是只关注云计算。整体来说,云计算是分两种的,一种寄生于业务,另外一种相对独立,和业务关系不大。阿里云属于后一种,不寄生于任何业务,也就是任何业务都可以在阿里云上进行。我们希望能够让小公司来做大公司的事情,比如 Teamcola(一家提供工作日志存储的公司),让大公司也可以做小公司的事情,提高效率,比如中软国际等。

对于飞天开放平台,现在只是开始,希望能将能力开放给更多的开发者和公司。其实,在互联网时代,IT 运维是如此地重要,像 Teamcola 这样的小公司,你很难想象如果不将数据放在云平台上,他们怎么成长?要知道现在单单是招聘运维人员就是很困难的,有时候业务的发展就是受自然法则的约束。另外就是很多公司,老的应用太多了,凭自己的技术能力,很难完成迁移,我们计划扶持一些公司来做类似的事情,帮助这些公司完成转变。

再者,飞天开放平台很坚持的一点就是,我们不自己做应用,而是鼓励其他人和公司来做,比如网盘,这样的应用对于一家云计算公司或者开放平台来说是很重要的,因为可以很容易地做出来并形成规模,但阿里云不做。我想这也是飞天开放平台和其他很多云平台不一样的地方吧。

图 3:阿里云飞天开放平台

云计算在中国一定会起来的

InfoQ:对阿里云下一步有什么动作,您心中的规划或者期望是什么?对云计算在国内的发展,您认为下一阶段会有什么新的变化?

王坚博士:中国小而美的公司还是很多的,可能比美国还要多,我想如果将来有一半运行在阿里云上,就差不多了。目前阿里云的成本还是比较高,还不是很符合国内用户的使用习惯,但将来一定是可以降下去的。到那个时候,有更多的小公司起来,自然而然,创业的氛围、互联网的氛围也会越来越好。

从技术上来说,阿里云的系统已经做得很靠前了。我没有做过精确的统计,但是阿里云应该是世界上第二家有能力做多 Master 的公司,这个技术还是很有难度的。所以,近期不会对系统做大的调整,希望能够就系统的易用性、稳定性做些优化。

懂更深的角度来看,要做一个组件或者功能比较容易,难的是将整个系统立起来。这些都是技术问题,不是商业问题。比如让云计算的成本下降,很多人可能认为这是一个商业问题,其实不是,这是要从技术上解决的,如何让系统更省电,更节能等。

云计算在中国一定会起来的,以我们的经验来看,这是一件很难的事情,单是“提供云计算服务”这句话就有很多种定义,而且很多能够提供云计算能力的公司在技术上还有许多的缺陷,需要继续积累。但前景看好。

编辑后记:行文至此,猛然想到在谈论视频业务在国内的发展时,优酷创始人兼 CEO 古永锵说“没有一亿美元,就不要玩视频”。也许这句话套用在云计算平台领域也适用,虽然有些小公司可以提供某一方面的云计算能力,但是要为企业提供全方位的服务并不是那么容易,也许最终只有像阿里巴巴、腾讯、百度、盛大这样的公司才能做到。但对于中国互联网的发展,我们还是乐于看到更多关注云计算的大小公司能够冒出来,提供各种各样的服务,小公司可以专其所长,为客户提供刀片式的核心服务,而大公司可以利用大的优势,为客户提供全套解决方案。正如王坚博士在访谈中所提到的,更多小而美的公司起来的,那么我们的创业氛围、互联网氛围才会越来越好。


给 InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ )或者腾讯微博( @InfoQ )关注我们,并与我们的编辑和其他读者朋友交流。

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2012-11-15 07:494999

评论

发布
暂无评论
发现更多内容

ARTS - week 5

steve_lee

HBase的rowKey设计技巧

五分钟学大数据

HBase 4月日更

手撕83K STAR的Axios设计思想,并进行能力增强

梁龙先森

源码分析 大前端 axios

Vuex整洁架构之道

devpoint

vuex vue架构 mapGetters mapState mapActions

再谈日更公众号

彭宏豪95

写作 感悟 微信公众号 4月日更

Linux rm 命令

一个大红包

4月日更

面向小白使用Git 的手册

程序员海军

git

园区网的网关部署在接入层还是汇聚层 面试官与求职者之间谈话

艺博东

网关 交换机 网络配置

阿里P8架构师分享私用Java学习资料(含视频和项目源码以及面试题)

北游学Java

Java 数据库 分布式 微服务

架构实战营 - 模块 2- 作业

泄矢的呼啦圈

架构实战营

推荐18个 Vue常用组件库

程序员海军

Vue 组件库

Markdown使用语法

Geek_6370d5

markdown语法

Dubbo 学习笔记(二) Spring Boot 整合 Dubbo

U2647

Spring Boot dubbo 4月日更

ffmpeg完美实现解封装操作!

txp

音视频

M2-task

Focused

声网 Agora 初体验

若尘

声网 Agora

Prometheus官方文档Querying[三]function

卓丁

ARTS - week 6

steve_lee

一篇文章带你彻底了解MySQL各种约束

若尘

MySQL 数据库 约束 4月日更

JavaScript 中的执行上下文和执行栈 的理解

程序员海军

JavaScript 大前端 上下文 执行栈

Nginx新增模块more_clear_headers问题记录

风翱

nginx 4月日更

自定义Hadoop的输入格式

小舰

4月日更

安卓开发基础面试题,分享一点面试小经验,含BATJM大厂

欢喜学安卓

android 程序员 面试 移动开发

安卓开发实战讲解!从新手到Flutter架构师,一篇就够!快来收藏!

欢喜学安卓

android 程序员 面试 移动开发

Python OpenCV 图片高斯模糊

梦想橡皮擦

Python OpenCV 4月日更

PI的一种简写。

山@支

一文带你了解如何排查内存泄漏导致的页面卡顿现象

零一

chrome 大前端 浏览器 内存泄露 问题处理

Java检查异常、非检查异常、运行时异常、非运行时异常的区别

Sakura

4月日更

如何高效率的工作

程序员海军

工作效率 提升效率

【签约计划】调查采访能力考核成绩公布

InfoQ写作社区官方

签约计划 热门活动

继续探究:一文理清JVM和GC(下)

比伯

Java 架构 程序人生 计算机 技术宅

云计算就是服务:阿里云总裁王坚博士访谈录_服务革新_霍太稳@极客邦科技_InfoQ精选文章