【AICon】AI 基础设施、LLM运维、大模型训练与推理,一场会议,全方位涵盖! >>> 了解详情
写点什么

陈金培、唐洪:阿里云希望实现谷歌加亚马逊的云服务能力

  • 2012-11-16
  • 本文字数:3711 字

    阅读完需:约 12 分钟

11 月 9 日在杭州举办的阿里云开发者大会,阿里云计算业务总经理陈金培,资深总监唐洪,一同分享了有关飞天开放平台的话题。会后,笔者针对阿里云平台、阿里云开放的目标、阿里云云服务的提供方式以及对云计算在国内外发展的现状进行了提问,以下是访谈的详细内容:

InfoQ:云计算平台也可以看作是开放的平台,这种开放平台与我们通常所说的开放平台有什么不同?

唐洪:阿里云致力于最基本的服务,如博士所说,我们有自己的 OSS,也可以叫云存储,大多数人都认为云存储是网盘,这个东西我们绝对不会做。所以在另外一个基础上,因为我们只做架构最底层的东西。从开放的程度上来讲,可能我们平台上承载的东西会更多。

陈金培:其实开放有不同层次的开放,包括腾讯的开放平台,淘宝有开放平台,阿里云也是一个开放平台。腾讯和淘宝是业务平台的开放,意味着可能用户要到它那里去。开放平台,开放出来就是两个东西,一个是用户,一个是数据。用户平台和数据平台,无论是淘宝的开放平台,还是腾讯开放平台,都是这个层次的平台。阿里云开放平台开放的是 IT 的技术平台。开放的是计算能力,让所有人都可以很方便的进行获取,这是在不同的领域和层次的开放。

InfoQ:通过开放,阿里云能够获得什么?

陈金培:我们想把云计算,把传统 IT 服务,传统 IT 基础设施变成一个公共服务。很多人要部署应用和业务系统,就会自己去买服务器。今天部署应用,如果需要同样资源计算能力,直接在网站上操作就可以,这就是云计算要做的事情。对阿里云来讲,云计算未来会颠覆整个 IT 产业链。如果云计算会成长,阿里云会是一个十几年前的 IBM,就是在一个产业里面提供最为庞大基础服务的一家公司。

唐洪:我觉得阿里云之所以会接入云计算,有一定偶然性。云计算背后的技术其实就是大规模计算、存储的能力。一开始阿里巴巴集团做电子商务,最后发现做来做去,发现将来一定需要这么一个东西,有足够多的能力,在足够短时间,把所有交易数据、货物数据提出来,然后可以跑起来。

云计算背后所需要的技术,也正是阿里巴巴把这个平台继续做下去的一个共用的东西。碰巧我们做这个技术的时候,我们需要有一个业务出口,这个方面就是云计算。

InfoQ:你们眼中的云计算现在发展的现状是什么样?比如说国内发展到什么程度?国际的像亚马逊是什么程度?国际和国内的水平还有多大差距?

陈金培:我觉得中国云计算应该是处在刚刚起步阶段,今年是中国云计算实践的元年。早一年之前,可能大部分中国的人听说云计算,都觉得那还在一个概念里面,是一个很虚的东西。经过这几年,阿里云把中国的云计算变成一项实实在在的服务,上面跑那么多应用和客户。

我觉得跟国外相比差距还是非常大的,我觉得有两个层面:

第一,用户对于云计算接受的程度处在两个不同的时间上,比如像美国亚马逊推出也六年时间,中国也就一年左右的时间。用户的认知和习惯的教育都还处在比较初级的阶段。这是一个差距,这个差距是需要通过时间去弥补的。

第二,在服务完整性上面,阿里云跟亚马逊还是会有一些差异的,当用户越来越多,满足的需求也会更多。我们觉得今天阿里云服务这个阶段已经可以满足客户需求。我自己觉得如果从技术平台角度讲,跟谷歌、亚马逊的差距,那是很小的。更多体现在用户的认知和服务完整度上面。

唐洪:大家对云计算的认识美国比中国成熟,在美国有三个比较成型的,大家都认为生态里面三根柱子,亚马逊、微软、谷歌。谷歌更偏向内部技术,在公共云计算上面,有点犹抱琵琶半遮面。中国的话,阿里云算走得早,但不能说已经是一个参天大树,所以今天这个状况是绝对不像美国,美国相当于最顶层就是这三家。

另外客户对云计算的信赖程度,在美国有大公司完全把它大部分的架构搭云服务上面。在中国,基本上我们服务的对象还是偏向于中小企业,到底云计算行不行?大家还是有问号的。对于中小型企业,云计算是一个刚性需求。因为中国 IT 人才不像美国那么容易找,他们找到一个合适的 IT 人才能够帮他们维护一个网站,这是一个非常难的事情。所以,如果产品做的不错,想把流量弄上去,要把客户保住的话,如果我们能做好,我们可以帮到他们的。

在美国,带宽条件比中国好,监管条件比中国好。中国需要大环境配合,才可以做下去。从技术角度讲,最关键是我们怎么能够满足用户的需求,我们的质量能够让他们满意,其实只是这个要求而已。

InfoQ:我了解到阿里云是希望实现谷歌加亚马逊的云服务能力,并且有所超越,是现在中国是最大的计算能力的公司,怎么理解最大计算能力?这种公司具备哪些条件?阿里云有什么计划,或者能力做这个公司?

唐洪:首先讲谷歌加亚马逊,并且有所超越。谷歌加亚马逊,我们做的飞天开放平台就两个设计目标,一个是用同一个系统架构,来支持尽量多的离线和在线服务。其实谷歌对外推出的这些服务都是在它同一个系统架构上做的,这点跟谷歌有点像。

另外,我们推出的服务都是通过公共服务的方式,这个恰好也是跟亚马逊有点像,所以这是所谓谷歌加亚亚马逊。有所超越是说今天向亚马逊提供的各种服务,我个人感觉相对一些底层卖资源的服务,对他来说,资源最多的是 S3。这肯定是第一步我们必然要做的事情,对入门级客户来说,是最容易接受的。

有所超越,是以数据为中心的云计算,所以我们很强调数据。回到刚才的话题,我们为什么做云计算?希望解决数据处理的能力,云计算可以帮助我们沉淀这种数据处理能力。亚马逊在虚拟机里面跑开元的 Mapreduce,这个没有办法做到很大规模。跟其他人讨论,一般到几十台规模。我们想做的是,是希望把这种上千台服务器构成一个大规模离线数据处理的能力,当成一个公共服务存储系统。比如我们有一个服务叫 ODPS,就是做这样的东西。到现在为止,在业界还没有像这样大规模计算和数据处理的公共服务。所以在某种程度上,很有可能到明年,我们推出来的产品线上,可以尝试去做一些谷歌、亚马逊都没有做的事情,至少在某点上就是有所超越的地方。

计算量最大的公司,就是能反映出我们对云计算的理解。我们想做计算机最多的公司,因为最后云计算之所以能成是一个双赢的机制。就是在生态区上能省钱,真正做到这点,要注重挖效率,要提高计算能力,但不是靠硬生生对计算提出来的。做同样事情,我们可以用更巧的方式来做,这样我们相当于算的更快一点,处理速度更高一点。

InfoQ:前端时间国外亚马逊、谷歌、苹果接二连三当机,频度比已经高了。在预防当机方面,阿里云是做哪些准备?

唐洪:云计算一个特征就是同一个平台承载很多客户,从某种意义上像飞机一样,每次有个飞机掉下来,一定是头条新闻。但是他们从来不知道,车祸死掉的人要多很多,因为它是一个突然间大家都聚在一起的现象。大家会很敏感云计算,云计算不是万能的,它的规模很大,上面承载应用也很多,系统复杂性会很大,出错概率一定会有的。虽然说谷歌有世界上最聪明的工程师,他再严谨,它的复杂度也会严谨是十倍。它是一个客观的存在,不可能降到零。

因为每次影响的人太多,所以大家会觉得这个是不是有点担心。从可用性方面来考虑,可能比自己运维还要高,我们也是这个态度,我们仍然相信可能有偶然的一次两次的问题。但是我们相信今天我们能够给客户带来的价值,除非他有很强的 IT 和 TPA,比做一个网站要可靠。

包括最近大家知道我们机房也发生一次故障,我们每次都从根源开始把每个可以提高的地方去改进。基本原则就是,犯错误没有关系,但是我们怕犯同样的错。这样的话,每次梳理会把犯错可能性很快的降下来。并不能说我们今天能够做到永远不发生问题,但是我相信我们是能够给绝大多数客户提供更好品质的服务。

InfoQ:从您角度来看,目前阿里云拉落地的情况,包括合作客户的情况,认为比较成功的能不能分享两三个案例。

陈金培:其实今天阿里云这种案例是蛮多的,在我的电脑里面,起码能找出上百个。我们今天基本上有这样四种类型的客户是我们比较典型的:

第一,移动互联网客户,像唱吧、CAMONE360,他们今天都是跑在阿里云平台上面,为它提供整个 IT 支撑。

第二,传统互联网,今年奥运会的转播,就是 CNTV,体育频道的转播,都是建在阿里云平台上面,如果没有阿里云平台,他原来架构很难应对爆炸性增长。有很多游戏公司,游戏公司对计算弹性的能力要求比较够,因为一款游戏上线,大家不知道今天会好还是不好,所以不可能把所有服务器先买好。所以全部建在阿里云平台上。比如说网页的游戏,有一家公司是 iOS AppStore 在美国区应用里面收入最高的,它今天的游戏也都部署在阿里云平台上面。

第三,传统软件公司。原来它的软件都是给一个一个盒装卖给别人,这种方式会带来很多挑战。像传统的一些行业 ERP 厂商,把他们平台移植到阿里云平台上面,从卖盒装软件,转型到卖软件服务。

第四,行业本身需要一些创新的应用去驱动业务继续的升级,像我刚才举的消费电子。还有物联网,物联网云计算,有一家公司叫施耐德,是全球最大能源管理供应商,它不光做电器,还有电表。家里的电表每两个月都会有人上门抄表,未来用他们的电表,电表会跟互联网接上,家里面的硬件数据会实时传入施耐德数据中心。这个数据是非常庞大的,物联网实时传回的数据的庞大,它今天也只能把数据存到阿里云大规模存储里面,然后利用处理能力,就有机会把能源管理变成一种服务。

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2012-11-16 00:282343
用户头像

发布了 156 篇内容, 共 49.7 次阅读, 收获喜欢 7 次。

关注

评论

发布
暂无评论
发现更多内容

校友资料登记平台小程序开发笔记二-云数据库设计

CC同学

校友录小程序 校友资料小程序

看焱融云CSI动态感知如何扩展Kubernetes Scheduler

焱融科技

云计算 技术 云原生 高性能 分布式存储

带你了解WDR-GaussDB(DWS) 的性能监测报告

华为云开发者联盟

数据库 数据 GaussDB(DWS) WDR 负荷诊断报告

一周信创舆情观察(7.12~7.18)

统小信uos

详解API Gateway流控实现,揭开ROMA平台高性能秒级流控的技术细节

华为云开发者联盟

华为 ROMA 集成平台 ROMA Connect API Gateway

ZooKeeper 分布式锁 Curator 源码 04:分布式信号量和互斥锁

程序员小航

Java zookeeper 源码 分布式锁 zookeeper分布式锁

去中心化薄饼交易所开发|PancakeSwap去中心化交易所搭建方案

Geek_23f0c3

交易所开发 去中心化交易所系统开发 PancakeSwap交易所

密码学系列之:Merkle–Damgård结构和长度延展攻击

程序那些事

加密解密 密码学 程序那些事

Spark 开源新特性:Catalyst 优化流程裁剪

华为云开发者联盟

sql spark 开源 Catalyst 优化器

WorkPlus高端制造业数字化解决方案—长江存储

WorkPlus

开源 企业 解决方案 即时通讯 私有云

校友资料登记平台小程序开发笔记一-系统整体设计

CC同学

校友登记小程序 校友资料小程序

WorkPlus高端制造业数字化解决方案—航天科工

WorkPlus

开源 移动 解决方案 即时通讯 私有云

哪类技术助力了隐私计算的工业化?如何“组装”发挥更大价值?

开跑!Mobileye自动驾驶汽车路测落地纽约

E科讯

作为Android开发程序员,已获千赞

欢喜学安卓

android 程序员 面试 移动开发

抖音快手seo获客系统开发(可贴牌)

获客I3O6O643Z97

抖音霸屏

价值连城 知名深度强化学习Pieter Abbeel的采访 John 易筋 ARTS 打卡 Week 56

John(易筋)

ARTS 打卡计划

EasyRecovery软件帮你快速恢复图片数据

淋雨

EasyRecovery 文件恢复 硬盘数据恢复

王者荣耀商城异地多活架构设计

chenmin

Vue进阶(五十八):ES字符串操作:遍历、比较、截取、补全...

No Silver Bullet

Vue ES 字符串 7月日更

携手生态伙伴亮相InfoComm,英特尔赋能智能协作办公

E科讯

Vue进阶(五十七):ES数组操作:find(), findIndex(), filter(), forEach(), some(), every(), map(), reduce()

No Silver Bullet

Vue ES 7月日更 数组操作

手写Spring框架,是时候撸个AOP与Bean生命周期融合了!

小傅哥

Java spring 小傅哥 aop 代理

Java的这个强大功能,很多人都不知道

华为云开发者联盟

Java c++ jdk 算法 jni

Rust从0到1-面向对象编程-设计模式

rust 设计模式 面向对象编程 状态模式 state pattern

Python OpenCV 图像的 最近邻插值 与 双线性插值算法 优化迭代

梦想橡皮擦

Python 7月日更

经典好文!BAT大厂Android面试真题锦集干货整理

欢喜学安卓

android 程序员 面试 移动开发

腾讯T3大牛手把手教你!三面腾讯,已拿offer

欢喜学安卓

android 程序员 面试 移动开发

Discourse 的标签(Tag)只能是小写的原因

HoneyMoose

测试开发之系统篇-安装KVM虚拟机

禅道项目管理

虚拟机 测试开发

Cassandra的调优总结

林一

分布式数据库 Cassandra

陈金培、唐洪:阿里云希望实现谷歌加亚马逊的云服务能力_服务革新_贾国清_InfoQ精选文章