阿里、蚂蚁、晟腾、中科加禾精彩分享 AI 基础设施洞见,现购票可享受 9 折优惠 |AICon 了解详情
写点什么

专访:UCloud 季昕华谈网络存储的局限性、SDN 在云上的七大应用场景、以及为什么 OpenStack 还不适合做公有云

  • 2013-12-17
  • 本文字数:4787 字

    阅读完需:约 16 分钟

2013 年 12 月 11 日,UCloud 正式宣布已经将盛科的硬件 SDN 交换机应用在自己的线上公有云环境中。UCloud CEO 季昕华在发布会中介绍了 SDN 在其公有云上满足的七个用户需求,并表示这是世界上第一款 SDN 硬件交换机在云计算中的应用。

InfoQ 中文站对季昕华进行了专访,谈论了对公有云营收的观点、网络存储应用在关键业务上的局限性、SDN 的应用场景、在应用商店方面的尝试、以及为什么 UCloud 不担心 OpenStack 在公有云上的竞争。盛科软件总监张卫峰对 SDN 的技术实现方面进行了补充介绍。

InfoQ:上周你也去了金山云的发布会,那天王育林有一个观点是只有大公司才能做公有云,原因之一就是 IaaS 的高成本。你也看到了他们的规模,单是存储就要有上亿的成本。但是你之前在 4 月份也提到过你的观点,就是利用跟 IDC 厂商、服务器厂商合作的方式,解决了重资产、高投入的问题,同时利用私有云获取更多短期收入。现在到了 2013 年底,你感觉这条道路是否能走得通?是否做到收支平衡?成本开支最大的几块是哪些,它们的比重是多少?服务器和其他硬件设备自己采购的和厂商合作提供的比例是多少?

季昕华:做公有云有三大门槛:资金门槛,运营门槛,以及技术门槛。比如 Amazon,是资金、技术、运营能力三者皆有,所以做起来了。微软的 Azure,有资金、有技术,但是因为运营偏弱,所以一直动静不大。

在三个门槛中,技术和运营更为关键,因为技术和运营需要长期的积累,而且是大型云平台实战的经验积累,在目前的国内外环境都不缺资金,大批的风投手中拿着大量的资金在找好的云计算公司。相反有资金也不一定做得好,为什么这么说?因为当你资源充足的时候,你可能会想通过资金解决问题,而不是靠技术来解决,比如用比较昂贵的存储设备等等,而这其实不是做云的正确道路,这时候你那充足的资源反而成了制约你长期发展的瓶颈。

对于收支平衡这块,目前我们还不是很在意。我把云计算的发展分为三个阶段:

  1. 替换服务器和 IDC 的阶段。这是一个用批发 + 虚拟化模式取代零售模式的阶段,利润相对不高。
  2. 取代软件公司和软件渠道阶段。当云计算成为软件渠道中心的时候,云计算公司自研和代理的软件利润就比较高了。
  3. 取代集成公司、咨询公司的阶段。在这个阶段,以前做集成、咨询的公司要么转而做云计算服务的集成和咨询,要么就被淘汰。

现在的美国云计算市场已经在第二个阶段,市场特征已经相当明显。比如 AWS 有了 RDS 服务之后,很多企业就不再会采购 Oracle 或者 IBM 的数据库了,因为 RDS 已经足够成熟。

中国的云计算市场现在还处在第一个阶段,当然我们 UCloud 也是,这个阶段主要靠规模化取胜,通过规模化来降低成本,提高利润率,更大的利润是在进入第二阶段之 后。

目前的成本方面,人员研发投入的比重最大,大概在四成多;网络和服务器设备方面的投入其次,在三成多;剩下的三成则用于销售、市场、技术支持方面。其中,服务器和其他硬件设备目前主要仍然是通过合作提供的,包括分成模式和租赁模式。未来肯定会更多的购入自己的服务器以实现更高的利润。

InfoQ:我注意到你们给客户提供了非常好的服务支持,比如,每一个注册用户都会打电话沟通需求,这是你们的一个亮点,在业界也有非常好的口碑。你们支持的成本和投入怎么样?

季昕华:设立专门的售前客户服务,给每一个注册用户打电话沟通,主要出于两点考虑:第一点是为了更多的了解用户需求,避免他们进行不合理的配置,浪费了资源;第二点则是用于做客户的筛选,因为我们目前主要还是以服务企业客户,尤其是游戏行业的企业客户为主。我们希望给这些客户创造一个干净、专业的环境,所以我们会做相应的过滤。

InfoQ:你们的 UDisk 产品推出一年多了,还处于测试试用阶段。请问,由于 UDisk 的弹性和分布式的特性,比如提升高冗余,如果我有重要的业务希望我的 VM 上的数据全部放在 UDisk 上,是否推荐我这么做?IOPS 和吞吐量是多少?SLA 是多少?是如何保证的?

季昕华:重要的业务要看场景。如果是 IO 高的业务则不推荐放在 UDisk 上,这是网络存储的实现所决定的,包括 AWS EBS、阿里云,IO 普遍都是 30~40Mbps,对于此类业务普遍无法支持的很好。目前我们正在研发类似高 IO 的 EBS 的细分产品,希望未来可以解决这个问题。

对于非高 IO 类型的重要业务,都是可以放的。

UDisk 的可用性是 3 个 9,因为网络有很多不确定性。可靠性方面则是 11 个 9,我们对 UDisk 的冗余机制很有信心。

InfoQ:本次跟盛科合作推出的 SDN,什么时候能用上?SDN 的核心用了哪些开源组件,自研了哪些组件?盛科提供了哪些技术?SDN 底层是否使用了万兆交换机?SDN 用于哪些应用场景,用户如何受益?

季昕华:跟盛科合作是从一年多前开始,具体投产的话,硬件 SDN 交换机其实从今年 7 月就开始用了,经历了几个试点客户测试、反馈、改进的周期,完成了逐步迁移、灰度变更,目前已经在全国四个机房完成了全面部署。

具体技术上的合作,我们主要做控制端的开发,其他都是盛科做的,万兆交换机有部分用到,主要仍是千兆交换机。详细的情况卫峰可以做一下补充。

张卫峰:我们负责数据转发面的工作,主要从这几方面做了创新和优化。

  1. 将 OVS 流表查找 offload 到 TOR 交换机,节省服务器 CPU 资源,提升查找性能
  2. 将 GRE tunnel 的封装、解封装 offload 到 TOR 交换机,让网卡仍然可以对 TCP 报文进行分片加速,大大提升网络性能
  3. 所有流表全部是 proactive 预先配置,有效减少未知报文广播和流表学习所带来的性能问题

后续还会继续做的,包括

  1. 将 L3 gateway 从一个集中的网络节点 offload 到 TOR 交换机
  2. 在 TOR 交换机上启用 ARP 代理,避免 ARP 广播

通过这些措施最终达到的目的是,将网络处理的部分工作从服务器移到 TOR 交换机,让服务器可以专注于计算,带宽损耗可以降低,CPU 负载降低,一台物理服务器可以容纳更多虚机,帮云服务提供商降低成本,提升用户体验。

同时,由于 GRE tunnel 封装放在了 TOR 交换机上,TOR 交换机可以直接看到用户数据,可以对用户数据进行统计,限速等策略应用,解决了纯软件方式带来的网络可视化问题,有助于云服务提供商对网络进行诊断和管理。

对于最终用户来说,他们看不到 SDN,但是这并不代表他们没有享受到 SDN 带给他们的好处。公有云平台的用户希望是可以进行自助服务的(self-service),他们自己创建虚机,自己创建虚拟网络,自己创建虚拟路由器,自己创建防火墙等等,谁在底层支撑着这些动作的顺利执行?是 SDN 架构。没有 SDN,就没有这一切。SDN 的最高境界就是用户在享受着 SDN 带来的便利但却并没有意识到自己使用了 SDN。

季昕华:SDN 的应用场景和用户收益的方面,刚才在发布会中也讲到过。SDN 更多是一种隐藏的特性,不是作为独立的服务提供的,但我们的 VPN 产品、安全产品、广播服务、混合云的实现,都是基于 SDN 来实现的;同时有了 SDN 之后,我们的自动化、隔离、物理机与虚拟机混合管理的方案也更加完善、更加智能、性能更高。对具体细节感兴趣的朋友可以查看这篇新闻

InfoQ:目前,Uhost、UDisk、UDB、ULB、UScan 这几个方面的研发,各自需要投入多少人?图片存储跟又拍云合作,CDN 跟网宿合作,测试方面与云测合作,域名解析与 DNSpod 合作,广播服务跟极光推送合作,这几块服务是否也需要投入研发人员,还是只留下一些客服人员即可?

季昕华:目前全公司总共 80 多位员工,其中技术研发占据一半以上。

合作方面其实都是轻度整合,包括 SSO 的打通、界面整合之类的,并不会涉及到很多研发工作,而且客户反馈也是转给合作伙伴去做的。我们主要是做好运营,以及协助合作伙伴做好客服工作。

InfoQ:我看到 UCloud 上现在提供了网店系统这个应用级服务,这是跟 shopex 的试点合作吧,现在的用户量多少?

季昕华:这是我们的一个试点项目,主要是想尝试软件渠道中心的思路,从目前来看,这样的合作,对用户来说还是非常方便的,后续还会继续扩大,但目前我们的核心还是在游戏行业。

InfoQ:您对于 2014 年 UCloud 的技术投入方面有哪些规划?未来还计划推出哪些服务?对于云平台提供应用这事未来是如何规划的,是否会推出类 AWS marketplace 的产品?又是否考虑 PaaS?

季昕华:我们的核心主要还是两块:一个是聚焦我们行业客户的需求开发功能,在我们来说主要是游戏行业的客户;第二个还是我们自身产品的稳定性。

应用超市是可能会做的,可能做成一个用户自己提交应用的平台,然后可以像现在那个网店系统一样购买使用,但这个并没有具体的计划。

PaaS 也是一样,如果有客户需求的话,我们会优先考虑找一个合作伙伴来一起做,而不会自己上。

InfoQ:在底层技术提升、将技术更好的产品化、为产品寻找更好的商品化道路、发展合作伙伴、发展客户这几项工作当中,您认为哪项是当前的您最为关注的?您和莫显峰、华琨现在是如何分工的?

季昕华:莫显峰是我们的 CTO,负责技术这块;华琨主要负责销售和售后;我吗,就是做各种杂事儿的。

合作伙伴这块我沟通的比较多。关于产品反馈和合作伙伴沟通这一块,我们是这样一个流程:首先,华琨那边是负责跟用户沟通的,他那里收集到的反馈或需求会反馈给团队,看看这些需求中哪些是我们现在的产品无法满足的;我们很注重生态链的合作,会先去看这个需求有没有市场上成熟的产品可以满足的?如果已经有了,我们就不做了,跟这个成熟的产品供应方建立合作伙伴关系,将其引进到我们的平台;如果没有的话,就交给莫显峰去研发。

InfoQ:最后一个问题,担心 OpenStack 在公有云领域的竞争吗?

季昕华:由于有一系列大公司的支持,加上 OpenStack 本身的架构设计的非常不错,OpenStack 最近几年社区很活跃,发展也非常快速,为云计算的落地推广起到了很大的作用。不过从我们来看,我们不担心 OpenStack 在公有云领域的竞争。我认为 OpenStack 目前更适合做私有云,不适合做公有云。原因有三点:

1、目前全世界没有特别成功的 OpenStack 公有云案例。

我们看到 AWS、Google、Windows Azure、阿里云和我们 UCloud 都是用自己研发的产品体系,而使用 OpenStack 进行大规模部署的我了解到的只有 HP Cloud,但 HP Cloud 目前还在早期发展阶段。

有人可能会说 RackSpace 也是使用了 OpenStack 的,但实际上我们看到的信息是 OpenStack 中的存储部分是 RackSpace 提供的,但并不表示 Rackspace 是用 OpenStack 的。

2、OpenStack 是一个软件,不是服务,而公有云是服务。

OpenStack 一出来,好像大家忽然觉得是个人都可以做公有云了。但实际上,做公有云,只有一个软件是不行的,你还需要强大的运营来做支撑。

做过互联网运营的人都知道,看到的功能只是互联网产品里面的 20%,还有 80% 是用户看不到的,但是运营很需要的功能,比如多帐号体系,计费体系,安全体系、后台的自动化管理、灰度发布、扩容等等。

3、与开源项目协调的问题。

假设你将 OpenStack 放到公有云上跑起来了,这时候用户跟你说有一个需求,这个需求是 OpenStack 现有的功能无法解决的,那你要不要去开发这样一个功能?开发了之后,你是要提交给社区,还是自己留着呢?

如果你提交了这个功能,社区又接受了,那么你就把你辛苦建立的竞争优势拱手让人了。

如果你提交了功能,但是社区不接受;或者你不提交这个功能,那么你将面临升级、维护难的问题。将你自己研发的功能,跟社区发布的新版 OpenStack 进行融合,会是非常困难的事情,而这个难度会随着时间推移而越来越严重。

而如果是自己研发,就可以做到灰度发布,完全在自己掌握当中。AWS、RackSpace、微软、阿里云、腾讯云、我们 UCloud,都是这样运作的。

嘉宾简介

季昕华( @benjurry ),Ucloud.cn 创始人,CEO。前盛大云 CEO,曾任盛大在线首席安全官、腾讯公司安全中心副总经理、华为研发经理等职位。

张卫峰( @盛科张卫峰),盛科网络软件总监,数据通信和芯片设计领域资深专家,有十几年的网络实践经验,对 SDN、传统二三层交换机、数据传输设备(PTN 和 IPRAN),从管理面到协议控制面一直到芯片转发面,都有着深刻的理解。

公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2013-12-17 00:063383

评论

发布
暂无评论
发现更多内容

E往无前 | 日志成本下降25%+!腾讯云大数据ES Lucene压缩编码深度优化大揭秘

腾讯云大数据

ES

赋能自然语言处理的强大模型

百度开发者中心

nlp 大模型

“数字创新产品课程” 2024年1月20-21日 · CSPO认证周末班【提前报名特惠】CST导师亲授

ShineScrum捷行

情感语音识别:挑战与未来发展方向

来自四九城儿

大宗商品贸易集团数据治理实践,夯实数字基座 | 数字化标杆

袋鼠云数栈

数字化转型 数据治理 数据资产 数据开发 大宗贸易

汇总 | 一文了解常用的 NFT 数据分析平台

NFT Research

NFT 数据分析平台 NFT\ NFTScan

人工智能 | 知识图谱引领精准测试:人工智能在软件测试的新风向

测吧(北京)科技有限公司

测试

OpenHarmony之NAPI框架介绍

OpenHarmony开发者

Open Harmony

全国独家线下面授 | 上海大规模敏捷LeSS认证2024年3月14-16日开班

ShineScrum捷行

人工智能 | 智能化升级:测试用例变更与新老版本Diff分析

测吧(北京)科技有限公司

测试

让数据库运维审计安全无死角

尚思卓越

数据库 运维审计

软件测试 |人工智能在软件测试中的崭新应用

测吧(北京)科技有限公司

测试

ITSS会议周丨新华三参编运维国标发布,探索技术服务发展新路径

Geek_2d6073

戳穿人工智能的六个谎言:辨别真伪

这我可不懂

人工智能 AI

大模型时代的智能运维与部署

百度开发者中心

人工智能 nlp 大模型 LLM

引领Transformer时代的新型大模型架构

百度开发者中心

大模型 LLM

使用 Pinia 的五个技巧

高端章鱼哥

Pinia

糟糕!试用期被裁了

王磊

Java

基于 Flink SQL 和 Paimon 构建流式湖仓新方案

阿里云大数据AI技术

人工智能的历史演进:从专家系统到机器学习的蜕变

测吧(北京)科技有限公司

测试

选择云服务器的五大考虑因素:性能、成本与安全性

一只扑棱蛾子

云服务器

Curve v2.7 发布:支持 Hadoop SDK,助力大数据存储降本提效背景

OpenCurve

开源 文件存储 分布式存储 块存储

WonderPen妙笔 for Mac:优雅高效,写作利器一触即发

晴雯哥

HarmonyOS属性动画开发示例(ArkTS)

HarmonyOS开发者

HarmonyOS

软件测试/测试开发/人工智能丨从面试屡遭失败,到年薪28w

测试人

人工智能 软件测试

Authing 入选《 2023 年央国企信创应用与实践研究报告》优秀服务商

Authing

Idaas Authing 第一新声

人工智能测试演进:测试覆盖度分析技术的巅峰

测吧(北京)科技有限公司

测试

BatchOutput PDF for Mac(PDF批量处理软件) 3.0.6永久激活版

mac

苹果mac Windows软件 BatchOutput PDF PDF批量处理软件

ArcGraph 缓存的设计与应用实践丨技术解读

Fabarta

AI 图数据库 数据库缓存 AI基础设施

人工智能测试新篇章:有限状态机与知识图谱的融合

测吧(北京)科技有限公司

测试

软件测试/测试开发/人工智能丨知识图谱实现精准测试效果

测试人

人工智能 软件测试

专访:UCloud季昕华谈网络存储的局限性、SDN在云上的七大应用场景、以及为什么OpenStack还不适合做公有云_服务革新_sai_InfoQ精选文章