阿里云「飞天发布时刻」2024来啦!新产品、新特性、新能力、新方案,等你来探~ 了解详情
写点什么

专访:UCloud 季昕华谈网络存储的局限性、SDN 在云上的七大应用场景、以及为什么 OpenStack 还不适合做公有云

  • 2013-12-17
  • 本文字数:4787 字

    阅读完需:约 16 分钟

2013 年 12 月 11 日,UCloud 正式宣布已经将盛科的硬件 SDN 交换机应用在自己的线上公有云环境中。UCloud CEO 季昕华在发布会中介绍了 SDN 在其公有云上满足的七个用户需求,并表示这是世界上第一款 SDN 硬件交换机在云计算中的应用。

InfoQ 中文站对季昕华进行了专访,谈论了对公有云营收的观点、网络存储应用在关键业务上的局限性、SDN 的应用场景、在应用商店方面的尝试、以及为什么 UCloud 不担心 OpenStack 在公有云上的竞争。盛科软件总监张卫峰对 SDN 的技术实现方面进行了补充介绍。

InfoQ:上周你也去了金山云的发布会,那天王育林有一个观点是只有大公司才能做公有云,原因之一就是 IaaS 的高成本。你也看到了他们的规模,单是存储就要有上亿的成本。但是你之前在 4 月份也提到过你的观点,就是利用跟 IDC 厂商、服务器厂商合作的方式,解决了重资产、高投入的问题,同时利用私有云获取更多短期收入。现在到了 2013 年底,你感觉这条道路是否能走得通?是否做到收支平衡?成本开支最大的几块是哪些,它们的比重是多少?服务器和其他硬件设备自己采购的和厂商合作提供的比例是多少?

季昕华:做公有云有三大门槛:资金门槛,运营门槛,以及技术门槛。比如 Amazon,是资金、技术、运营能力三者皆有,所以做起来了。微软的 Azure,有资金、有技术,但是因为运营偏弱,所以一直动静不大。

在三个门槛中,技术和运营更为关键,因为技术和运营需要长期的积累,而且是大型云平台实战的经验积累,在目前的国内外环境都不缺资金,大批的风投手中拿着大量的资金在找好的云计算公司。相反有资金也不一定做得好,为什么这么说?因为当你资源充足的时候,你可能会想通过资金解决问题,而不是靠技术来解决,比如用比较昂贵的存储设备等等,而这其实不是做云的正确道路,这时候你那充足的资源反而成了制约你长期发展的瓶颈。

对于收支平衡这块,目前我们还不是很在意。我把云计算的发展分为三个阶段:

  1. 替换服务器和 IDC 的阶段。这是一个用批发 + 虚拟化模式取代零售模式的阶段,利润相对不高。
  2. 取代软件公司和软件渠道阶段。当云计算成为软件渠道中心的时候,云计算公司自研和代理的软件利润就比较高了。
  3. 取代集成公司、咨询公司的阶段。在这个阶段,以前做集成、咨询的公司要么转而做云计算服务的集成和咨询,要么就被淘汰。

现在的美国云计算市场已经在第二个阶段,市场特征已经相当明显。比如 AWS 有了 RDS 服务之后,很多企业就不再会采购 Oracle 或者 IBM 的数据库了,因为 RDS 已经足够成熟。

中国的云计算市场现在还处在第一个阶段,当然我们 UCloud 也是,这个阶段主要靠规模化取胜,通过规模化来降低成本,提高利润率,更大的利润是在进入第二阶段之 后。

目前的成本方面,人员研发投入的比重最大,大概在四成多;网络和服务器设备方面的投入其次,在三成多;剩下的三成则用于销售、市场、技术支持方面。其中,服务器和其他硬件设备目前主要仍然是通过合作提供的,包括分成模式和租赁模式。未来肯定会更多的购入自己的服务器以实现更高的利润。

InfoQ:我注意到你们给客户提供了非常好的服务支持,比如,每一个注册用户都会打电话沟通需求,这是你们的一个亮点,在业界也有非常好的口碑。你们支持的成本和投入怎么样?

季昕华:设立专门的售前客户服务,给每一个注册用户打电话沟通,主要出于两点考虑:第一点是为了更多的了解用户需求,避免他们进行不合理的配置,浪费了资源;第二点则是用于做客户的筛选,因为我们目前主要还是以服务企业客户,尤其是游戏行业的企业客户为主。我们希望给这些客户创造一个干净、专业的环境,所以我们会做相应的过滤。

InfoQ:你们的 UDisk 产品推出一年多了,还处于测试试用阶段。请问,由于 UDisk 的弹性和分布式的特性,比如提升高冗余,如果我有重要的业务希望我的 VM 上的数据全部放在 UDisk 上,是否推荐我这么做?IOPS 和吞吐量是多少?SLA 是多少?是如何保证的?

季昕华:重要的业务要看场景。如果是 IO 高的业务则不推荐放在 UDisk 上,这是网络存储的实现所决定的,包括 AWS EBS、阿里云,IO 普遍都是 30~40Mbps,对于此类业务普遍无法支持的很好。目前我们正在研发类似高 IO 的 EBS 的细分产品,希望未来可以解决这个问题。

对于非高 IO 类型的重要业务,都是可以放的。

UDisk 的可用性是 3 个 9,因为网络有很多不确定性。可靠性方面则是 11 个 9,我们对 UDisk 的冗余机制很有信心。

InfoQ:本次跟盛科合作推出的 SDN,什么时候能用上?SDN 的核心用了哪些开源组件,自研了哪些组件?盛科提供了哪些技术?SDN 底层是否使用了万兆交换机?SDN 用于哪些应用场景,用户如何受益?

季昕华:跟盛科合作是从一年多前开始,具体投产的话,硬件 SDN 交换机其实从今年 7 月就开始用了,经历了几个试点客户测试、反馈、改进的周期,完成了逐步迁移、灰度变更,目前已经在全国四个机房完成了全面部署。

具体技术上的合作,我们主要做控制端的开发,其他都是盛科做的,万兆交换机有部分用到,主要仍是千兆交换机。详细的情况卫峰可以做一下补充。

张卫峰:我们负责数据转发面的工作,主要从这几方面做了创新和优化。

  1. 将 OVS 流表查找 offload 到 TOR 交换机,节省服务器 CPU 资源,提升查找性能
  2. 将 GRE tunnel 的封装、解封装 offload 到 TOR 交换机,让网卡仍然可以对 TCP 报文进行分片加速,大大提升网络性能
  3. 所有流表全部是 proactive 预先配置,有效减少未知报文广播和流表学习所带来的性能问题

后续还会继续做的,包括

  1. 将 L3 gateway 从一个集中的网络节点 offload 到 TOR 交换机
  2. 在 TOR 交换机上启用 ARP 代理,避免 ARP 广播

通过这些措施最终达到的目的是,将网络处理的部分工作从服务器移到 TOR 交换机,让服务器可以专注于计算,带宽损耗可以降低,CPU 负载降低,一台物理服务器可以容纳更多虚机,帮云服务提供商降低成本,提升用户体验。

同时,由于 GRE tunnel 封装放在了 TOR 交换机上,TOR 交换机可以直接看到用户数据,可以对用户数据进行统计,限速等策略应用,解决了纯软件方式带来的网络可视化问题,有助于云服务提供商对网络进行诊断和管理。

对于最终用户来说,他们看不到 SDN,但是这并不代表他们没有享受到 SDN 带给他们的好处。公有云平台的用户希望是可以进行自助服务的(self-service),他们自己创建虚机,自己创建虚拟网络,自己创建虚拟路由器,自己创建防火墙等等,谁在底层支撑着这些动作的顺利执行?是 SDN 架构。没有 SDN,就没有这一切。SDN 的最高境界就是用户在享受着 SDN 带来的便利但却并没有意识到自己使用了 SDN。

季昕华:SDN 的应用场景和用户收益的方面,刚才在发布会中也讲到过。SDN 更多是一种隐藏的特性,不是作为独立的服务提供的,但我们的 VPN 产品、安全产品、广播服务、混合云的实现,都是基于 SDN 来实现的;同时有了 SDN 之后,我们的自动化、隔离、物理机与虚拟机混合管理的方案也更加完善、更加智能、性能更高。对具体细节感兴趣的朋友可以查看这篇新闻

InfoQ:目前,Uhost、UDisk、UDB、ULB、UScan 这几个方面的研发,各自需要投入多少人?图片存储跟又拍云合作,CDN 跟网宿合作,测试方面与云测合作,域名解析与 DNSpod 合作,广播服务跟极光推送合作,这几块服务是否也需要投入研发人员,还是只留下一些客服人员即可?

季昕华:目前全公司总共 80 多位员工,其中技术研发占据一半以上。

合作方面其实都是轻度整合,包括 SSO 的打通、界面整合之类的,并不会涉及到很多研发工作,而且客户反馈也是转给合作伙伴去做的。我们主要是做好运营,以及协助合作伙伴做好客服工作。

InfoQ:我看到 UCloud 上现在提供了网店系统这个应用级服务,这是跟 shopex 的试点合作吧,现在的用户量多少?

季昕华:这是我们的一个试点项目,主要是想尝试软件渠道中心的思路,从目前来看,这样的合作,对用户来说还是非常方便的,后续还会继续扩大,但目前我们的核心还是在游戏行业。

InfoQ:您对于 2014 年 UCloud 的技术投入方面有哪些规划?未来还计划推出哪些服务?对于云平台提供应用这事未来是如何规划的,是否会推出类 AWS marketplace 的产品?又是否考虑 PaaS?

季昕华:我们的核心主要还是两块:一个是聚焦我们行业客户的需求开发功能,在我们来说主要是游戏行业的客户;第二个还是我们自身产品的稳定性。

应用超市是可能会做的,可能做成一个用户自己提交应用的平台,然后可以像现在那个网店系统一样购买使用,但这个并没有具体的计划。

PaaS 也是一样,如果有客户需求的话,我们会优先考虑找一个合作伙伴来一起做,而不会自己上。

InfoQ:在底层技术提升、将技术更好的产品化、为产品寻找更好的商品化道路、发展合作伙伴、发展客户这几项工作当中,您认为哪项是当前的您最为关注的?您和莫显峰、华琨现在是如何分工的?

季昕华:莫显峰是我们的 CTO,负责技术这块;华琨主要负责销售和售后;我吗,就是做各种杂事儿的。

合作伙伴这块我沟通的比较多。关于产品反馈和合作伙伴沟通这一块,我们是这样一个流程:首先,华琨那边是负责跟用户沟通的,他那里收集到的反馈或需求会反馈给团队,看看这些需求中哪些是我们现在的产品无法满足的;我们很注重生态链的合作,会先去看这个需求有没有市场上成熟的产品可以满足的?如果已经有了,我们就不做了,跟这个成熟的产品供应方建立合作伙伴关系,将其引进到我们的平台;如果没有的话,就交给莫显峰去研发。

InfoQ:最后一个问题,担心 OpenStack 在公有云领域的竞争吗?

季昕华:由于有一系列大公司的支持,加上 OpenStack 本身的架构设计的非常不错,OpenStack 最近几年社区很活跃,发展也非常快速,为云计算的落地推广起到了很大的作用。不过从我们来看,我们不担心 OpenStack 在公有云领域的竞争。我认为 OpenStack 目前更适合做私有云,不适合做公有云。原因有三点:

1、目前全世界没有特别成功的 OpenStack 公有云案例。

我们看到 AWS、Google、Windows Azure、阿里云和我们 UCloud 都是用自己研发的产品体系,而使用 OpenStack 进行大规模部署的我了解到的只有 HP Cloud,但 HP Cloud 目前还在早期发展阶段。

有人可能会说 RackSpace 也是使用了 OpenStack 的,但实际上我们看到的信息是 OpenStack 中的存储部分是 RackSpace 提供的,但并不表示 Rackspace 是用 OpenStack 的。

2、OpenStack 是一个软件,不是服务,而公有云是服务。

OpenStack 一出来,好像大家忽然觉得是个人都可以做公有云了。但实际上,做公有云,只有一个软件是不行的,你还需要强大的运营来做支撑。

做过互联网运营的人都知道,看到的功能只是互联网产品里面的 20%,还有 80% 是用户看不到的,但是运营很需要的功能,比如多帐号体系,计费体系,安全体系、后台的自动化管理、灰度发布、扩容等等。

3、与开源项目协调的问题。

假设你将 OpenStack 放到公有云上跑起来了,这时候用户跟你说有一个需求,这个需求是 OpenStack 现有的功能无法解决的,那你要不要去开发这样一个功能?开发了之后,你是要提交给社区,还是自己留着呢?

如果你提交了这个功能,社区又接受了,那么你就把你辛苦建立的竞争优势拱手让人了。

如果你提交了功能,但是社区不接受;或者你不提交这个功能,那么你将面临升级、维护难的问题。将你自己研发的功能,跟社区发布的新版 OpenStack 进行融合,会是非常困难的事情,而这个难度会随着时间推移而越来越严重。

而如果是自己研发,就可以做到灰度发布,完全在自己掌握当中。AWS、RackSpace、微软、阿里云、腾讯云、我们 UCloud,都是这样运作的。

嘉宾简介

季昕华( @benjurry ),Ucloud.cn 创始人,CEO。前盛大云 CEO,曾任盛大在线首席安全官、腾讯公司安全中心副总经理、华为研发经理等职位。

张卫峰( @盛科张卫峰),盛科网络软件总监,数据通信和芯片设计领域资深专家,有十几年的网络实践经验,对 SDN、传统二三层交换机、数据传输设备(PTN 和 IPRAN),从管理面到协议控制面一直到芯片转发面,都有着深刻的理解。

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2013-12-17 00:063386

评论

发布
暂无评论
发现更多内容

流程表单初体验

江南一点雨

Java spring springboot flowable

Flowable 外置的 HTML 表单怎么玩?

江南一点雨

Java spring flowable JavaEE

Postman工具介绍

阿泽🧸

Postman 11月月更

【愚公系列】2022年11月 微信小程序-app.json配置属性之其他属性

愚公搬代码

11月月更

动态路由协议(一)

我叫于豆豆吖.

11月月更

链路状态路由协议 OSPF (一)

我叫于豆豆吖.

11月月更

MUI框架的上拉加载的深入探索和实战运用

恒山其若陋兮

mui 11月月更

解读Web3公链发展格局

TinTinLand

区块链 以太坊 公链 多链

简单时序逻辑电路

智趣匠

Verilog 11月月更 锁存器

融云「百幄」之数字人,升级交互体验的「新同事」

融云 RongCloud

AI 通信 数字化

对于Ajax在MUI框架中的用运以及单 webview 模式中的下拉刷新功能探究

恒山其若陋兮

mui 11月月更

uni-app 性能优化实战之逻辑层条件编译的生产环境

恒山其若陋兮

11月月更 uni

【下】提高组件库Level必做好这六件事

小鑫同学

前端 组件库 11月月更

使用gitflow时如何合并hotfix

alps2006

L1、L2范数理解--Ridge以及Lasso回归

Studying_swz

深度学习 11月月更

算法题学习---单链表的排序

桑榆

算法题 11月月更

2022-11-17:组合两个表。请写出sql语句,执行结果是{“headers“: [“first_name“, “last_name“, “city“, “state“], “values“: [

福大大架构师每日一题

数据库 福大大

分布式系统中的哈希算法

骑牛上青山

数据结构 分布式 算法 哈希

Redis LRU 内存淘汰算法大有玄机

码哥字节

LRU Redis 6.0

动态路由协议(二)

我叫于豆豆吖.

11月月更

为什么要做用户留存分析

穿过生命散发芬芳

用户留存 11月月更

东方通Tongweb中间件Linux环境部署

@下一站

技术 中间件 linux 文件权限控制 Java core 11月月更

冷冷清清的双十一,电商促销节为何被消费者逐渐抛弃

石头IT视角

【上】提高组件库Level必做好这六件事

小鑫同学

前端 组件库 11月月更

「Go实战」一文带你搞懂从单队列到优先级队列的实现

Go学堂

golang 开源 程序员 优先级队列 11月月更

通过阅读源码解决项目难题:GToken替换JWT实现SSO单点登录

王中阳Go

Go golang 高效工作 学习方法 11月月更

jvm(二)内存管理与虚拟机执行子系统

想要飞的猪

java对象内存布局 jvm加载子系统

2022昇腾AI创新大赛圆满收官,看这届评委怎么说?

Geek_2d6073

应用链如何成为 Web3 的“潜力链”

One Block Community

区块链 开发者 区块链应用 云存储 web3

一次zuul版本升级产生的问题排查记录

骑牛上青山

Java spring 源码 Zuul 生产环境

2022下半年《软考-系统架构设计师》备考经验分享

劼哥stone

软考 系统架构师

专访:UCloud季昕华谈网络存储的局限性、SDN在云上的七大应用场景、以及为什么OpenStack还不适合做公有云_服务革新_sai_InfoQ精选文章