发布在即!企业 AIGC 应用程度测评,3 步定制专属评估报告。抢首批测评权益>>> 了解详情
写点什么

够快服务的云迁移之路

  • 2012-10-18
  • 本文字数:2660 字

    阅读完需:约 9 分钟

够快是国内一家基于云存储的协同服务提供商。面向各类规模的企事业单位、政府机关以及学校团体,提供建立在阿里云平台上的云存储以及基于云存储的各类协同应用服务。InfoQ 就够快的架构向云端的迁移等问题对够快工程师进行了采访。

InfoQ:“够快”为什么要将业务放到云上?之前是否有一个阶段是没有将服务器放到云上而是自己来负责服务器的处理?

蒋烁淼:之前有。

InfoQ: 之前的那种方式遇到了什么问题?为什么会决定把业务迁移到云上?

蒋烁淼:是这样的,首先一点就是说像我们把业务放在自己部署的服务器上,一开始是规模相对较小,服务器加起来不超过 20 台,那么给我们的感觉是自己能够维护的过来,当时也开发了一些程序来做监控、管理,而真正遇到的瓶颈产生在网络方面。因为我们做的是存储服务,做存储服务很重要的一点就是网络。因为中国的网络服务商有联通、电信、移动等,在这种大的网络环境下,我们就需要至少建立联通、电信两个机房,并且我们也就是这样做的,这就导致我们的机器数量翻倍。并且随着业务的发展,我们需要管理的服务器规模差不多接近 100 台,这样我们的服务器就相当于构成了一个私有云,但是我们发现除了机器本身的成本以外,我们还需要额外的付出:

针对现在的 100、200 台机器的私有云进行优化,需要更强大的运维开发团队、需要更好的带宽。

我们的服务器放在不同的机房,在每个机房还需要专门的维护人员。因为我们做的是云端存储,硬盘很容易损坏,因此当这样的情况发生以后需要及时更换硬盘、修复数据,那就要求我们随时对服务器进行监控。实际上在服务器监控、管理这一块耗费了我们很大的精力。

阿里云的出现就给我们这样的感觉:虽然其硬件、带宽成本比我们自己部署要贵一些,但是我们节省了很多隐形成本。我在使用阿里云的时候,深有体会的这一点。在我们自己部署服务器的时候,一开始放置了 10、20 台服务器,但是如果后来业务暴增需要 100、200 台机器 ,但是电信机房没有空余的机位,我们就只有两个选择,一是将服务器换一个机房,另一个就是在另一个机房部署服务器,然后通过拉光纤等方式将两个机房串起来。这个成本是很大的,虽然有足够的资金来做这个事情,但由于我们还要提供持续的服务,所以时间上我们至少需要一、两天来部署这个架构。在这个背景下,我们选择使用阿里云。

InfoQ:我们相信云可以给企业带来很多帮助,比如成本上的降低,但是云不是万能的,那么够快在使用阿里云的过程中是否遇到过没有想到的问题?又是如何解决的?

蒋烁淼:实际上我感觉“够快”是伴随着阿里云一起成长的。我们最早用阿里云的时候,包括 OSS 系统,还是存在很多问题的,我们也反馈了很多 bug。其实,我感觉这个事情需要客观的看待,我相信云现在还存在很多问题,但是这些问题我们自己做也会碰到,不同的是现在是阿里云来帮助我们解决问题。拿前几天遇到的一个情况来举例:前几天我们发现网站突然访问不了,后来我问了一下阿里云,他们说是遭遇到了 DDOS,然后他们差不多用了 2 个小时就把攻击流量停止了。因为之前我们自己部署服务器的时候也遇到过这样的问题,就是也被 DDOS,对于我们就需要一星期或者被迫换 IP 的方式才能将这个 DDOS 躲过去。实际上这也是另外一个问题,比如我们在运营的时候服务器宕掉、被 DDOS 或是阿里的误操作导致服务器宕机,但是因为我们自己也部署过机器,也不确保自己的技术能够保证万无一失,包括盛大或者亚马逊的云也不能够完美无缺,而这些问题在我们个人运作时会遇到时,那么阿里云也会遇到。不同的是当我们个人遇到的时候可能是自己想办法去解决,而现在就靠托管的服务商来解决,从经营角度上就是不知道他什么时候会解决这个是差距,其他的都一样。实际上我觉得中国云服务刚刚兴起,包括盛大、阿里的服务还有待提高,但是我相信他们如果把这个服务做下去,必然比我们自己做发展的要快。毕竟跑在他们机器上的服务不止我们自己一家,我可能只会遇到自己的 bug,不妨说我提供了一个 bug 给阿里云,他就会将这个 bug 解决,那么整个平台就不会再遇到这个问题。

InfoQ:我是不是可以这样认为:“够快”是和阿里云一同成功,从无到有,从小到大发展起来?

蒋烁淼:是的,我们的确见证了阿里云的成长,他们的很多服务都不错,包括测试服务、OSS 等。

InfoQ:对于使用云的企业来说,我觉得对于团队带来的变化是不是运维成本急剧降低?

蒋烁淼:运维分两块,一个是客服运维,这个是不会减少的。主要是服务器的运维的成本降低,现在我们就一个人来负责。他就是每天看下阿里云服务器的运行状态,比如空间、网络、配置是否正确,如果出现异常就反馈给阿里云,然后由他们进行修复。

原先我们自己部署服务器的时候,如果要扩大机房就需要招至少 5 个人的团队来做这个运维管理。

InfoQ:看来阿里云给够快提供了生产力提升和成本降低,间接造成企业竞争力的提高。

蒋烁淼:是的,那么从另外一个角度,我们现在是为其他的企业提供包装过的云服务。在我们的产品使用了阿里云以后就会增强用户对我们的信心,因为服务是阿里提供支持,用户感觉就会对于服务感觉很好,包括数据安全性等各个方面会更放心。同时,数据托管在阿里云,我们自己也比较放心。

InfoQ:最后一个问题,当初在选择云服务提供商的时候,是哪些因素使得你们选择阿里云?

蒋烁淼:最重要的一个方面是访问速度。我们的这些服务主要是面向国内,当时试过包括微软在内的很多国外服务,发现这些访问速度比较慢,而亚马逊、谷歌的服务容易被屏蔽。那么国内剩下的大公司就是盛大、阿里,当然现在国内的其他小公司也提供云平台,我个人感觉他们只是提供虚拟机,因为我们的业务要求需要服务商提供整套解决方案,包括存储、结构化数据查询、虚拟机、负载均衡等。

阿里云是内置的超级网络,教育、电信、联通等使用同一个 IP 地址,网络优化到访问速度都差不多。基于这些,我们选择阿里云。

同时还考虑到用户的体验,因为对于用户而言,需要用户来选择联通或者电信入口,如果用户选错了,稍后的服务就会不顺利。

号外:够快还将在今年 11 月 9 日的阿里云开发者大会2012 上进行技术分享,欢迎关注本次大会(大会将于2012 年11 月8-9 日杭州举行),阿里云开发者大会大会由阿里云主办,云集互联网业界领袖、知名企业高管、云计算技术专家、资深开发者等各路精英,共同分享云计算技术革新与开发经验,探讨中国云计算产业的落地实践与创新发展。点击报名参加


给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ )或者腾讯微博( @InfoQ )关注我们,并与我们的编辑和其他读者朋友交流。

2012-10-18 07:121940
用户头像

发布了 88 篇内容, 共 258.1 次阅读, 收获喜欢 7 次。

关注

评论

发布
暂无评论
发现更多内容

Kubernetes 多集群管理平台 OCM v0.9.0 发布:进一步改善托管集群安全性问题

阿里巴巴云原生

阿里云 云原生 OCM

融云全球社交泛娱乐洞察,老资格的「游戏社交」还有哪些想象空间

融云 RongCloud

社交 泛娱乐社交

Higress 实战:30 行代码写一个 Wasm Go插件

阿里巴巴云原生

阿里云 云原生 Higress

为什么我们提供了新的公共镜像库

Jianmu

k8s 镜像 Docker 镜像 容器镜像加速

详解UDS CAN诊断:什么是UDS(ISO 14229)诊断?

不脱发的程序猿

嵌入式 汽车电子 ISO 14229 CAN诊断 UDS诊断

xxj-job服务端架构流程

IT巅峰技术

凝心聚力 开源共建 | 统信软件参与成立OpenKunlun开源固件社区

统信软件

开源 开源社区 开源技术

「Go易错集锦」正确使用defer避免代码重复

Go学堂

golang 程序员 个人成长 defer 11月月更

华为云大数据平台,助力企业数字化转型成效明显

路过的憨憨

灰度分布的主流方案

穿过生命散发芬芳

灰度发布 11月月更

详解UDS CAN诊断:DiagnosticSessionControl Service(SID:0X10)

不脱发的程序猿

嵌入式 汽车电子 ISO 14229 UDS诊断 诊断和通信管理功能单元

单一职责原则详解

杨充

赫夫曼树编码实验报告

我是一个茶壶

数据结构 哈夫曼树 11月月更

数据治理:数据标准建设方法和流程

用友BIP

开闭原则详细介绍

杨充

研发管理如何度量「人效」

feijieppm

项目管理 研发效能 技术管理 文化 & 方法 效能度量

PostgreSQL 技术内幕(二) Greenplum-AO表

酷克数据HashData

postgresql greenplum

支持向量机-SVC的模型评估指标

烧灯续昼2002

Python 机器学习 算法 sklearn 11月月更

支持向量机-ROC曲线中的概率和阈值

烧灯续昼2002

Python 机器学习 算法 sklearn 11月月更

2022-11-29:查找重复的电子邮箱。以下数据中a@b.com是重复的,请写出sql语句。 DROP TABLE IF EXISTS person; CREATE TABLE person (

福大大架构师每日一题

数据库 福大大

Kindling程序摄像头——Trace-Profiling功能正式发布

KINDLING

Java 系统监控 Kubernetes, 云原生, eBPF

汽配行业erp系统解决方案!

优秀

低代码 ERP系统 汽配行业

EasyRecovery2023数据恢复软件下载使用教程

茶色酒

easyrecovery2023

得物视频编辑工具优化全指南

得物技术

性能优化 线程 视频特效 视频转码

企业办公新模式,随时随地云上协同!

秃头也爱科技

Python数据可视化:如何选择合适的图表可视化?

不脱发的程序猿

Python Python数据可视化 选择合适的图表可视化? 数据分析可视化

元器件科普 | 为什么电感在直流电路中相当于短路?(附视频讲解)

元器件秋姐

元器件知识 电感 电感原理 电感元件 元器件科普

Python数据可视化:类别比较图表可视化

不脱发的程序猿

Python Python数据可视化 数据分析可视化 类别比较型图表

华为云GaussDB 为企业数字化踩了一脚油门

爱科技的水月

Linux yum 命令

攻城狮Wayne

yum源 11月月更 Linux系统指令

【万字爆肝】带你了解浏览器原理

FE情报局

JavaScript 前端 浏览器 11月月更

够快服务的云迁移之路_服务革新_张龙_InfoQ精选文章