张东晖谈打造稳定易用的阿里云用户体验

  • 罗鹏

2014 年 10 月 16 日

话题:语言 & 开发阿里云

在 2014 年的阿里云开发者大会上,阿里云提出了“服务不是口号,是承诺”的口号,并在现场直面阿里云在服务上出现的问题,从产品、技术、运维多维度解析了背后的问题,以及解决办法。而且在大会上,和所有的开发者、客户,分享了这么一段话:

(AWDC2014 阿里云开发者大会现场)

“虽然道歉无法弥补给大家带来的麻烦,但是,我们可以用更快的访问速度,更好的用户体验,更贴心的体验去弥补,虽然故障的事实无法改变,但我们的努力可以创造更少故障的未来!”

在大会上,来自阿里巴巴集团数据平台的总监、研究员张东晖就阿里云的产品为我们分享了《打造稳定易用的产品体验》的主题演讲,就阿里云现有的问题,提出了以客户为导向的产品改进路线。

在主题演讲中,他首先就阿里云产品出现的问题,解决的办法,提出了以下主要的两个观点:

  • 客户导向的产品改进
  • 提升基础产品体验

在客户导向的产品改进中,他说道:

  • 建立更有效的客户沟通渠道:高效,简单、易通行的沟通渠道,能够深入理解客户的需求和产品的问题
  • 解决基础产品的稳定性、性能、和关键需求:客户不仅仅是企业用户,还有广大的开发者,需要改善开发者最依赖的四大件:ECS、RDS、OSS、SLB 的各种性能,使其能够更好的为开发者服务,为用户创造更有价值的产品。
  • 完善基本开发者体验:包括文档准确性、API/SDK 完整性、控制台体验,对于开发者来说,也是举足轻重的用户体验过程。

在提升基础产品体验中,他也提出如下四点基本要求,并在接下来的演讲中,一一细化为我们详细分析了各种用户体验的改进:

  • 满足 ESC 高性能磁盘 IO 需求
  • 改进 RDS 稳定性
  • 优化 OSS+CDN 全链路体验
  • 支持高可用应用架构

对于满足 ESC 高性能磁盘 IO 需求,他提出:

  • 数据可靠性和 IO 性能的矛盾是云计算的核心技术挑战,阿里云始终高度关注客户数据的可靠性
  • 游戏和企业关键应用对高性能临时磁盘需求强烈:客户有能力做主备
  • 基于 SSD 的高性能临时磁盘:在 2014 年 11 月,适合了 MangoDB、PostgreSQL 等,IOPS 在 10000 以上
  • 持续优化云磁盘的IO系能

在改进 RDS 的稳定性方面,他也指出了如下三点改进方法:

  • 提高连接稳定性,杜绝闪断
  • 降低资源争抢、提高性能稳定性
  • 加强实例空间和 SQL 诊断优化,提高应用稳定性

针对 OSS+CDN 全链路的体验较差问题,他特别提出了以下优化实现:

  • 性能不够稳定:分布式文件系统和服务器优化,慢请求整体下降 2~3 个数量级
  • 域名劫持导致 OSS 存储不可用:全链路监控,尽早发现和解决域名劫持
  • 客户促销触发流量清洗,导致网站不可用:改善流量清洗算法,避免攻击过度防御

而对于支持高可用应用架构,他基于阿里云现有的实现情况,以及未来需要完善的目标,提出了如下几点架构观点:

  • 中大型互联网应用高度依赖虚拟网络:ECS、SLB、RDS 逐步支持 VPC
  • 全面支持可用区:a、ECS、RDS、SLB、OCS 支持可用区 b、解决可用区售卖资源不足问题
  • 解决企业应用上云的挡路问题:a、ECS 镜像、快照跨 Region 迁移 b、ECS 账号资源转移和共享 c、ECS、RDS、OSS 支持主子账号等

最后,为了打造稳定易用的产品体验,他向所有的开发者,企业客户,喊出了如下三个口号:

  • 产品设计从“平台导向”转向“用户导向”
  • 把先进的技术转化为细腻的产品体验
  • 和开发者一起打造一个稳定易用的平台
语言 & 开发阿里云