李浩:QClub 上聊聊海量 Push 服务的质量保证

  • 包研

2014 年 7 月 3 日

话题:移动云计算DevOps语言 & 开发架构腾讯云

手机、平板电脑爆发式增长给移动互联网带来了空前机遇,云服务的普及也加速了移动互联网的发展。无论是国外的 AWS、GAE、GCE,还是国内的阿里云、百度云、腾讯云,都将为用户提供基础设施、数据分析等完善的服务视为目标。是否能为海量应用和用户提供可靠的服务就是云服务商核心技术能力的体现。在QClub:腾讯云图系列沙龙活动上,腾讯云的工程师对游戏云背后的关键技术进行剖析。InfoQ 采访了腾讯云高级工程师李浩,以下是采访全文:

InfoQ:李浩你好,简要介绍下你的工作经历。做过哪些项目?目前负责什么项目?关注哪些技术?

李浩:你好,我做过腾讯开放平台、腾讯云平台的建设,主要参与过的项目包括 OpenAPI、云平台流程引擎、多维数据分析、移动推送等。目前主要负责腾讯游戏云上的相关服务,包括方便运维的一键开服,终端安全相关的应用加固,以及信鸽推送、一键发布等服务。关注移动网络接入、海量服务架构、大数据分析等技术。

InfoQ:你们与底层的开发和运维团队是如何协作的?

李浩:测试、运维人员会较早的参与需求和设计评审,完成设计。确定了模块和交互协议后,开发的同学就很清楚了,编码调试。发布前会进行发布评审,预估初始量,运维同学上线设备,根据开发同学的部署文档或者工具进行部署,尽量做到 DO 分离(开发和运维工作由不同的团队负责)。设计和部署时都会考虑按量来分 Set,因此后续运维同学可以模块化的扩缩容。

InfoQ:团队中有专门的测试工程师吗?新功能、新版本测试 / 发布是如何做的?

李浩:有相关的测试团队支持,他们定期收集需求,进行评审,并根据需求完成时间,决定排入哪个迭代。测试、发布统一走该迭代的时间窗,基本上双周完成一次迭代。如果是小需求或紧急需求,则不受迭代限制。

InfoQ:代码 Review 是什么流程?

李浩:腾讯内部有专门的代码 Review 网站,提测前或免测发布前,项目 FO 会发起代码 Review,系统会自动拉出版本间差异,相关干系人进行 Review 并给出缺陷或意见,代码修正后,相关干系人来确认,Review 结束。

InfoQ:保证海量 Push 服务的质量有哪些难点?

李浩:Push 服务主要衡量指标是到达率,我们的难点是在复杂多变的网络环境下,保持通道稳定,这需要了解移动网关的特性,在不同场景使用不同的协议,同时还要权衡终端的耗电量、安全性等。

移动云计算DevOps语言 & 开发架构腾讯云