【ArchSummit架构师峰会】探讨数据与人工智能相互驱动的关系>>> 了解详情
写点什么

超 1500 亿个文档,文档云原生时代的“规模之道”

  • 2022-08-28
    北京
  • 本文字数:1985 字

    阅读完需:约 7 分钟

超1500亿个文档,文档云原生时代的“规模之道”

办公软件正在进入云原生时代,软件架构设计也随之发生转变。8 月 26 日,金山办公在珠海举办以「规模之道」为主题的 2022 年技术开放日活动。


会上,金山办公技术委员会执行主席皮霞林透露了 3 组数据,金山办公的月度活跃设备数总量达 5.7 亿(其中 PC 端为 2.32 亿,移动端为 3.34 亿);此外,WPS PC 端 Office 的覆盖率,截至 6 月底录得 68.7%;云端文档数量已经突破 1500 亿,存储空间已经超过 270PB。


“在这么大的体量下,用户这么多文档存在上面,我们非常关心用户最核心的需求是什么?”皮霞林指出,如今金山办公拥有如此大体量的用户和数据,内部最关注的用户核心需求主要有两点,第一是文档上云以后,任何一个设备只要网络是正常的,就应该能随时随地访问文件;第二个是文件存在上面必须是安全的。


金山办公高级研发总监、云平台负责人黄传通表示,当前我们已经迈入“文档云原生时代”,并在主题演讲中,分享了软件开发的架构设计如何适应云原生环境。


据介绍,为了支撑云办公服务的业务形态发展,从 2009 年至 2022 年,WPS 云服务的架构演化,历经了从单体式应用到分布式架构,再到 DevOps+容器化、微服务化,以及正式进入云原生提供混合云可伸缩能力四个时代。整个过程,对于服务研发的“速度”和“敏捷”指标都提出了极高的要求:比如必须支持大规模云服务快速更新的能力、服务必须具有高健壮性、故障自愈能力等等。



从整体架构设计来看,WPS 的云原生底座是混合云架构,为打造运行环境自研了 KAE(Kingsoft App Engine),实现微服务管理、容器管理、应用伸缩性。其代码在研发阶段就应用了自动化测试,运维阶段引入了堡垒机,以做到严格的管理管控。在微服务方面,内部统计显示在测试环境和生产环境上总数达 13600+,每天有 310 次的更新部署。



黄传通强调道,金山办公近年来正大力投入云原生的安全基础设施建设,着手建设“两地三中心”(生产中心、同城容灾中心、异地容灾中心),所有的数据都会在不同区域备份,极端灾害情况下可做到秒级切换能力,过去一年已实现“四个 9”级别服务高可用性——全年 99.99%以上时间服务可用。


云原生是一整套体系,包含了从开发,部署到运维的完整技术栈。除了开发,云上的运维技术发展也日新月异,尤其是面向私有化部署。


金山办公私有云专家陈良表示,金山文档属于公网产品,它采用了原生的技术栈,随着互联网的技术发展,以容器为核心技术的原生技术能解决大部分应用部署,包括资源的管理和协调的问题,但是对私有化的交付并不太友好。据其介绍,金山办公在私有云底座体系建设上,支持批量做构建,支持跨指令级;提供 PAAS 平台,构建在企业提供的 SAAS 平台技术上,提供全自动化部署的能力。另外,在云端提供了一个聚合系统,并不是交付到企业客户,而是在公网提供一个聚合平台,专门收集项目的巡检报告、告警信息等等,帮助他们更好地了解项目的运行情况。



陈良坦言,上述这套体系并不是一蹴而成的,也是经过多年的迭代。2017 年处于脚本化的时代,不支持多种私有化平台兼容,导致部署效率,交付周期会非常长。2018 年进行改造,兼容更多的操作系统,进入工具化时代。到 2019 年,随着私有化项目逐渐铺开,一系列运维的问题日渐凸显,内部立专项做平台化的建设,通过可视化的方式进行纳管。2022 年,开始向智能化的方向演变。


2022 年,北京冬奥会成功举办,这是迄今观看人数最多、数字化程度最高的一届冬奥会。


作为官方协同办公软件供应商,金山办公为冬奥组委提供了一套私有云部署解决方案,方案采用了云原生的技术栈,支持文档的云端存储、文档的多人在线协同等。


陈良在分享中表示:“在冬奥会案例中,金山办公面临两方面挑战:首先是跨区域的办公协同,包含场馆、团队与总部员工的办公协同,以及与国际奥组委的协同,特点是部署环境复杂、运维难,可用性保障难;其次,冬奥会的数据安全要求是国际顶尖水准级别的。”


为了解决这两个难题,金山办公原创设计了一套“私有云底座”(kubewps),并形成了一套标准的“1 小时”高效部署服务流程:

  • 第一,实现环境容器化,屏蔽环境差异、兼容多操作系统解决部署依赖问题;

  • 第二,实现配置模板化,事前根据节点数预定义最佳的角色分配,减少赛事后期配置;

  • 第三,管理平台化,为冬奥组委提供了一套可视化运维系统,清晰展现监控运维成果。


历经 800 余天,金山办公协助北京冬奥组委技术部完成了协同办公系统及其余 3 个业务系统的自主研发建设,共计处理问题工单 800 余次,提供超过 4000 小时技术保障,达成 100%问题解决率,以“零事故”成果圆满完成赛事保障任务。


据 2021 年报数据,2021 年金山办公产研费用投入 10.82 亿元,研发围绕“云和数字化”方向做长期储备,投入不断加码。最新数据显示,金山办公研发总人数 2816 人,研发人员占公司人员总数比例近七成。金山办公表示,为了适应产业不断提出的需求,金山办公产研团队将持续把握技术趋势的变化,坚持探索新一代办公产品形态。


延展阅读:

《这么多年,我在 WPS 折腾些什么?》

2022-08-28 23:087957

评论 1 条评论

发布
用户头像
强者愈强,弱者愈弱
2022-08-30 08:19 · 浙江
回复
没有更多了
发现更多内容

把主机放在家里

D

centos Homework

优化工程师逻辑视角下的微信“拍一拍”功能

Earth_Polarbear

人工智能 微信 系统工程 优化逻辑

由一次管理后台定时推送功能引发的对 RabbitMQ 延迟队列的思考 (二)

LSJ

Java RabbitMQ 延迟队列 优先级队列

从拼多多突破阿里和京东两大巨头绞杀,市值破千亿美金来看职业价值链

非著名程序员

程序员 程序人生 职业规划 职业成长

终于有人把 java代理 讲清楚了,万字详解!

java金融

Java jdk 后端 动态代理 cglib

架构师训练营第三周学习总结

张明森

一款跨平台免费的开源 SQL 编辑器和数据库管理器!

JackTian

数据库 sql GitHub 开源 实用工具

三流程序员大晚上不睡觉,竟然在做这件事

Janenesome

写作平台 碎碎念

【Golang runtime学习笔记-启动过程分析】

卓丁

初始化 runtime 汇编 Go 语言

如何做好职场印象管理?

石云升

职场 印象管理 职场形象

ArrayList哪种循环效率更好你真的清楚吗

java金融

Java 后端 ArrayList 循环效率 方式

在项目中随手把haseMap改成了currenHaseMap差点被公司给开除了

java金融

Java 后端 BigDecimal金额 Arrays.asList

实现一个redis命令--nonzerodecr

老胡爱分享

redis 源码分析 源码阅读

golang-pprof实战笔记

卓丁

pprof 性能分析 Go 语言

软件设计原则

yupi

能走出来的,都不叫困境

zkback

依赖倒置-好莱坞原则

yupi

Kafka面试题:基础27问,必须都会的呀!

Java小咖秀

大数据 kafka 分布式 队列 延时消息

啥是CPU缓存?又如何提高缓存命中率呢?

八两

游戏夜读 | RPG的美式和日式

game1night

Java操作Excel竟如此简单

生命在于折腾

Java EasyExcel

架构师训练营 - 第2周学习总结

红了哟

SpringIOC 是依赖倒置吗?

yupi

大话设计模式 | 3. SOLID原则

Puran

设计模式

效率思维模式与Zombie Scrum

Worktile

敏捷开发

Java世界的“烂”包管理

申扬科技

maven Git Submodule

[安利] 可能会让你爱上书写的工具组合!

猴哥一一 cium

Typora markdown markdown编辑器 玩转写作平台

区块链系列教程之:比特币的钱包与交易

程序那些事

比特币 区块链 智能合约 钱包 交易

策略模式解析

Seven七哥

设计模式 策略模式

Git 基础知识学习

LeoBing

[架构师训练营] 2 依赖倒置

悬浮

超1500亿个文档,文档云原生时代的“规模之道”_云原生_罗燕珊_InfoQ精选文章