【ArchSummit】如何通过AIOps推动可量化的业务价值增长和效率提升?>>> 了解详情
写点什么

超 1500 亿个文档,文档云原生时代的“规模之道”

  • 2022-08-28
    北京
  • 本文字数:1985 字

    阅读完需:约 7 分钟

超1500亿个文档,文档云原生时代的“规模之道”

办公软件正在进入云原生时代,软件架构设计也随之发生转变。8 月 26 日,金山办公在珠海举办以「规模之道」为主题的 2022 年技术开放日活动。


会上,金山办公技术委员会执行主席皮霞林透露了 3 组数据,金山办公的月度活跃设备数总量达 5.7 亿(其中 PC 端为 2.32 亿,移动端为 3.34 亿);此外,WPS PC 端 Office 的覆盖率,截至 6 月底录得 68.7%;云端文档数量已经突破 1500 亿,存储空间已经超过 270PB。


“在这么大的体量下,用户这么多文档存在上面,我们非常关心用户最核心的需求是什么?”皮霞林指出,如今金山办公拥有如此大体量的用户和数据,内部最关注的用户核心需求主要有两点,第一是文档上云以后,任何一个设备只要网络是正常的,就应该能随时随地访问文件;第二个是文件存在上面必须是安全的。


金山办公高级研发总监、云平台负责人黄传通表示,当前我们已经迈入“文档云原生时代”,并在主题演讲中,分享了软件开发的架构设计如何适应云原生环境。


据介绍,为了支撑云办公服务的业务形态发展,从 2009 年至 2022 年,WPS 云服务的架构演化,历经了从单体式应用到分布式架构,再到 DevOps+容器化、微服务化,以及正式进入云原生提供混合云可伸缩能力四个时代。整个过程,对于服务研发的“速度”和“敏捷”指标都提出了极高的要求:比如必须支持大规模云服务快速更新的能力、服务必须具有高健壮性、故障自愈能力等等。



从整体架构设计来看,WPS 的云原生底座是混合云架构,为打造运行环境自研了 KAE(Kingsoft App Engine),实现微服务管理、容器管理、应用伸缩性。其代码在研发阶段就应用了自动化测试,运维阶段引入了堡垒机,以做到严格的管理管控。在微服务方面,内部统计显示在测试环境和生产环境上总数达 13600+,每天有 310 次的更新部署。



黄传通强调道,金山办公近年来正大力投入云原生的安全基础设施建设,着手建设“两地三中心”(生产中心、同城容灾中心、异地容灾中心),所有的数据都会在不同区域备份,极端灾害情况下可做到秒级切换能力,过去一年已实现“四个 9”级别服务高可用性——全年 99.99%以上时间服务可用。


云原生是一整套体系,包含了从开发,部署到运维的完整技术栈。除了开发,云上的运维技术发展也日新月异,尤其是面向私有化部署。


金山办公私有云专家陈良表示,金山文档属于公网产品,它采用了原生的技术栈,随着互联网的技术发展,以容器为核心技术的原生技术能解决大部分应用部署,包括资源的管理和协调的问题,但是对私有化的交付并不太友好。据其介绍,金山办公在私有云底座体系建设上,支持批量做构建,支持跨指令级;提供 PAAS 平台,构建在企业提供的 SAAS 平台技术上,提供全自动化部署的能力。另外,在云端提供了一个聚合系统,并不是交付到企业客户,而是在公网提供一个聚合平台,专门收集项目的巡检报告、告警信息等等,帮助他们更好地了解项目的运行情况。



陈良坦言,上述这套体系并不是一蹴而成的,也是经过多年的迭代。2017 年处于脚本化的时代,不支持多种私有化平台兼容,导致部署效率,交付周期会非常长。2018 年进行改造,兼容更多的操作系统,进入工具化时代。到 2019 年,随着私有化项目逐渐铺开,一系列运维的问题日渐凸显,内部立专项做平台化的建设,通过可视化的方式进行纳管。2022 年,开始向智能化的方向演变。


2022 年,北京冬奥会成功举办,这是迄今观看人数最多、数字化程度最高的一届冬奥会。


作为官方协同办公软件供应商,金山办公为冬奥组委提供了一套私有云部署解决方案,方案采用了云原生的技术栈,支持文档的云端存储、文档的多人在线协同等。


陈良在分享中表示:“在冬奥会案例中,金山办公面临两方面挑战:首先是跨区域的办公协同,包含场馆、团队与总部员工的办公协同,以及与国际奥组委的协同,特点是部署环境复杂、运维难,可用性保障难;其次,冬奥会的数据安全要求是国际顶尖水准级别的。”


为了解决这两个难题,金山办公原创设计了一套“私有云底座”(kubewps),并形成了一套标准的“1 小时”高效部署服务流程:

  • 第一,实现环境容器化,屏蔽环境差异、兼容多操作系统解决部署依赖问题;

  • 第二,实现配置模板化,事前根据节点数预定义最佳的角色分配,减少赛事后期配置;

  • 第三,管理平台化,为冬奥组委提供了一套可视化运维系统,清晰展现监控运维成果。


历经 800 余天,金山办公协助北京冬奥组委技术部完成了协同办公系统及其余 3 个业务系统的自主研发建设,共计处理问题工单 800 余次,提供超过 4000 小时技术保障,达成 100%问题解决率,以“零事故”成果圆满完成赛事保障任务。


据 2021 年报数据,2021 年金山办公产研费用投入 10.82 亿元,研发围绕“云和数字化”方向做长期储备,投入不断加码。最新数据显示,金山办公研发总人数 2816 人,研发人员占公司人员总数比例近七成。金山办公表示,为了适应产业不断提出的需求,金山办公产研团队将持续把握技术趋势的变化,坚持探索新一代办公产品形态。


延展阅读:

《这么多年,我在 WPS 折腾些什么?》

2022-08-28 23:087951

评论 1 条评论

发布
用户头像
强者愈强,弱者愈弱
2022-08-30 08:19 · 浙江
回复
没有更多了
发现更多内容

25个小众的Java库

GuoYaxiang

Java 开发工具

NPC Follow

katichar

LeetCode题解:231. 2的幂,递归,JavaScript,详细注释

Lee Chen

算法 大前端 LeetCode

蚂蚁金融推迟上市:互联网金融是否要遭遇滑铁卢

石头IT视角

“十三五”收官,区块链赋能能源电力路在何方?

CECBC

区块链 电力 能源

我去!三面字节竟全败在Redis上,带薪摸鱼刷1949页进阶笔记

996小迁

Java redis 架构 面试 程序人生

Redis最常见的16道面试题与详解

Java架构师迁哥

啥是数据库范式

Simon

MySQL 数据库 数据库设计

HTTP2协议及websocket协议总结

江龙

TCP梳理总结

江龙

http请求中get和post方法的区别

测试人生路

HTTP post GET

ViewportFrame demo

katichar

字节跳动大神亲自总结SpringBoot手册,让你可以在简历上写精通SpringBoot!

Java架构追梦

Java 架构 面试 微服务 springboot

架构师训练营 -week07-作业

大刘

极客大学架构师训练营

从技术到应用实践 揭秘京东区块链布局全景

京东科技开发者

区块链 区块链方案 供应链

阿里P8对Thread核心源码讲解

Java架构师迁哥

隐私计算S2赛季 谁是真正的王者?

hellompc

学习 隐私计算

低代码开发不靠谱?看低代码开发在物联网APP开发中的应用

华为云开发者联盟

技术 软件开发 代码

MySQL中特别实用的几种SQL语句送给大家

陈哈哈

SQL优化 实用SQl语句 高性能SQL

谈谈敏捷开发概念和迭代开发方案

Philips

敏捷开发 快速开发

线上Java程序占用 CPU 过高,请说一下排查方法?

古时的风筝

Java JVM cpu 100%

训练营第三周总结

大脸猫

极客大学架构师训练营

“软件教父”花费20年,教你如何在应用层混迹的风生水起

小Q

Java 学习 架构 面试 应用

架構師訓練營第 1 期 - 第 07 周作業

Panda

架構師訓練營第 1 期

LeetCode题解:231. 2的幂,迭代,JavaScript,详细注释

Lee Chen

算法 大前端 LeetCode

JVM真香系列:.java文件到.class文件

田维常

JVM

互联网审判中区块链存证技术的应用进路

CECBC

互联网 电子存证

诈骗?通证项目方的危局

CECBC

区块链 法律

字节跳动HR:3年从4000人招到10万人,我经历了什么

Java架构师迁哥

华为发布5GtoB核心网建设白皮书

华为云开发者联盟

5G 边缘技术

快快使用ModelArts,零基础小白也能玩转AI!

华为云开发者联盟

人工智能 开发者 开发

超1500亿个文档,文档云原生时代的“规模之道”_云原生_罗燕珊_InfoQ精选文章