NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

超 1500 亿个文档,文档云原生时代的“规模之道”

  • 2022-08-28
    北京
  • 本文字数:1985 字

    阅读完需:约 7 分钟

超1500亿个文档,文档云原生时代的“规模之道”

办公软件正在进入云原生时代,软件架构设计也随之发生转变。8 月 26 日,金山办公在珠海举办以「规模之道」为主题的 2022 年技术开放日活动。


会上,金山办公技术委员会执行主席皮霞林透露了 3 组数据,金山办公的月度活跃设备数总量达 5.7 亿(其中 PC 端为 2.32 亿,移动端为 3.34 亿);此外,WPS PC 端 Office 的覆盖率,截至 6 月底录得 68.7%;云端文档数量已经突破 1500 亿,存储空间已经超过 270PB。


“在这么大的体量下,用户这么多文档存在上面,我们非常关心用户最核心的需求是什么?”皮霞林指出,如今金山办公拥有如此大体量的用户和数据,内部最关注的用户核心需求主要有两点,第一是文档上云以后,任何一个设备只要网络是正常的,就应该能随时随地访问文件;第二个是文件存在上面必须是安全的。


金山办公高级研发总监、云平台负责人黄传通表示,当前我们已经迈入“文档云原生时代”,并在主题演讲中,分享了软件开发的架构设计如何适应云原生环境。


据介绍,为了支撑云办公服务的业务形态发展,从 2009 年至 2022 年,WPS 云服务的架构演化,历经了从单体式应用到分布式架构,再到 DevOps+容器化、微服务化,以及正式进入云原生提供混合云可伸缩能力四个时代。整个过程,对于服务研发的“速度”和“敏捷”指标都提出了极高的要求:比如必须支持大规模云服务快速更新的能力、服务必须具有高健壮性、故障自愈能力等等。



从整体架构设计来看,WPS 的云原生底座是混合云架构,为打造运行环境自研了 KAE(Kingsoft App Engine),实现微服务管理、容器管理、应用伸缩性。其代码在研发阶段就应用了自动化测试,运维阶段引入了堡垒机,以做到严格的管理管控。在微服务方面,内部统计显示在测试环境和生产环境上总数达 13600+,每天有 310 次的更新部署。



黄传通强调道,金山办公近年来正大力投入云原生的安全基础设施建设,着手建设“两地三中心”(生产中心、同城容灾中心、异地容灾中心),所有的数据都会在不同区域备份,极端灾害情况下可做到秒级切换能力,过去一年已实现“四个 9”级别服务高可用性——全年 99.99%以上时间服务可用。


云原生是一整套体系,包含了从开发,部署到运维的完整技术栈。除了开发,云上的运维技术发展也日新月异,尤其是面向私有化部署。


金山办公私有云专家陈良表示,金山文档属于公网产品,它采用了原生的技术栈,随着互联网的技术发展,以容器为核心技术的原生技术能解决大部分应用部署,包括资源的管理和协调的问题,但是对私有化的交付并不太友好。据其介绍,金山办公在私有云底座体系建设上,支持批量做构建,支持跨指令级;提供 PAAS 平台,构建在企业提供的 SAAS 平台技术上,提供全自动化部署的能力。另外,在云端提供了一个聚合系统,并不是交付到企业客户,而是在公网提供一个聚合平台,专门收集项目的巡检报告、告警信息等等,帮助他们更好地了解项目的运行情况。



陈良坦言,上述这套体系并不是一蹴而成的,也是经过多年的迭代。2017 年处于脚本化的时代,不支持多种私有化平台兼容,导致部署效率,交付周期会非常长。2018 年进行改造,兼容更多的操作系统,进入工具化时代。到 2019 年,随着私有化项目逐渐铺开,一系列运维的问题日渐凸显,内部立专项做平台化的建设,通过可视化的方式进行纳管。2022 年,开始向智能化的方向演变。


2022 年,北京冬奥会成功举办,这是迄今观看人数最多、数字化程度最高的一届冬奥会。


作为官方协同办公软件供应商,金山办公为冬奥组委提供了一套私有云部署解决方案,方案采用了云原生的技术栈,支持文档的云端存储、文档的多人在线协同等。


陈良在分享中表示:“在冬奥会案例中,金山办公面临两方面挑战:首先是跨区域的办公协同,包含场馆、团队与总部员工的办公协同,以及与国际奥组委的协同,特点是部署环境复杂、运维难,可用性保障难;其次,冬奥会的数据安全要求是国际顶尖水准级别的。”


为了解决这两个难题,金山办公原创设计了一套“私有云底座”(kubewps),并形成了一套标准的“1 小时”高效部署服务流程:

  • 第一,实现环境容器化,屏蔽环境差异、兼容多操作系统解决部署依赖问题;

  • 第二,实现配置模板化,事前根据节点数预定义最佳的角色分配,减少赛事后期配置;

  • 第三,管理平台化,为冬奥组委提供了一套可视化运维系统,清晰展现监控运维成果。


历经 800 余天,金山办公协助北京冬奥组委技术部完成了协同办公系统及其余 3 个业务系统的自主研发建设,共计处理问题工单 800 余次,提供超过 4000 小时技术保障,达成 100%问题解决率,以“零事故”成果圆满完成赛事保障任务。


据 2021 年报数据,2021 年金山办公产研费用投入 10.82 亿元,研发围绕“云和数字化”方向做长期储备,投入不断加码。最新数据显示,金山办公研发总人数 2816 人,研发人员占公司人员总数比例近七成。金山办公表示,为了适应产业不断提出的需求,金山办公产研团队将持续把握技术趋势的变化,坚持探索新一代办公产品形态。


延展阅读:

《这么多年,我在 WPS 折腾些什么?》

2022-08-28 23:087960

评论 1 条评论

发布
用户头像
强者愈强,弱者愈弱
2022-08-30 08:19 · 浙江
回复
没有更多了
发现更多内容

安装 Druid 安装的时候提示 JAVA 版本的问题

HoneyMoose

教你如何成为解决问题的高手

孙叫兽

高手 解决问题

模块三

Winston

TensorFlow Recommenders: Quickstart

毛显新

深度学习 tensorflow 推荐系统 keras

如何在二三线城市月薪过万(一)看完这篇后端简历优化,包你面试不断

小鲍侃java

面试 后端

带你走进“华为链”

华为云开发者联盟

区块链 高性能 华为链 自研区块链平台 自主可控

区块链去中心化钱包开发|开发去中心化钱包

Geek_23f0c3

钱包系统开发 去中心化交易所系统开发 去中心化钱包 去中心化交易所

数据对AI的重要性:采访首席数据官Rick McFarland - LexisNexis Legal & Professional

WorkPlus

阅读

Windows Service 小品

喵叔

7月日更

全是蓝光,太狠了!

Jackpop

充满科技感的农业,是年轻人的『菜』吗?

百度大脑

人工智能

Python OpenCV 图像处理之直方图相关知识细节,学点细的

梦想橡皮擦

7月日更

泰国Ascend Money用开源软件加快应用交付

WorkPlus

阅读

模块三作业

河马先生

架构实战营

云图说 | 华为云医疗智能体,智联大健康,AI药物研发

华为云开发者联盟

AI 药物研发 医疗智能体

Java集合源码总结分析

男人要慢,SQL要快:记一次慢SQL优化

艾小仙

AI论文解读丨融合视觉、语义、关系多模态信息的文档版面分析架构VSR

华为云开发者联盟

语义 视觉 多模态信息 文档版式 VSR

CloudQuery 首次开放API,v1.4.1将开放「部门导入」和「用户导入」

BinTools图尔兹

数据库 OpenAPI 数据库管控

第三届WICC北京落幕 展现开发者服务生态与建设新方向

融云 RongCloud

今晚拿下PHP反序列化的一系列操作

网络安全学海

php 网络安全 信息安全 渗透测试 漏洞分析

网络攻防学习笔记 Day89

穿过生命散发芬芳

网络攻防 7月日更

Linux之top命令

入门小站

Linux

坐下来谈谈如何写好一份简历?

童欧巴

面试 大前端 简历

如何对抗信息茧房?

caiyongji

程序员 信息茧房

讲的是切片,但好像又不只是切片?

Gopher指北

Go 语言

腾讯被罚了!!!

Jackpop

在线常用crontab表达式大全验证解析

入门小站

工具

音视频延时和抖动问题分析和解决

hanaper

Druid 如何开启查询日志

HoneyMoose

程序员如何快速成长为IT精英

孙叫兽

程序员 成长 IT职场

超1500亿个文档,文档云原生时代的“规模之道”_云原生_罗燕珊_InfoQ精选文章