【FCon上海】与行业领袖共话AI大模型、数字化风控等前沿技术。 了解详情
写点什么

超 1500 亿个文档,文档云原生时代的“规模之道”

  • 2022-08-28
    北京
  • 本文字数:1985 字

    阅读完需:约 7 分钟

超1500亿个文档,文档云原生时代的“规模之道”

AI 大模型超全落地场景&金融应用实践,8 月 16 - 19 日 FCon x AICon 大会联诀来袭、干货翻倍!

办公软件正在进入云原生时代,软件架构设计也随之发生转变。8 月 26 日,金山办公在珠海举办以「规模之道」为主题的 2022 年技术开放日活动。


会上,金山办公技术委员会执行主席皮霞林透露了 3 组数据,金山办公的月度活跃设备数总量达 5.7 亿(其中 PC 端为 2.32 亿,移动端为 3.34 亿);此外,WPS PC 端 Office 的覆盖率,截至 6 月底录得 68.7%;云端文档数量已经突破 1500 亿,存储空间已经超过 270PB。


“在这么大的体量下,用户这么多文档存在上面,我们非常关心用户最核心的需求是什么?”皮霞林指出,如今金山办公拥有如此大体量的用户和数据,内部最关注的用户核心需求主要有两点,第一是文档上云以后,任何一个设备只要网络是正常的,就应该能随时随地访问文件;第二个是文件存在上面必须是安全的。


金山办公高级研发总监、云平台负责人黄传通表示,当前我们已经迈入“文档云原生时代”,并在主题演讲中,分享了软件开发的架构设计如何适应云原生环境。


据介绍,为了支撑云办公服务的业务形态发展,从 2009 年至 2022 年,WPS 云服务的架构演化,历经了从单体式应用到分布式架构,再到 DevOps+容器化、微服务化,以及正式进入云原生提供混合云可伸缩能力四个时代。整个过程,对于服务研发的“速度”和“敏捷”指标都提出了极高的要求:比如必须支持大规模云服务快速更新的能力、服务必须具有高健壮性、故障自愈能力等等。



从整体架构设计来看,WPS 的云原生底座是混合云架构,为打造运行环境自研了 KAE(Kingsoft App Engine),实现微服务管理、容器管理、应用伸缩性。其代码在研发阶段就应用了自动化测试,运维阶段引入了堡垒机,以做到严格的管理管控。在微服务方面,内部统计显示在测试环境和生产环境上总数达 13600+,每天有 310 次的更新部署。



黄传通强调道,金山办公近年来正大力投入云原生的安全基础设施建设,着手建设“两地三中心”(生产中心、同城容灾中心、异地容灾中心),所有的数据都会在不同区域备份,极端灾害情况下可做到秒级切换能力,过去一年已实现“四个 9”级别服务高可用性——全年 99.99%以上时间服务可用。


云原生是一整套体系,包含了从开发,部署到运维的完整技术栈。除了开发,云上的运维技术发展也日新月异,尤其是面向私有化部署。


金山办公私有云专家陈良表示,金山文档属于公网产品,它采用了原生的技术栈,随着互联网的技术发展,以容器为核心技术的原生技术能解决大部分应用部署,包括资源的管理和协调的问题,但是对私有化的交付并不太友好。据其介绍,金山办公在私有云底座体系建设上,支持批量做构建,支持跨指令级;提供 PAAS 平台,构建在企业提供的 SAAS 平台技术上,提供全自动化部署的能力。另外,在云端提供了一个聚合系统,并不是交付到企业客户,而是在公网提供一个聚合平台,专门收集项目的巡检报告、告警信息等等,帮助他们更好地了解项目的运行情况。



陈良坦言,上述这套体系并不是一蹴而成的,也是经过多年的迭代。2017 年处于脚本化的时代,不支持多种私有化平台兼容,导致部署效率,交付周期会非常长。2018 年进行改造,兼容更多的操作系统,进入工具化时代。到 2019 年,随着私有化项目逐渐铺开,一系列运维的问题日渐凸显,内部立专项做平台化的建设,通过可视化的方式进行纳管。2022 年,开始向智能化的方向演变。


2022 年,北京冬奥会成功举办,这是迄今观看人数最多、数字化程度最高的一届冬奥会。


作为官方协同办公软件供应商,金山办公为冬奥组委提供了一套私有云部署解决方案,方案采用了云原生的技术栈,支持文档的云端存储、文档的多人在线协同等。


陈良在分享中表示:“在冬奥会案例中,金山办公面临两方面挑战:首先是跨区域的办公协同,包含场馆、团队与总部员工的办公协同,以及与国际奥组委的协同,特点是部署环境复杂、运维难,可用性保障难;其次,冬奥会的数据安全要求是国际顶尖水准级别的。”


为了解决这两个难题,金山办公原创设计了一套“私有云底座”(kubewps),并形成了一套标准的“1 小时”高效部署服务流程:

  • 第一,实现环境容器化,屏蔽环境差异、兼容多操作系统解决部署依赖问题;

  • 第二,实现配置模板化,事前根据节点数预定义最佳的角色分配,减少赛事后期配置;

  • 第三,管理平台化,为冬奥组委提供了一套可视化运维系统,清晰展现监控运维成果。


历经 800 余天,金山办公协助北京冬奥组委技术部完成了协同办公系统及其余 3 个业务系统的自主研发建设,共计处理问题工单 800 余次,提供超过 4000 小时技术保障,达成 100%问题解决率,以“零事故”成果圆满完成赛事保障任务。


据 2021 年报数据,2021 年金山办公产研费用投入 10.82 亿元,研发围绕“云和数字化”方向做长期储备,投入不断加码。最新数据显示,金山办公研发总人数 2816 人,研发人员占公司人员总数比例近七成。金山办公表示,为了适应产业不断提出的需求,金山办公产研团队将持续把握技术趋势的变化,坚持探索新一代办公产品形态。


延展阅读:

《这么多年,我在 WPS 折腾些什么?》

2022-08-28 23:088038

评论 1 条评论

发布
用户头像
强者愈强,弱者愈弱
2022-08-30 08:19 · 浙江
回复
没有更多了
发现更多内容

谈谈统计学正态分布阈值原理在数据分析工作中的运用

vivo互联网技术

大数据 正态分布 核心

项目管理全史(持续更新)

Ian哥

28天写作

C2C场外交易系统APP开发|C2C场外交易软件开发

系统开发

20 行代码:Serverless 架构下用 Python 轻松搞定图像分类和预测

阿里巴巴云原生

人工智能 机器学习 深度学习 Serverless 云原生

时间是最大的变量

石君

时间 28天写作

SpringCloud 从入门到精通 13---Nacos集群搭建

Felix

招投标挖坑、防坑指南

浪潮云

tob 招标 投标

Soul 学习笔记---数据同步 websocket 连接建立过程分析(五)

fightingting

Soul网关

【总结】产品经理训练营 | 01 认识产品经理

阿席达卡。

产品经理-第一周作业

LLL777

送你一个造梦机器,然后入眠「幻想短篇 12/28」

道伟

28天写作

“数据库网络故障”愁坏了头,五种方法带你解难题

华为云开发者联盟

数据库 数据 GaussDB 网络故障 丢包

详解MySQL执行事务的语法和流程

华为云开发者联盟

MySQL 数据库 事务 服务器 SQL语法

uni-app的发展和应用

anyRTC开发者

uni-app 音视频 WebRTC sdk 安卓

NanoDet:这是个小于4M超轻量目标检测模型

华为云开发者联盟

PyTorch 目标检测 yolo nanodet

产品经理训练营第一章作业

阿波

[讨论]几个能有效应对 35 岁危机的办法

穿甲兵

智汇华云 | ArcherOS Stack利旧FC-SAN存储

华云数据

存储

花一分钟体验大数据任务调度系统 - Apache DolphinScheduler 第一个官方 Docker 镜像

代立冬

大数据 workflow 任务编排

豆瓣9.5分,它是Scala领域当之无愧的王者之作!

博文视点Broadview

scala 编程语言 豆瓣高分

成年人最渴望的奖励就是成功 Jan 20, 2021

王泰

28天写作

如何成为分享高手(上)

熊斌

个人成长 28天写作

Soul 网关实践 05|sofa服务&SpringCloud服务接入网关

哼干嘛

透过现象看本质:Java类动态加载和热替换

华为云开发者联盟

Java JVM 插件 类加载器 热替换

交易所APP系统软件开发案例

系统开发

金融互联网产品经理

Shine man

产品经理岗位招聘分析

Nemo

两万字长文总结,梳理 Java 入门进阶那些事

程序员小跃

Java redis 架构 后端 面向对象编程

第一章作业(2021-1-19)

邓嘉华

绩效管理,上下同心者胜(四 完结篇)

一笑

管理 绩效 28天写作

张小龙关于微信十年的产品思考 | 视频号 28 天 (13)

赵新龙

28天写作

超1500亿个文档,文档云原生时代的“规模之道”_云原生_罗燕珊_InfoQ精选文章