阿里、蚂蚁、晟腾、中科加禾精彩分享 AI 基础设施洞见,现购票可享受 9 折优惠 |AICon 了解详情
写点什么

360 大数据中心总监:如何制定可奏效的数据安全体系

  • 2019-06-12
  • 本文字数:4106 字

    阅读完需:约 13 分钟

360大数据中心总监:如何制定可奏效的数据安全体系

本文由 dbaplus 社群授权转载。

管理者的认知决定企业数据安全建设能否真正发挥价值

Q1:近年来发生的数据安全事件可以说到了屡见不鲜的程度,在您看来目前乃至今后较长一段时间,企业面临着哪些关键的数据安全隐患和挑战?


A1:首先我认为对企业而言「数据安全」其实并不是一个全新的话题。


为什么这么说呢?企业存在于社会之中,从诞生之日起,为了保证自身的持续正常运转,对内会有一系列的人员合作,对外会和其他的企业以及个人发生事务往来。那么在这个过程中不可避免的会有信息交换,有信息交换自然就会有数据安全风险。


那为什么我们还要提及这个话题呢?因为信息交换的动作对企业而言持续存在。


随着现代社会科学技术的不断演进,信息技术的快速发展和应用,使得全行业信息化的程度全面提升,整个社会的数据正在以前所未有的速度快速增长,呈现出数量大、来源广、种类多的特点,这些数据渗透到了各行各业,并逐渐成为企业的重要生产要素之一。



这个时代数据已经无处不在、如影随形,我们今天讨论的议题也是以大数据为背景展开,来探讨数据安全相关的问题,并不是传统的数据安全。从这个角度来说这也算是一个新的话题。


数据安全这个话题虽然在概念上看比较的单一,但实际上覆盖面广、内容全,同时还涉及到很多重要的因素。


那么对企业而言,会面临哪些安全隐患和挑战其实是一个比较大的话题,从我自身的角度来看,可以分为三个方面:


  • 首先是法规流程方面。随着云计算、大数据技术的逐步应用,数据自身的形态、数据使用的方式都在不断增加和变化,且这种发展趋势会变得越来越快。那么企业在这种大趋势下如何保证在法规流程上的系统性、时代感是需要优先考虑的要素。

  • 其次在系统建设方面。数据安全本身不会产生价值,所以很多时候在系统建设初期为了快速构建,往往把安全相关的能力优先级放低,甚至在很长一段时间缺失。数据在系统中裸奔,一旦出现数据泄漏将会引起不可预知的损失。

  • 另一方面由于在系统建设初期对安全能力的忽视,导致后期增加安全能力会变得更加困难,甚至需要调整系统架构,无形之中增加了企业的投入成本。

  • 最后是管理者认知方面。随着今年来大大小小的数据安全事件频繁发生,给企业和个人带来了严重后果,企业管理层在对保障数据安全上基本高度一致。

  • 但只做到意识形态上的认知是不够的,甚至对企业的安全建设起到反作用。管理者如果只关注数据本身的安全,就会导致安全体系的建设片面,最终无法达到对数据进行安全管控的效果。殊不知要保障数据安全不只是在数据层面。

  • 相反如果管理者对数据安全的建设走大而全的路线,可能这个目标永远都是水中月、镜中花,看似美好却无法达成。我认为最后一点也是最重要的一点,它决定了企业能否真正将数据安全的建设落到实处并发挥其价值。

如何制定真正可奏效的数据安全治理方案

Q2:面对这些数据安全风险,您在制定及落实真正得以奏效的安全治理方案上有什么建议?


A2:正如我之前所说,企业的数据安全体系建设是一个非常大的话题,我还是结合我所从事的工作,谈谈在大数据中心建设过程中所面临的一些具体的问题和挑战以及解决思路和方案。


随着公司的发展、产品形态上的调整,产品覆盖面越来越广,在数据层面呈现出数据海量、存储分散、用途多样的特点。



大数据中心作为公司数据中场部门,除了自身数据平台和服务能力的建设,还要面对来自各个业务部门的数据分析需求,在处理这些需求的过程中遇到了各种数据安全相关的问题。


数据集中存放,如何做到数据平台管理和数据访问的权限分离?每个业务部门有多个角色,每个角色对应的数据权限都可能不一样,如何有效控制?数据一旦发生泄漏风险,如果做到溯源?跨产品的数据如何安全的共享?



类似这样的问题还有很多,这些问题对大数据中心的发展提出了一系列的挑战,可以归纳为四个方面:


  • 平台层面的保障:传统的权限控制通常是以系统功能为中心来进行设计,通过控制用户对功能的访问来达到权限控制的目的。这种控制方式在大数据中心已经捉襟见肘,比如对于同一个数据分析功能,不同产品的分析人员只能操作本产品的数据;

  • 数据层面的保障:大数据中心面向公司所有的产品负责提供数据处理的能力,那么业务数据每天都在平台上流转,如何合理控制数据平台工程师对业务数据的访问;

  • 风险预防和审计:产品的业务形态决定了其系统设计,在其不断演进过程中,数据模型也在不断演进,必然会持续产生一些脏数据,要保证数据的质量,在数据治理环节会加入更多的人工参与,也增加数据泄漏的风险;

  • 流程和制度:哪些数据可以公开、公开的范围是多广?数据可以给哪些人使用?某个业务部门想使用另外一个业务部门的数据,应该走什么样的流程?处理这些事情在很长一段时间都是见招拆招,看起来很灵活其实毫无规则可言。


随着大数据中心业务的不断发展,这些问题带来的影响已经愈发明显,那么该如何有效解决,让大数据中心摆脱困扰,更加高效的去支撑整个公司的产品呢?


其实问题“千千万”,都是数据“惹得祸”。我们要使用数据、分析数据,发挥数据的价值,所以不可避免的要接触数据,数据安全问题也因此产生了。



以终为始,我们在构建数据安全体系的指导原则就是,明确“让数据更加安全的被使用”的目标,打造以“数据”为中心,结合“平台能力”、“隐私管理”、“法规流程”三个要素,构建具有公司特色的数据安全体系,系统化解决数据安全问题,发挥数据的更大价值。


这里需要说明的是数据安全风险会一直存在,安全体系建设是尽可能地降低发生风险的几率,让数据分析人员能使用更多的数据、让数据开发人员尽可能聚焦在数据应用本身。

360 大数据平台安全能力建设

Q3:能否以 360 自身经验为例,具体剖析其大数据平台在安全能力方面的设计思路、架构搭建,以及应用实践?


A3:变动就一定会带来阵痛,在进行大数据平台安全能力建设之初,我们也遇到了不少困难。


首先,在规范治理方面。数据安全能力建设包含了安全规范的治理,这种规范的治理势必会固化数据安全相关流程。


流程上的变动对产品部门会有感知,而安全能力建设的价值又很难呈现给产品,如何平衡这中间的矛盾?


既然大数据中心是整个公司中场部门,负责支撑全公司的数据业务,安全规范的治理采取了自上而下的策略,联合公司法务和隐私相关部门共同制定,最终完成 360 集团数据安全管理规范,让数据的使用合理、合规、合法,这也让我们的治理工作多了一份理解、少了一些阻力。



其次,在系统治理方面。大数据中心的系统建设已经到了一定阶段,按照全新的系统去设计显然不适合,数据安全能力如何和当前系统平滑融合对我们也是一个考验。


这里要说明下很多公司在开发系统之初,往往会优先开发系统中的业务功能,把安全能力的优先级降低或者是做一些简单的安全加固能力,等到想系统化建设安全能力的时候发现已经没有那么简单,系统留出的可改造空间非常受限。


回顾系统治理的过程,我们主要做了两个维度的重构:


  • 一是以数据资产为中心对系统进行了服务化改造;

  • 二是围绕数据的全生命周期建设数据系统安全。


服务化能力让系统高内聚、低耦合,系统功能易于扩展,在增加安全能力的同时也减少了对原有系统的侵入;数据应用的全生命周期让安全治理有一个明确的范围标准,这在最大程度保证了安全能力的全覆盖。


基于这样的设计思想,整个大数据平台的安全能力在原有架构上进行了从“点”到“面”的一个改造。



在数据共享方面,我们知道通常系统允许用户以文件或者图片的形式保存数据,并在保存文件中添加水印信息,用于在信息被非法传播之后的溯源,如果用户对单条数据进行复制传播的话,系统往往不能有效进行控制,


比如在数据查询结果页中通过复制粘贴将信息转发。类似场景还有很多,针对这些数据共享场景,我们引入了纯文本数字水印技术,保证在最小粒度层面的数据溯源能力。



最后以权限系统为例谈谈单系统的治理。如上所说,老的权限系统主要是完成系统鉴权和功能控制,无法支撑大数据中心现有的业务场景,比如对数据层面进行不同维度的访问控制。


那么如何在现有权限模型的基础上进行扩展,以适配当前的业务场景呢?我们对权限做了扩展,将其定义为“资源+操作”一种组合,对于菜单、页面、按钮、表、字段、任务、拓扑等进行了泛化,统一定义为资源,既保证了数据鉴权流程的稳定,又灵活应对了由于数据类型繁多带来的不确定性。



结合数据中心的职能定位和业务场景,将应用、菜单、服务、数据四个维度纳入权限系统管理,给权限系统赋予了新的定位-一站式权限管控中心。


上云一时爽,冲动上云一身霜

Q4:除了企业内部的大数据平台建设以外,在数据上云的大势所趋之下,如何确保云上的数据安全?


A4:十多年前,亚马逊推出云计算服务的时候,云服务还鲜有人问津。十年之后的现在,随着云计算的高速发展,越来越多的企业开始了云化转型。


即使这样,我觉得企业在决定是否云化之前先要回答几个问题:为什么要上云?通过上云要取得的短期目标是什么?中长期目标又是什么?


通过回答这些问题来思考云化对自身来说是否真的需要。实际应用中,云化对一些企业所带来的价值远小于其投入,甚至都无法持续支撑后期的运维,那么这个时候可能就需要规划另外的资源优化模式。


对于已经准备上云的企业来说,首先要确定采用什么样的云化方案。是选择公有云、私有云还是混合云,不同的方案其数据安全策略也是不一样的。


其次不要单纯依赖云服务商提供的数据管理能力。云平台有助于实现数据的集中管理,提升企业的数据共享能力,同时也增加数据泄漏和丢失的风险。数据一定要有备份方案将安全隐患降到最低,比如多云或者异地存储等。


最后要建立全面完善的云服务协议。上云只是企业云化的开始,未来企业系统将会持续运行在云上,在这个过程中云平台自身难免不会不出现问题。如何保证云平台的服务响应速度和解决问题的效率,这不单单依靠云服务商本身的服务标准,而是需要企业结合自身的要求和云服务商共同完成服务协议的制定,让企业尤其是中小企业在产生问题之后可以有更多的话语权,将企业的损失尽可能降到最低。

作者介绍

徐皓


现任奇虎 360 大数据中心技术总监,数据中心技术团队负责人,负责数据中心平台的规划和建设工作,主导并参与了数据中心全新一代平台的研发。曾就职于华为技术有限公司,从事平台相关研发工作,涉及大数据、中间件、云等相关领域。


2019-06-12 08:006970
用户头像
dbaplus社群 数据连接未来

发布了 176 篇内容, 共 71.0 次阅读, 收获喜欢 599 次。

关注

评论

发布
暂无评论
发现更多内容

ChatGPT 来了,MySQL DBA 会失业吗?| StoneDB 数据库观察 #10

StoneDB

数据库 StoneDB ChatGPT

如何在 Ubuntu 22.04 下编译 StoneDB for MySQL 8.0 | StoneDB 使用教程 #1

StoneDB

数据库 StoneDB

超级应用App的概念及构建思路

Onegun

小程序 小程序容器 超级应用

【HDC.Cloud 2023】华为云区块链分论坛内容值得再读!

华为云开发者联盟

区块链 后端 华为云 华为云开发者联盟 企业号 7 月 PK 榜

MyBatis条件查询

猫九

解密Prompt系列4. 升级Instruction Tuning:Flan/T0/InstructGPT/TKInstruct

不在线第一只蜗牛

架构 指令

响应式编程:Vert.x官网学习

越长大越悲伤

响应式编程 JVM Vert.x

语音平台源码搭建开发之表情功能的实现

山东布谷科技

软件开发 语音 直播 源码搭建 语音厅平台搭建

技术领先、“忠”于业务,用友助力企业实现价值化国产替代

用友BIP

7.12下午两点开启直播!《数智企业@中国》走进泰开集团

用友BIP

数智企业

方言语音识别数据驱动人工智能的多元文化发展

来自四九城儿

方言语音

人工智能的底层逻辑

博文视点Broadview

速度与技能的较量!飞桨黑客松 OpenVINO™ 任务获奖者经验分享

飞桨PaddlePaddle

MySQL 中索引是如何实现的,有哪些类型的索引,如何进行优化索引

EquatorCoco

MySQL 数据库 索引

春去夏来,火热发版:StoneDB-8.0-v1.0.1-beta 版本正式发布!

StoneDB

数据库 StoneDB

北京汽车牵手火山引擎数智平台,探寻车企数字化升级新通路

字节跳动数据平台

数字化 数字化升级 车企 企业号 7 月 PK 榜

一文吃透CSS样式中颜色与颜色值的应用

这我可不懂

CSS

三问三答:细数GaussDB迁移的核心技术

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 企业号 7 月 PK 榜

2023年最具威胁的25种安全漏洞(CWE TOP 25)

华为云开发者联盟

安全 华为云 安全漏洞 华为云开发者联盟 企业号 7 月 PK 榜

软件定义汽车场景中的数据流处理

EMQ映云科技

车联网 mqtt 数据流

数智化的核心在于构建底座,看这家数科公司如何与传统厂商双赢双生

用友BIP

数智底座 数科公司

码中寻趣:低码专家与开发者的「神秘会议」 ——华为云Astro扫地僧出山

华为云PaaS服务小智

云计算 低代码 华为云 华为开发者大会2023 Astro

火热的低代码和无代码赛道

互联网工科生

软件开发 低代码 无代码 应用开发

华为云张鹏:华为云盘古大模型及MetaStudio亮相新媒体大会,使能融媒创新

新消费日报

沉潜蓄势,厚积薄发:StoneDB-5.7-V1.0.4版本正式发布!特性增强,稳定性大幅提升

StoneDB

数据库 版本发布 StoneDB

人工智能机器学习底层原理剖析,人造神经元,您一定能看懂,通俗解释把AI“黑话”转化为“白话文”

快乐非自愿限量之名

人工智能 机器学习

用友BIP全球司库“五大管家”,助力大型企业一流司库建设

用友BIP

全球司库

谁能真正替代你?AI辅助编码工具深度对比(chatGPT/Copilot/Cursor/New Bing)

快乐非自愿限量之名

工具 ChatGPT AI赋能 AI工具

Cloud Kernel SIG月度动态:ANCK 5.10-016将落地kABI机制,5.10-015版本规划发布

OpenAnolis小助手

操作系统 内核 anck 龙蜥sig 版本规划

看完这篇异地多活的改造,我决定和架构师battle一下

得物技术

架构 构架师

为什么选择美国虚拟主机是你的明智之选?

一只扑棱蛾子

美国虚拟主机

360大数据中心总监:如何制定可奏效的数据安全体系_安全_dbaplus社群_InfoQ精选文章