NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

解读数字化转型下的数据安全:AI 正在开辟新的可能性

  • 2021-12-19
  • 本文字数:3753 字

    阅读完需:约 12 分钟

解读数字化转型下的数据安全:AI正在开辟新的可能性

在信息化浪潮下,传统产业数字化转型方兴未艾,网络安全问题也得到了更多关注。随着《网络安全法》《数据安全法》《个人信息保护法》相继公布并实施,企业如何保障数字化转型安全成为必解课题。


11 月 14 日,国家互联网信息办公室发布关于《网络数据安全管理条例(征求意见稿)》公开征求意见的通知。通知指出,为落实《中华人民共和国网络安全法》《中华人民共和国数据安全法》《中华人民共和国个人信息保护法》等法律关于数据安全管理的规定,规范网络数据处理活动,保护个人、组织在网络空间的合法权益,维护国家安全和公共利益,根据国务院 2021 年立法计划,国家互联网信息办公室会同相关部门研究起草《网络数据安全管理条例(征求意见稿)》,现向社会公开征求意见。意见反馈截止时间为 2021 年 12 月 13 日。


《网络数据安全管理条例(征求意见稿)》(以下简称“征求意见稿”)共包含 75 条条例,对包括数据泄露、自动化工具(如爬虫)、大数据杀熟、人脸识别等在内的数据安全问题提出了更明确的参考法规。日前,InfoQ 邀请到 Zilliz 研发效能高级经理沈立彬为我们解读数字化转型下的数据安全问题。Zilliz 是一家开源基础软件公司,专注于研发非结构化数据库系统,为各种 AI 应用提供数据基础设施。

《网络数据安全管理条例》拟落地,意味着什么?


《网络安全法》《数据安全法》《个人信息保护法》这三大上位法搭建了我国数据合规的主要法律架构,也是我国网络安全与数据合规领域的基础性法律。如果用软件来进行类比,三大上位法相当于软件架构,承载了软件的整体脉络和大方向,但却不够细化,在执行上缺少具体的参照。而《网络数据安全管理条例》的出台则恰恰补足了这一点。


首先在执行层面上,《网络数据安全管理条例》中的很多条款都是在具象实施路径,对三大上位法中未明确的数字做了进一步明确要求。比如征求意见稿第十三条中规定,处理一百万人以上个人信息的数据处理者赴国外上市的数据处理者,应当按照国家有关规定,申报网络安全审查;第三十九条规定,数据处理者向境外提供数据应当存留相关日志记录和数据出境审批记录三年以上。


其次,《网络数据安全管理条例》在上位法的基础上做了很多原则上的细化。比如《个人信息保护法》第五条规定,处理个人信息应当遵循合法、正当、必要和诚信原则,不得通过误导、欺诈、胁迫等方式处理个人信息。征求意见稿第十九条就对此做了进一步的明确规定,逐条阐释了合法、正当、必要:


数据处理者处理个人信息,应当具有明确、合理的目的,遵循合法、正当、必要的原则。基于个人同意处理个人信息的,应当满足以下要求:(一)处理的个人信息是提供服务所必需的,或者是履行法律、行政法规规定的义务所必需的;(二)限于实现处理目的最短周期、最低频次,采取对个人权益影响最小的方式;(三)不得因个人拒绝提供服务必需的个人信息以外的信息,拒绝提供服务或者干扰个人正常使用服务。


在沈立彬看来,《网络数据安全管理条例》拟落地对个人和企业都将产生深远的影响。


对个人而言,个人基础信息数据可以得到充分的保障,能够越来越清楚地知道自己的信息为何被采集、哪些信息被采集、被采集的信息如何被使用、信息是否提供给第三方等。在过去,缺少相关法律的明确制约,一些公司游走在黑灰产的边缘,致使用户信息被泄露,严重影响用户个人生活和人身财产安全。而随着《网络数据安全管理条例》的落地,这一乱象也将得到相应治理。


对企业而言,既有上位法的基本框架,又有条例的具体指导,企业需要做的就是积极学习,依据相关合规要求加快整改。同时也需要认识到,市场将不再野蛮式增长,资本不能凌驾于数据安全之上,有数据风险的企业一定会面临巨大的监管和处罚压力。


在短期内,企业必定会增加合规建设的投入,包括资金、人力、时间等成本。但是从长期来看,这些法律法规将引导我国数据安全体系在未来有一个相对清晰的演进路线,帮助企业合规、合法使用数据,同时又能保护用户的个人利益。


在技术层面上,沈立彬认为一些行业以及细分领域将迎来新的机遇。“数据安全及隐私保护处在新的风口上,整个行业将会投入更多的精力和资源来建设。对于加密,密码技术,认证技术、脱敏技术、存储技术等都会有较大的促进作用,同时也带来合规、咨询等安全服务产业的发展。”

构建非结构化数据安全解决方案


当前,随着企业数字化转型进程加快,新技术和新架构的演进也给企业的数据安全带来更高的要求。沈立彬表示,目前企业在数据安全方面通常面临以下挑战:


  • 首先是资源投入的问题。对于一些业务型的中小企业来说,本身技术投入不足,对数据的合规治理会产生较大挑战。

  • 其次,对于有能力进行合规改造的企业而言,业务部门的交付速度和基础部门因合规建设带来的延迟也是难以调和的矛盾。

  • 再者,一些企业的软件研发人员长期忽视数据安全,进行合规建设之后,会产生一个自以为的“工程师文化”和规范的流程/规则之间的矛盾。


另一方面,据 IDC 预测,2018 年到 2025 年之间,全球产生的数据量将会从 33 ZB 增长到 175 ZB,其中超过 80% 的数据都会是非结构化数据。如果说结构化数据是机器可读的数据,那么非结构化数据就是人类可读的数据,由人类活动所产生,包括图片、视频、语音和文字等。


相比于传统的结构化数据和半结构化数据,非结构化数据数据量庞大(总量大 3 个数量级以上),增长速度更快(每 1KB 结构化数据产生的同时,约有 1GB 非结构化数据产生),并且采集渠道广泛,数据的处理链路非常长。这些都给非结构化数据的安全防护带来挑战。


数据的安全解决方案是一系列的流程+规范+技术的综合保障。沈立彬认为,在构建非结构化数据的安全解决方案时,应先着重解决其当前面临的问题。“非结构化数据的处理有一个核心的矛盾点是,数据处理者(业务方)有海量的数据和数据价值挖掘的需求,但是这些业务型企业的技术投入往往不足。因此这类企业在构建数据安全解决方案时,需要积极引入整个生命周期内不同角色的解决方案来协同工作。”


以数据防泄露为例,一些科技企业在做非结构化数据安全建设时普遍会考虑在内部环境上部署 DLP(Data loss prevention)解决方案,一般会从使用状态下、存储状态下和传输状态下的泄密几个方面来进行保护。整个链接较长,并且相对复杂。因此,很多数据处理者会选择采用基础软件服务商提供的私有部署或者 SaaS 服务的能力,既不需要在基础安全能力建设上大幅投入,又能获得数据安全合规的保障。


“很多硅谷科技公司都是依赖这种模式,比如苹果做手机、电脑,它的技术能力很强,但它在做日志分析的时候,并不是自己养个一百人或几百人的团队来做这件事情,而是每年花几千万美金去采购成熟的日志分析的解决方案。”沈立彬说道。


作为一家 toB 的基础数据软件供应商,沈立彬坦言 Zilliz 身上的责任会更重。“我们的任何一个小问题都会给我们的客户带来巨大的麻烦,因为这些客户都是企业级客户,每个都可能在服务着成千上万,甚至亿级别的企业和个人用户。”为了能更好地支持下游生态企业在数据合规方面的建设,这也就要求基础软件提供商在产品和技术层面进一步加强合规建设。

AI 为网络安全开辟新的可能性


近年来,AI 技术在越来越多的领域发挥作用,并为数据安全合规带来了新的解题思路。


有数据显示,仅 2021 年上半年,勒索软件攻击就达到了 3.047 亿次,打破了 2020 年全年的攻击总数(3.046 亿次),同比增长 151%。与之相对应的是,企业在安全团队上的投入并没有增长 151%。


“在此背景下,AI 正在为网络安全开辟新的可能性。AI 会分析大量数据以加快响应时间,并赋能资源有限的安全团队。”沈立彬介绍道。


AI 会通过数十亿个攻击数据或漏洞数据进行训练,使用机器学习和深度学习技术来提高其认知,让机器能够“理解”不断变化的网络安全威胁。通过收集漏洞,并使用高级推理,AI 可以识别威胁之间的关系,例如恶意文件、可疑 IP 地址或内部人员。


“通过利用 AI + 大数据,可能只需要几秒钟,最多几分钟就可以分析出来,让安全分析师对威胁的响应速度提高几十倍,并为过度紧张的 IT 团队节省了宝贵的时间来专注于其他关键领域。”


今年 4 月,英国网络安全初创公司 Darktrace 成功上市,也证明了网络安全人工智能在检测复杂的在线攻击方面颇受欢迎。在国内,也有很多安全厂商积极引入 AI 技术,为安全监测能力赋能。


公开信息显示,Ziiliz 开发的面向 AI 非结构化数据处理的开源向量数据库 Milvus 已在 2020 年交由 Linux 基金会旗下的 LF AI & DATA 基金会托管,目前在全球范围内有超过 1000 家企业在使用 Milvus 构建上层的 AI 应用。


“Milvus 本身是开源产品,对数据安全方面的一些系统(开源或者闭源)有着天生的优良的互操作性和兼容性。同时我们也建设了完善的日志、metric 等机制,确保服务的调用和数据的流转都是可以被审计的。”下一步,Zilliz 将发布向量数据库的托管服务(DBaaS),在帮助客户大幅减小总体拥有成本 TCO(Total Cost of Ownership)的同时,进一步帮助数据使用方解决数据安全合规问题。

写在最后


随着企业数字化转型不断深入,沈立彬认为数据安全领域分工合作是长远的趋势。


基础软件提供商负责底层可用性、安全性、完整性方面的保障,业务方需要采购相关咨询服务进行定期审计。在合规的前提下,数据可以有效的进行流通,换取更多的价值。而对于开发者而言,在技术技能之外,也需要具备一定的数据安全合规意识。

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2021-12-19 14:003512

评论

发布
暂无评论
发现更多内容

分析商品详情页中的数据,以了解产品的特点和优势

技术冰糖葫芦

API 接口

一起学Elasticsearch系列-搜索推荐

Java随想录

Java 大数据 elastic 搜索

技术写作及技术作者的概述和重要性 - 了解技术写

小万哥

技术 程序人生 写作 软件开发 作者

基于模型驱动的可视化开发平台——JNPF

高端章鱼哥

低代码 可视化开发 JNPF

入门PostgreSQL:安装和设置数据库的完整指南!

互联网工科生

postgresql

Kyligence 荣登甲子光年 2023 AIGC 技术应用领域最具商业潜力榜

Kyligence

数据分析 智能决策

flutter 代码混淆

成功的云转型之路需要考虑的基本因素

这我可不懂

云计算

亚马逊云科技宣布推出四项Amazon Supply Chain新功能

财见

体育赛事为何成为各平台的“必争之地”与新兴变现模式

软件开发-梦幻运营部

2023-12-13:用go语言,密码是一串长度为n的小写字母,一则关于密码的线索纸条, 首先将字母a到z编号为0到25编号, 纸条上共有n个整数ai,其中a1表示密码里第一个字母的编号, 若i>1的

福大大架构师每日一题

福大大架构师每日一题

深入了解埋点分析:Clklog助你优化用户体验

ClkLog

让艺术触手可及!3DCAT实时云渲染赋能真浪数字艺术馆首展

3DCAT实时渲染

实时云渲染 元宇宙解决方案

想突破转化瓶颈?安排上 AI ,比漏斗图更高效、更实用!

Kyligence

数据分析 转化分析

高校刮起元宇宙风!3DCAT实时云渲染助力川轻化元校园建设

3DCAT实时渲染

实时云渲染 元宇宙解决方案

HarmonyOS NEXT分布式系统硬件资源池应用场景技术原理及接入实践

新消费日报

软件测试/人工智能丨计算机视觉场景中,处理视频/图片数据并测试

测试人

Apache IoTDB PMC Chair 黄向东主办 2023 开放原子开发者大会开源工业物联网大数据分论坛,诚邀您的参加!

Apache IoTDB

Trace 在多线程异步体系下传递

观测云

Trace 链路

第31期 | GPTSecurity周报

云起无垠

场场爆满的昇腾 AI 开发者创享日:照见产业数智化的涓涓动力

Alter

深度 | AI数据标注迈入自动化时代,26年老兵掘金全球智能汽车市场

澳鹏Appen

自动驾驶 数据标注 4D标注

一款最近很火的开源低代码平台

伤感汤姆布利柏

开源 低代码

物联网与低代码:构建智能化的连接世界

快乐非自愿限量之名

低代码 物联网 IoT

从Rustup出发看Rust语言的编译生态

程序饲养员

编译器 rust语言

多链铭文聚合协议20Exchange将为Ordi、SATS持仓用户快照空投

股市老人

实时数据推送应用

玄兴梦影

消息推送 实时数据

量化交易与人工智能:技术的交叉引发金融市场的变革

不在线第一只蜗牛

人工智能 金融 量化交易

dDapp发行代币合约质押挖矿系统开发丨详情开发

l8l259l3365

1.5万字 + 25张图盘点RocketMQ 11种消息类型,你知道几种?

快乐非自愿限量之名

RocketMQ 事务管理

马斯克回应聊天机器人 Grok 抄 ChatGPT 作业;Figma 推出宏编程键盘丨 RTE 开发者日报 Vol.105

声网

解读数字化转型下的数据安全:AI正在开辟新的可能性_安全_凌敏_InfoQ精选文章