写点什么

智能体安全实践:可控与可靠|QCon 前瞻

  • 2026-03-30
    北京
  • 本文字数:1795 字

    阅读完需:约 6 分钟

Agent 具备自主行动能力后,安全边界需前移,智能体可靠性是核心保障。

4 月 16~18 日,QCon 全球软件开发大会将在北京进行。本次大会特别策划了专题《智能体安全实践:可控与可靠》,由蚂蚁集团副总裁兼首席技术安全官韦韬博士担任出品人。蚂蚁集团基础安全部副总经理,资深安全专家刘焱担任内容顾问。

韦韬,蚂蚁集团副总裁兼首席技术安全官,蚂蚁密算科技有限公司董事长,北京大学客座教授,九三学社浙江省委会数字经济专委会副主任,国家数据专家咨询委员会委员,全国数据标准化技术委员会委员,中国密码学会理事。发表学术论文近百篇,引用超过 5700,获得授权专利四十余项,领导和推动了“隐语”、“星绽”等多项著名开源安全软件的研发。韦韬博士首创并率队实现了安全平行切面防御体系、密态计算技术体系、大模型高阶程序体系等,在网络安全、数据要素与人工智能应用等领域做出了重要贡献。韦韬博士因其杰出贡献获“2021 年度数据智能新势力领军人物”、2022 数字中国建设峰会“十大数字硬核科技奖”等奖项,蚂蚁密算也获评 2025 年世界互联网大会杰出贡献奖。

本专题融合可靠性建设,聚焦权限控制、行为约束等要点,探索在不压制能力的前提下,实现智能体可控、可靠、可审计、可追责的路径,平衡技术价值与安全合规。

实践主题前瞻

演讲推荐一:筚路蓝缕:支付宝智能体互联 AHA 方案全链路安全设计实践

我们正在从移动互联网时代迈进到 AI 时代,数字服务技术生态也正在从超级 APP+小程序的模式向着智能体互联模式演进,AI 技术的突破正在重构原有的技术生态。作为生活服务生态的超大型平台,支付宝在此背景下提出了“智能体互联”解决方案——AHA(Agent Hub Access),旨在连接手机、车机、眼镜等多端智能体,实现跨终端、跨生态的“所想即所得”服务革命。

支付宝 AHA 作为一个生态性的方案,在不增加方案复杂度、确保使用体验的前提下,如何通过优雅的安全架构设计实现其技术方案、互联协议、数据隐私的安全可信,将成为成败的关键。

本次演讲中,蚂蚁集团支付宝终端技术安全团队负责人陈文波(闻计)将介绍,支付宝围绕 AHA 所开展的安全架构设计、安全流程保障与纵深防御体系建设实践,重点覆盖协议安全、应用安全与数据隐私安全等核心维度,形成面向全链路的安全保障能力,为 AHA 生态建设夯实安全基础。

演讲推荐二:智能终端行业 Agentic AI 业务 Red Team 实践

随着智能终端行业从“执行式智能”向“自主式智能(Agentic AI)”演进,AI 系统的自主性、跨域规划能力及环境感知能力大幅提升,但也带来了前所未有的安全挑战。信任成为了 AI 治理的核心目标。面对神经网络的“黑盒”特性及复杂的供应链风险,传统的安全设计(Design)思路已难以为继,必须转向以发现(Discovery)为核心的治理模式。

本议题 vivo AI 安全工程师张栋 将分享 vivo 在 AI 业务安全治理中的实战经验,深度解析如何构建覆盖 6 大领域、103 项风险条目的 AI 安全治理框架。重点阐述 Red Team(红队)在业务全流程中的定位与实践,包括基于“思维偏误理论”的新型攻击探索、针对 Agentic AI 的威胁建模,以及在 Deep Research、Code Agent 及多模态推理等场景下的真实攻防案例,为行业提供一套可落地的端侧 AI 安全治理范式。

演讲推荐三:智能体安全技术体系构建:评测、解释与防御

人工智能技术正从以大语言模型为代表的对话模型,加速向能自主规划、调用工具、执行复杂任务的智能体,以及能够理解物理世界、进行预测和规划的“具身智能”演进。近期,OpenClaw 这类可直接接入邮件、日程、文件和终端环境的智能体产品快速走热,但安全问题成为约束其落地的关键因素。

本次演讲清华大学副教授邱寒博士将介绍针对智能体安全体系的思考和技术实践,包括针对智能体安全的评测、针对智能体行为的解释技术、以及针对智能体风险的防范方法。

演讲推荐四:智能体安全:基于 AI Native 的防御架构和实践

智能体正在成为 AI 应用的核心形态,但其自主性、工具调用和多步推理能力也带来了独特安全挑战。相比传统应用安全,智能体面临 Prompt 注入、工具滥用、目标劫持、记忆投毒、执行失控等新型威胁。

本议题京东集团信息安全部 AI 安全负责人Sunny Duan将从企业级 Agent 平台的安全实践出发,剖析智能体的五层攻击面模型,介绍京东安全基于 JoySafety 框架和 JoySafeter 平台构建的可控安全架构。重点分享:输入防火墙、Skills 沙箱隔离、执行链管控、可观测性审计等核心能力的工程实现,以及如何实现安全左移和防御前置的智能体安全体系。