写点什么

Agent 下一战,决胜“记忆”之巅——AICon 深度专题前瞻

  • 2026-04-15
    北京
  • 本文字数:2929 字

    阅读完需:约 10 分钟

当 AI 的发展浪潮从“聊天写诗”的通用大模型涌向“干活办事”的自主智能体,我们正站在一个全新的技术分水岭。Agent 的落地深水区,不在于一次惊艳的推理,而在于长期的稳定运行、持续的自我演进以及对用户意图的终极对齐。这一切的核心底座,正是被行业视为 Agent “大脑海马体”的记忆系统与数据基础设施。

2026 年 6 月 26 日-27 日 ,AICon 全球人工智能开发与应用大会即将落地上海,在《Agent 数据、记忆与运行时基础设施》专题中,我们邀请到了来自 EverMind、MemVerge 和 OPPO 的三位专家。他们将分别从操作系统级长期记忆架构、独立于模型的 AI Memory 中间件、以及端云协同的全模态记忆工程三个硬核维度,为您呈现一场关于 Agent 的技术分享。

越过幻觉,走向演进——当 Agent 拥有了“海马体”

演讲嘉宾:邓亚峰 | EverMind CEO,盛大集团副总裁,前 360 集团副总裁、人工智能研究院院长,前格灵深瞳 CTO

如果你关注最近的 Agent 领域动态,一定对 OpenClaw 不陌生。邓亚峰将以 OpenClaw 和近期行业热点事件为引子,抛出一个可能颠覆很多人认知的判断:从通用大模型向具备长期记忆和自我演进能力的 Agent 跨越,才是当前最具商业和技术落地价值的深水区。

他提出了一个非常有意思的框架来理解长期记忆的价值——记忆的三重境界。

第一重是降本增效。在上下文窗口依然受限且成本不菲的今天,如何更聪明地利用每一寸上下文空间,让 Agent 在有限的 Token 预算下依然保持强大的任务连贯性,这本身就是一项极具工程价值的能力。

第二重是个性对齐。让 Agent 记住你喜欢什么样的回复风格,记住你常用的工具组合,记住你反复提及的那些关键信息。这意味着 Agent 从“通用的工具”变成了“专属的伙伴”。

第三重也是最具想象力的一重,是自我演进。当 Agent 能够基于与你长期交互的历史数据进行反思、总结和提炼,在没有你手把手指导下也能自主优化行为策略时,它才真正具备了“成长”的属性。

当然,概念谁都会讲,关键看怎么落地。邓亚峰将在演讲中深度公开 EverOS 的架构细节。这套系统被定位为“AI 时代的长期记忆操作系统”,其底层基础设施叫 EverMemOS。更值得期待的是,他会详细解读 MSA(Memory Sparse Attention)模型的核心原理。面对海量的历史记忆数据,如何在保证召回精度的同时大幅降低检索计算开销,这是整个行业都在攻坚的难题。结合具体的数字助理场景案例,这场演讲会让你直观感受到,一个有长期记忆的 Agent 和一个只有“金鱼记忆”的 Agent,在用户体验上的差距究竟有多大。

把记忆从模型里“拆”出来——独立 AI Memory 系统的架构哲学

演讲嘉宾:范承工 | MemVerge 联合创始人兼 CEO,前猎豹移动 CTO,前 VMware 全球高级副总裁、存储事业部总经理

现在很多开发者做 Agent 记忆,思路都很直接:拉一个向量数据库,把历史对话存进去,用的时候检索召回,往上下文里一塞。听起来合理,但为什么一到 LoCoMo 这类严苛的长期记忆基准测试上,准确率就死活突破不了 90%?

范承工博士的履历横跨存储、虚拟化、大数据和 AI 多个领域,从 Rainfinity 到 VMware 再到猎豹移动,他对“数据如何被高效存取和管理”这件事的理解深度,在这个话题上恰好是最稀缺的视角。他的核心观点很明确:AI 记忆不应该被绑死在模型身上,它应该成为一个独立的基础设施层。

这场演讲的第一个重头戏,是完整拆解一套独立于大模型的 AI Memory 记忆系统的技术架构。他会讲清楚一个关键问题——AI 记忆系统、AI 大模型、AI Agent 这三者之间,到底应该是什么样的架构关系和交互接口设计。深入到存储层,你会发现光靠向量数据库是不够的。这套系统依托图数据库与向量数据库的混合存储架构,不同记忆类型走不同的存取路径。范博士还会重点解读这套系统如何实现 90% 以上 LoCoMo 准确率——这背后涉及检索策略、排序算法、记忆更新机制等一系列精巧设计。

第二个值得关注的点是场景落地。他会特别分享 OpenClaw 记忆插件场景下的实战经验。OpenClaw 的开发者们一定对 Token 消耗深有体会。范博士将展示一个非常实用的案例:通过独立的记忆插件设计,如何在提升 Agent 响应准确率的同时,实现 Token 消耗的大幅优化。具体的优化方案和效果对比数据,现场都会给出来。

最后,他会把目光投向更远的未来。个人用户如何在本地构建私有化记忆库,让 AI 在长期对话中真正懂你且隐私绝不外泄?企业如何部署独立的 AI 记忆系统,把散落在各个业务系统里的组织知识变成可继承的 Agent 资产?当记忆数据爆发式增长,共享、存储和隐私保护技术又该往哪个方向演进?这些问题都会在演讲中得到前瞻性的探讨。

让 AI 看懂你的截图和语音——OPPO 小布记忆的亿级工程实战

演讲嘉宾:王闯闯 | OPPO 高级算法工程师,小布记忆产品算法架构负责人

前两场演讲讲的是 Agent 记忆的底层架构和中台方案,到了第三场,我们来看看真实世界里的记忆系统是怎么跑起来的。王闯闯负责 OPPO 经手过多个 S 级和 A 级项目的考验。他要分享的,是一套从碎片化数据到结构化记忆的生产级完整链路。

问题从用户最熟悉的场景开始:你每天截图、发语音、拍视频、收文档,这些异构多模态的碎片内容,怎么才能被 AI 真正理解并自动整理成有用的记忆?王闯闯用三个词概括了核心挑战——模态异构理解、跨模态关联、结构化生成。每一个词背后都是一堆技术难题。

接下来是这场演讲最硬核的部分:一键闪记的整体架构。小布记忆的触发入口极其丰富,小布助手、魔方按键、三指上滑截屏、AI 流体云识别取餐码、密码本自动填充、日历同步、相机大师参数提取……几乎做到了用户无感的“随手记”。在端侧,这套系统跑的是 OPPO 自研的 AndesVL 多模态大模型,AIUnit 模块承载了 NER 和 OCR 提取、图片分类总结、结构化字段提取、取餐码识别、账单理解等一系列任务。云端则负责内容安全审核和那些端侧搞不定的复杂推理。

这里有一个非常复杂的设计叫端云任务分流。分流模块会对输入图文信息打分类标签,然后判断走端侧还是走云侧。直屏单任务、单标签单实例这类简单场景,占到了流量的 80%,全部端侧处理,又快又省又保护隐私。分屏多任务、多标签多实例这类复杂场景才上云,确保推理质量。这个分流机制的设计思路和边界定义逻辑,对于任何在做端云协同的团队来说都是可以直接借鉴的。

有了单条记忆的提取能力,下一步是聚合。王闯闯会详细讲关联记忆的多规则融合召回加 Rerank 加 LLM 精排的多级架构,以及合集归纳的三链路统一加 Reranker 加 Verify 两阶段聚合方案。这套方案的效果数据很能说明问题——合集创建准确率从 83% 干到了 97%,新记忆加入准确率从 76% 提升到了 95% 以上。

最后他还会分享 OPPO 内部的工程化方法论。Model Selection 到 Prompt Engineering 到 Business Benchmark 的流程化开发工作流,基于 LLM-as-a-Judge 的自动化评测体系,Badcase 反馈闭环——这些都是经过亿级用户场景验证过的实战经验,拿来就能用。

会议推荐:

世界模型的下一个突破在哪?Agent 从 Demo 到工程化还差什么?安全与可信这道坎怎么过?研发体系不重构,还能撑多久?AICon 上海站 2026,4 大核心专题等你来:世界模型与多模态智能突破、Agent 架构与工程化实践、Agent 安全与可信治理、企业级研发体系重构。14 个专题全面开放征稿。诚挚邀请你登台分享实战经验。AICon 2026,期待与你同行。