Agent 下一战，决胜“记忆”之巅——AICon 深度专题前瞻

当 AI 的发展浪潮从“聊天写诗”的通用大模型涌向“干活办事”的自主智能体，我们正站在一个全新的技术分水岭。Agent 的落地深水区，不在于一次惊艳的推理，而在于长期的稳定运行、持续的自我演进以及对用户意图的终极对齐。这一切的核心底座，正是被行业视为 Agent “大脑海马体”的记忆系统与数据基础设施。

2026 年 6 月 26 日-27 日，AICon 全球人工智能开发与应用大会即将落地上海，在《Agent 数据、记忆与运行时基础设施》专题中，我们邀请到了来自 EverMind、MemVerge 和 OPPO 的三位专家。他们将分别从操作系统级长期记忆架构、独立于模型的 AI Memory 中间件、以及端云协同的全模态记忆工程三个硬核维度，为您呈现一场关于 Agent 的技术分享。

越过幻觉，走向演进——当 Agent 拥有了“海马体”

演讲嘉宾：邓亚峰 | EverMind CEO，盛大集团副总裁，前 360 集团副总裁、人工智能研究院院长，前格灵深瞳 CTO

如果你关注最近的 Agent 领域动态，一定对 OpenClaw 不陌生。邓亚峰将以 OpenClaw 和近期行业热点事件为引子，抛出一个可能颠覆很多人认知的判断：从通用大模型向具备长期记忆和自我演进能力的 Agent 跨越，才是当前最具商业和技术落地价值的深水区。

他提出了一个非常有意思的框架来理解长期记忆的价值——记忆的三重境界。

第一重是降本增效。在上下文窗口依然受限且成本不菲的今天，如何更聪明地利用每一寸上下文空间，让 Agent 在有限的 Token 预算下依然保持强大的任务连贯性，这本身就是一项极具工程价值的能力。

第二重是个性对齐。让 Agent 记住你喜欢什么样的回复风格，记住你常用的工具组合，记住你反复提及的那些关键信息。这意味着 Agent 从“通用的工具”变成了“专属的伙伴”。

第三重也是最具想象力的一重，是自我演进。当 Agent 能够基于与你长期交互的历史数据进行反思、总结和提炼，在没有你手把手指导下也能自主优化行为策略时，它才真正具备了“成长”的属性。

当然，概念谁都会讲，关键看怎么落地。邓亚峰将在演讲中深度公开 EverOS 的架构细节。这套系统被定位为“AI 时代的长期记忆操作系统”，其底层基础设施叫 EverMemOS。更值得期待的是，他会详细解读 MSA（Memory Sparse Attention）模型的核心原理。面对海量的历史记忆数据，如何在保证召回精度的同时大幅降低检索计算开销，这是整个行业都在攻坚的难题。结合具体的数字助理场景案例，这场演讲会让你直观感受到，一个有长期记忆的 Agent 和一个只有“金鱼记忆”的 Agent，在用户体验上的差距究竟有多大。

把记忆从模型里“拆”出来——独立 AI Memory 系统的架构哲学

演讲嘉宾：范承工 | MemVerge 联合创始人兼 CEO，前猎豹移动 CTO，前 VMware 全球高级副总裁、存储事业部总经理

现在很多开发者做 Agent 记忆，思路都很直接：拉一个向量数据库，把历史对话存进去，用的时候检索召回，往上下文里一塞。听起来合理，但为什么一到 LoCoMo 这类严苛的长期记忆基准测试上，准确率就死活突破不了 90%？

范承工博士的履历横跨存储、虚拟化、大数据和 AI 多个领域，从 Rainfinity 到 VMware 再到猎豹移动，他对“数据如何被高效存取和管理”这件事的理解深度，在这个话题上恰好是最稀缺的视角。他的核心观点很明确：AI 记忆不应该被绑死在模型身上，它应该成为一个独立的基础设施层。

这场演讲的第一个重头戏，是完整拆解一套独立于大模型的 AI Memory 记忆系统的技术架构。他会讲清楚一个关键问题——AI 记忆系统、AI 大模型、AI Agent 这三者之间，到底应该是什么样的架构关系和交互接口设计。深入到存储层，你会发现光靠向量数据库是不够的。这套系统依托图数据库与向量数据库的混合存储架构，不同记忆类型走不同的存取路径。范博士还会重点解读这套系统如何实现 90% 以上 LoCoMo 准确率——这背后涉及检索策略、排序算法、记忆更新机制等一系列精巧设计。

第二个值得关注的点是场景落地。他会特别分享 OpenClaw 记忆插件场景下的实战经验。OpenClaw 的开发者们一定对 Token 消耗深有体会。范博士将展示一个非常实用的案例：通过独立的记忆插件设计，如何在提升 Agent 响应准确率的同时，实现 Token 消耗的大幅优化。具体的优化方案和效果对比数据，现场都会给出来。

最后，他会把目光投向更远的未来。个人用户如何在本地构建私有化记忆库，让 AI 在长期对话中真正懂你且隐私绝不外泄？企业如何部署独立的 AI 记忆系统，把散落在各个业务系统里的组织知识变成可继承的 Agent 资产？当记忆数据爆发式增长，共享、存储和隐私保护技术又该往哪个方向演进？这些问题都会在演讲中得到前瞻性的探讨。

让 AI 看懂你的截图和语音——OPPO 小布记忆的亿级工程实战

演讲嘉宾：王闯闯 | OPPO 高级算法工程师，小布记忆产品算法架构负责人

前两场演讲讲的是 Agent 记忆的底层架构和中台方案，到了第三场，我们来看看真实世界里的记忆系统是怎么跑起来的。王闯闯负责 OPPO 经手过多个 S 级和 A 级项目的考验。他要分享的，是一套从碎片化数据到结构化记忆的生产级完整链路。

问题从用户最熟悉的场景开始：你每天截图、发语音、拍视频、收文档，这些异构多模态的碎片内容，怎么才能被 AI 真正理解并自动整理成有用的记忆？王闯闯用三个词概括了核心挑战——模态异构理解、跨模态关联、结构化生成。每一个词背后都是一堆技术难题。

接下来是这场演讲最硬核的部分：一键闪记的整体架构。小布记忆的触发入口极其丰富，小布助手、魔方按键、三指上滑截屏、AI 流体云识别取餐码、密码本自动填充、日历同步、相机大师参数提取……几乎做到了用户无感的“随手记”。在端侧，这套系统跑的是 OPPO 自研的 AndesVL 多模态大模型，AIUnit 模块承载了 NER 和 OCR 提取、图片分类总结、结构化字段提取、取餐码识别、账单理解等一系列任务。云端则负责内容安全审核和那些端侧搞不定的复杂推理。

这里有一个非常复杂的设计叫端云任务分流。分流模块会对输入图文信息打分类标签，然后判断走端侧还是走云侧。直屏单任务、单标签单实例这类简单场景，占到了流量的 80%，全部端侧处理，又快又省又保护隐私。分屏多任务、多标签多实例这类复杂场景才上云，确保推理质量。这个分流机制的设计思路和边界定义逻辑，对于任何在做端云协同的团队来说都是可以直接借鉴的。

有了单条记忆的提取能力，下一步是聚合。王闯闯会详细讲关联记忆的多规则融合召回加 Rerank 加 LLM 精排的多级架构，以及合集归纳的三链路统一加 Reranker 加 Verify 两阶段聚合方案。这套方案的效果数据很能说明问题——合集创建准确率从 83% 干到了 97%，新记忆加入准确率从 76% 提升到了 95% 以上。

最后他还会分享 OPPO 内部的工程化方法论。Model Selection 到 Prompt Engineering 到 Business Benchmark 的流程化开发工作流，基于 LLM-as-a-Judge 的自动化评测体系，Badcase 反馈闭环——这些都是经过亿级用户场景验证过的实战经验，拿来就能用。

会议推荐：

世界模型的下一个突破在哪？Agent 从 Demo 到工程化还差什么？安全与可信这道坎怎么过？研发体系不重构，还能撑多久？AICon 上海站 2026，4 大核心专题等你来：世界模型与多模态智能突破、Agent 架构与工程化实践、Agent 安全与可信治理、企业级研发体系重构。14 个专题全面开放征稿。诚挚邀请你登台分享实战经验。AICon 2026，期待与你同行。

创作场景

Agent 下一战，决胜“记忆”之巅——AICon 深度专题前瞻

越过幻觉，走向演进——当 Agent 拥有了“海马体”

把记忆从模型里“拆”出来——独立 AI Memory 系统的架构哲学

让 AI 看懂你的截图和语音——OPPO 小布记忆的亿级工程实战

会议推荐：