写点什么

大模型记忆系统 MemOS 2.0:StarDust 技术演进与关键挑战|QCon 北京

  • 2026-03-04
    北京
  • 本文字数:1982 字

    阅读完需:约 7 分钟

从「AI For What」到「Value From AI」,100+可落地实践案例打通 AI 实战最后一公里!

4 月 16 日-4 月 18 日,QCon 全球软件开发大会将在北京举办。本届大会锚定 Agentic AI 时代的软件工程重塑,聚焦 Agentic AI、多智能体协作、算力优化、技术债治理、多模态和 AI 原生基础设施等前沿话题,邀请来自腾讯、阿里、百度、华为、蚂蚁、小米、网易等企业技术专家,带来百余项真实落地案例,系统性分享前沿洞察与实战干货,以技术共创探索 AI 落地新路径。

记忆张量 CTO 李志宇博士已确认出席 "记忆觉醒:智能体记忆系统的范式重塑与产业落地" 专题,并发表题为大模型记忆系统 MemOS 2.0:StarDust 技术演进与关键挑战的主题分享。随着 Agent 进入真实工作流,“记忆”正在从体验加分项变成系统级基础能力:它决定了跨会话连续性、长期任务稳定性、推理成本结构,以及可控与合规边界。本次演讲将系统梳理大模型记忆从 1.0(外挂式检索与上下文拼装)走向 2.0(记忆原生、可调度、可演化)的技术演进路径,并推出 MemOS 2.0 StarDust。解释为什么仅靠更长上下文与向量数据库并不足以支撑长期智能,以及记忆如何与模型推理、KV-cache、工具调用与状态管理形成“协同闭环”。希望通过一套可复用的框架,帮助听众在“做得出来”与“规模化可控”之间找到真正可持续的记忆工程路线。

李志宇,博士,入选上海市东方英才拔尖人才,记忆张量(上海)科技有限公司联合创始人兼 CTO、上海算法创新研究院大模型中心技术负责人、研究员。他长期从事预训练和大模型应用方向的研发技术攻关,主要研究方向包括大模型记忆增强、高效评估与应用算法。他在本次会议的详细演讲内容如下:

演讲提纲

  1. 背景与动机:为什么记忆系统 MemOS 2.0:StarDust 成为大模型走向长期智能的拐点

  2. 从 1.0 到记忆系统 MemOS 2.0:记忆范式的技术演进与能力边界变化

  3. MemOS 2.0 StarDust 总体架构:以“记忆调度”为核心的系统分层与数据流

  • 关键模块拆解:写入(抽取/治理) 一组织(结构化/索引) 一检索 (多级缓存) 一更新(版本/冲突)

  • 与模型协同:推理增强、KV-cache/激活记忆管理、参数化记忆写入与迁移

  • 关键挑战一:写入质量与污染控制 (噪声、偏差、重复、对齐)

  • 关键挑战二:可控演化 (遗忘机制、冲突消解、时间一致性、回溯与审计)

  • 关键挑战三:成本结构与规模化 (延迟、吞吐、存储、检索瓶颈、工程可观测)

  • 关键挑战四:隐私与安全 (权限、最小化收集、可删除、合规与风险治理)

4. 评测与基准:如何评价“记得对、用得准、改得稳、控得住”

5. 落地路径与案例:典型应用场景、失败模式与工程最佳实践

6. 未来展望:记忆原生基模、MemOS/AgentOS 生态、以及“记忆即计算”的下一步

这样的技术在实践过程中有哪些痛点?

  1. 写入质量难控:记得越多越容易把噪声/误事实写进去,后期污染导致“越用越不准”

  2. 性能与成本拉扯:多级检索、重排、治理让效果更稳,但 p99 延迟、工程复杂度和算力/存储成本会明显上升

  3. 个性化与隐私冲突:接入越深越“懂你”,但权限边界、可审计可删除、合规风控会变成系统级硬约束。

演讲亮点

  1. 从“外挂检索”到“记忆调度”:业界多数方案把记忆当作外部 RAG 组件(检索拼上下文),我们的重点是把记忆当作可调度资源,围绕“写入门槛一多级缓存一注入策略”做系统化控制,把稳定性问题(污染/冲突/时序)前置解决,而不是靠更大的向量库兜底。

  2. 三层记忆协同(参数/激活 KV 明文)而非单一存储:现有方案往往只做明文记忆+向量检索;我们强调不同时间尺度与价值密度的知识进入不同层:高价值稳定知识倾向参数化,任务态信息走 KV 激活层,需审计与可删除的长期事实走明文层,从而在“成本一可控一效果”三者间获得更好的折中。

听众收益

  1. 拿走一套可落地的“MemOS 2.0:StarDust 架构蓝图”:明确记忆写入/组织/检索/更新/治理的模块边界与数据流,知道团队从“RAG+向量库”升级到系统级记忆该怎么分层、怎么拆工、怎么评估投入产出。

  2. 掌握关键 tradeoff 的工程决策方法:围绕写入门槛、召回/精度、p99 延迟与成本、隐私权限与可删除、冲突与版本回溯等,给出可操作的设计选型与“踩坑清单”,帮助在真实生产约束下做正确取舍。

  3. 获得可复用的评测与可观测思路:如何定义“记得对、用得准、改得稳、控得住”的指标体系与回归策略,如何用线上可观测把记忆污染、冲突漂移、注入失效等问题从“偶发事故”变成可诊断、可治理的工程问题。

除此之外,本次大会还策划了Agentic Engineering多模态理解与生成的突破记忆觉醒:智能体记忆系统的范式重塑与产业落地具身智能与物理世界交互Agent Infra 架构设计AI 重塑数据生产与消费AI 原生基础设施AI 驱动的技术债治理小模型与领域适配模型大模型算力优化Agent 可观测性与评估工程AI for SRE等 20 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京站现场带来前沿技术洞察和一线实践经验。

更多详情可扫码或联系票务经理 18514549229 进行咨询。