从「AI For What」到「Value From AI」,100+可落地实践案例打通 AI 实战最后一公里!
4 月 16 日-4 月 18 日,QCon 全球软件开发大会将在北京举办。本届大会锚定 Agentic AI 时代的软件工程重塑,聚焦 Agentic AI、多智能体协作、算力优化、技术债治理、多模态和 AI 原生基础设施等前沿话题,邀请来自腾讯、阿里、百度、华为、蚂蚁、小米、网易等企业技术专家,带来百余项真实落地案例,系统性分享前沿洞察与实战干货,以技术共创探索 AI 落地新路径。
记忆张量 CTO 李志宇博士已确认出席 "记忆觉醒:智能体记忆系统的范式重塑与产业落地" 专题,并发表题为《大模型记忆系统 MemOS 2.0:StarDust 技术演进与关键挑战》的主题分享。随着 Agent 进入真实工作流,“记忆”正在从体验加分项变成系统级基础能力:它决定了跨会话连续性、长期任务稳定性、推理成本结构,以及可控与合规边界。本次演讲将系统梳理大模型记忆从 1.0(外挂式检索与上下文拼装)走向 2.0(记忆原生、可调度、可演化)的技术演进路径,并推出 MemOS 2.0 StarDust。解释为什么仅靠更长上下文与向量数据库并不足以支撑长期智能,以及记忆如何与模型推理、KV-cache、工具调用与状态管理形成“协同闭环”。希望通过一套可复用的框架,帮助听众在“做得出来”与“规模化可控”之间找到真正可持续的记忆工程路线。

李志宇,博士,入选上海市东方英才拔尖人才,记忆张量(上海)科技有限公司联合创始人兼 CTO、上海算法创新研究院大模型中心技术负责人、研究员。他长期从事预训练和大模型应用方向的研发技术攻关,主要研究方向包括大模型记忆增强、高效评估与应用算法。他在本次会议的详细演讲内容如下:
演讲提纲
背景与动机:为什么记忆系统 MemOS 2.0:StarDust 成为大模型走向长期智能的拐点
从 1.0 到记忆系统 MemOS 2.0:记忆范式的技术演进与能力边界变化
MemOS 2.0 StarDust 总体架构:以“记忆调度”为核心的系统分层与数据流
关键模块拆解:写入(抽取/治理) 一组织(结构化/索引) 一检索 (多级缓存) 一更新(版本/冲突)
与模型协同:推理增强、KV-cache/激活记忆管理、参数化记忆写入与迁移
关键挑战一:写入质量与污染控制 (噪声、偏差、重复、对齐)
关键挑战二:可控演化 (遗忘机制、冲突消解、时间一致性、回溯与审计)
关键挑战三:成本结构与规模化 (延迟、吞吐、存储、检索瓶颈、工程可观测)
关键挑战四:隐私与安全 (权限、最小化收集、可删除、合规与风险治理)
4. 评测与基准:如何评价“记得对、用得准、改得稳、控得住”
5. 落地路径与案例:典型应用场景、失败模式与工程最佳实践
6. 未来展望:记忆原生基模、MemOS/AgentOS 生态、以及“记忆即计算”的下一步
这样的技术在实践过程中有哪些痛点?
写入质量难控:记得越多越容易把噪声/误事实写进去,后期污染导致“越用越不准”
性能与成本拉扯:多级检索、重排、治理让效果更稳,但 p99 延迟、工程复杂度和算力/存储成本会明显上升
个性化与隐私冲突:接入越深越“懂你”,但权限边界、可审计可删除、合规风控会变成系统级硬约束。
演讲亮点
从“外挂检索”到“记忆调度”:业界多数方案把记忆当作外部 RAG 组件(检索拼上下文),我们的重点是把记忆当作可调度资源,围绕“写入门槛一多级缓存一注入策略”做系统化控制,把稳定性问题(污染/冲突/时序)前置解决,而不是靠更大的向量库兜底。
三层记忆协同(参数/激活 KV 明文)而非单一存储:现有方案往往只做明文记忆+向量检索;我们强调不同时间尺度与价值密度的知识进入不同层:高价值稳定知识倾向参数化,任务态信息走 KV 激活层,需审计与可删除的长期事实走明文层,从而在“成本一可控一效果”三者间获得更好的折中。
听众收益
拿走一套可落地的“MemOS 2.0:StarDust 架构蓝图”:明确记忆写入/组织/检索/更新/治理的模块边界与数据流,知道团队从“RAG+向量库”升级到系统级记忆该怎么分层、怎么拆工、怎么评估投入产出。
掌握关键 tradeoff 的工程决策方法:围绕写入门槛、召回/精度、p99 延迟与成本、隐私权限与可删除、冲突与版本回溯等,给出可操作的设计选型与“踩坑清单”,帮助在真实生产约束下做正确取舍。
获得可复用的评测与可观测思路:如何定义“记得对、用得准、改得稳、控得住”的指标体系与回归策略,如何用线上可观测把记忆污染、冲突漂移、注入失效等问题从“偶发事故”变成可诊断、可治理的工程问题。
除此之外,本次大会还策划了Agentic Engineering、多模态理解与生成的突破、记忆觉醒:智能体记忆系统的范式重塑与产业落地、具身智能与物理世界交互、Agent Infra 架构设计、AI 重塑数据生产与消费、AI 原生基础设施、AI 驱动的技术债治理、小模型与领域适配模型、大模型算力优化、Agent 可观测性与评估工程、AI for SRE等 20 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京站现场带来前沿技术洞察和一线实践经验。
更多详情可扫码或联系票务经理 18514549229 进行咨询。






