有道龙虾 LobsterAI 的养成与实践｜QCon北京

从「AI For What」到「Value From AI」，100+可落地实践案例打通 AI 实战最后一公里！

4 月 16 日-4 月 18 日，QCon 全球软件开发大会将在北京举办。本届大会锚定 Agentic AI 时代的软件工程重塑，聚焦 Agentic AI、多智能体协作、算力优化、技术债治理、多模态和 AI 原生基础设施等前沿话题，邀请来自腾讯、阿里、百度、华为、蚂蚁、小米、网易等企业技术专家，带来百余项真实落地案例，系统性分享前沿洞察与实战干货，以技术共创探索 AI 落地新路径。

网易有道技术专家刘刚已确认出席 “OpenClaw 生态实践” 专题，并发表题为《有道龙虾 LobsterAI 的养成与实践》的主题分享。本次分享将介绍网易有道 LobsterAI 的研发历程与产品实践。团队先推出教育垂类 Agent Video-Tutor 并落地为答疑笔核心功能，后基于 Agent 工程化积累，瞄准非技术人员办公需求，依托 Claude Agent SDK 打造通用原型，早于行业预判 Skills 体系、定时任务、手机远程控制三大方向，OpenClaw 走红验证思路后正式推出 LobsterAI 并开源，一周获 GitHub 超 3k 星。

刘刚，网易有道智能硬件事业部技术专家，有道龙虾核心研发。现负责有道智能硬件业务服务端技术研发与管理工作，近一年参与完成了有道词典笔、有道答疑笔、有道听力宝等硬件研发工作，在有道智能硬件上落地了小 P 老师、视频答疑、错题本等多款 AI 教育产品；也先后负责过有道词典的服务端和团队管理工作。在服务端开发技术及 AI 应用落地方面有丰富的经验和产品实践。他在本次会议的详细演讲内容如下：

演讲提纲
起步：从教育垂类 Agent 到通用 Agent 的转型
首款产品：Video-Tutor（视频答疑）
产品定位：教育场景专属 AI Agent，核心功能为拍题/提问自动生成 2 分钟图文讲解视频
落地成果：2025 年 8 月上线，迭代优化后成为有道答疑笔核心卖点，市场反响良好
行业参考：国内外同类创业团队布局，印证教育 AI Agent 赛道价值
转型契机：突破垂类边界，布局通用场景
现有痛点：垂类 Agent 能力局限，仅能解决单一场景问题，普适性不足
需求洞察：2025 年 AI 编码工具普及，非技术人员急需易用的 AI 办公工具
原型诞生：基于 Claude Agent SDK，两周打造内部 Demo，适配普通用户交互逻辑
2. 核心突破：早于行业的三大预判，奠定产品优势
关键背景：2026 年 1 月 Claude Cowork 推出，与团队思路高度契合，验证方向正确性
Skills 体系：打造 Agent 的“应用层”，内置 16+实用技能，支持用户自建、社区共享
定时任务：打造刚需自动化能力，支持 Cron 定时设置，实现 7×24 小时无人值守执行
手机远程控制：早于 OpenClaw 布局移动端，实现随时随地操控，适配移动办公需求
产品落地：OpenClaw 爆火后加速打磨，春节上线正式版，GitHub 开源一周 Star 超 3k
3. 产品定位与核心优势：差异化竞争壁垒
产品定位：7×24 小时全场景个人助理 Agent，聚焦办公人群，桌面端核心+移动端远程双模式，区别于同类个人助理定位
四大核心优势
认知领先：行业趋势形成前提前布局，非跟风模仿，先发优势明显
坚定开源：依托社区生态，开放共享，借助社区力量迭代优化产品
安全优先：双重安全保障，危险操作二次确认+虚拟机沙箱隔离，不破坏本地系统
多模型兼容：支持 OpenAI、Claude、Kimi 等多模型切换，不绑定单一平台
4. 场景落地：六大实用场景，覆盖全维度办公需求
桌面端核心场景
科技新闻聚合：自动拉取、去重，定时推送至邮箱/飞书，替代手动刷新闻
竞品分析 PPT 生成：一句话指令，自动搜集信息、整理图表，全程无人干预
文件智能整理：精准识别重复文件，安全备份可回退，操作便捷
移动端远程场景
定时新闻播客生成：飞书指令设置，每日自动推送精选内容
远程 PPT 制作：手机下发指令，电脑端自动完成，高效利用碎片时间
出行攻略生成：自动规划行程并同步 Obsidian，随时随地查看
5. 未来规划：产品迭代方向，持续优化升级
体验优化：打磨产品易用性，降低普通用户使用门槛
搭建 Skill Store：打造技能商城，方便用户发现、安装、分享 Skills
拓展 IM 渠道：接入企业微信、QQ 等更多通讯工具，提升操控便捷性
构建双层记忆系统：显式记忆+隐式记忆，基于关键词检索，降低使用门槛
这样的技术在实践过程中有哪些痛点？
技术研发与底层实现痛点
Agent 稳定性与复杂任务适配难题：跨工具联动、长时定时任务易出现执行中断、逻辑卡顿，自动排错能力不足。
多模型依赖与适配成本高：不同大模型的指令理解、输出格式差异显著，多模型切换后，Skills 技能需重新调试适配。
Skills 体系标准化与扩展性失衡：内置技能可保障质量，但拓展性有限；用户自建、社区共享技能缺乏统一的开发规范与审核标准，导致技能兼容性差、功能良莠不齐，甚至存在安全隐患。
2. 产品设计核心矛盾：易用性与开放性的博弈
这是通用 AI Agent 研发的核心底层矛盾，也是 LobsterAI 迭代中面临的关键挑战：
开放性越高，易用性越难保障：为满足技术用户的定制化需求，需开放技能开发、沙箱配置、模型参数调整等高级功能；但对非技术用户（如销售、供应链人员）而言，过多高级选项会造成认知负担，上手难度陡增，甚至出现误操作。
易用性优化，易牺牲功能开放性：若简化交互、隐藏高级设置，虽能降低普通用户门槛，但会限制技术用户与企业用户的定制化需求（如对接内部系统、自定义技能逻辑），导致产品失去核心竞争力。
3. 开源运营核心挑战：产品质量与社区开发的平衡
开源路线带来生态活力的同时，也给产品质量管控带来了前所未有的挑战：
社区贡献质量参差不齐：开源后大量社区开发者提交代码、技能与功能建议，但部分贡献缺乏完整测试，易引入 Bug，甚至破坏产品原有稳定的架构；尤其 Skills 社区共享板块，低质量技能会影响用户体验，损害产品口碑。
核心研发与社区迭代的协同成本高：社区需求分散，部分需求与产品核心定位不符（如非办公场景的娱乐化功能），需投入精力筛选、沟通；核心团队既要保障产品核心功能的迭代节奏，又要对接社区反馈，人力分配压力巨大。
演讲亮点
研发路径清晰：从教育垂类 Video-Tutor 落地，到提前预判行业趋势打造通用 LobsterAI，全程自研不跟风，技术预判与产品落地节奏领先行业
差异化优势突出：融合 Claude Cowork 易用 GUI 与 OpenClaw 远程操控优势，兼顾开源、安全、多模型兼容，打造独有的办公场景 AI 助理壁垒
落地性极强：摒弃纯技术理论，聚焦真实办公场景，六大实操场景可直接复用，开源产品可立即上手体验
行业参考价值高：分享 AI Agent 从垂类到通用的转型思路、工程化经验，以及产品从 Demo 到上线、开源的完整逻辑
听众收益
技术认知提升：搞懂 AI Agent 从“能聊天”到“能干活”的核心突破点，了解行业前沿布局方向与关键技术逻辑
实用工具获取：收获一款可免费使用、开源可定制的 7×24 小时 AI 办公助理，学会用它自动化完成日常办公任务，提升工作效率
产品研发思路：借鉴从场景痛点到产品落地的完整思路，掌握 AI 产品提前布局、差异化竞争的核心方法
资源与社群链接：获取产品官网、开源地址与官方社群渠道，可持续交流学习、参与产品共建

除此之外，本次大会还策划了Agentic Engineering、多模态理解与生成的突破、记忆觉醒：智能体记忆系统的范式重塑与产业落地、具身智能与物理世界交互、Agent Infra 架构设计、AI 重塑数据生产与消费、AI 原生基础设施、AI 驱动的技术债治理、小模型与领域适配模型、大模型算力优化、Agent 可观测性与评估工程、AI for SRE等 20 多个专题论坛，届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京站现场带来前沿技术洞察和一线实践经验。

更多详情可扫码或联系票务经理 18514549229 进行咨询。

创作场景

有道龙虾 LobsterAI 的养成与实践｜QCon 北京