从「AI For What」到「Value From AI」,100+可落地实践案例打通 AI 实战最后一公里!
4 月 16 日-4 月 18 日,QCon 全球软件开发大会将在北京举办。本届大会锚定 Agentic AI 时代的软件工程重塑,聚焦 Agentic AI、多智能体协作、算力优化、技术债治理、多模态和 AI 原生基础设施等前沿话题,邀请来自腾讯、阿里、百度、华为、蚂蚁、小米、网易等企业技术专家,带来百余项真实落地案例,系统性分享前沿洞察与实战干货,以技术共创探索 AI 落地新路径。
网易有道技术专家刘刚已确认出席 “OpenClaw 生态实践” 专题,并发表题为《有道龙虾 LobsterAI 的养成与实践》的主题分享。本次分享将介绍网易有道 LobsterAI 的研发历程与产品实践。团队先推出教育垂类 Agent Video-Tutor 并落地为答疑笔核心功能,后基于 Agent 工程化积累,瞄准非技术人员办公需求,依托 Claude Agent SDK 打造通用原型,早于行业预判 Skills 体系、定时任务、手机远程控制三大方向,OpenClaw 走红验证思路后正式推出 LobsterAI 并开源,一周获 GitHub 超 3k 星。

刘刚,网易有道智能硬件事业部技术专家,有道龙虾核心研发。现负责有道智能硬件业务服务端技术研发与管理工作,近一年参与完成了有道词典笔、有道答疑笔、有道听力宝等硬件研发工作,在有道智能硬件上落地了小 P 老师、视频答疑、错题本等多款 AI 教育产品;也先后负责过有道词典的服务端和团队管理工作。在服务端开发技术及 AI 应用落地方面有丰富的经验和产品实践。他在本次会议的详细演讲内容如下:
演讲提纲
起步:从教育垂类 Agent 到通用 Agent 的转型
首款产品:Video-Tutor(视频答疑)
产品定位:教育场景专属 AI Agent,核心功能为拍题/提问自动生成 2 分钟图文讲解视频
落地成果:2025 年 8 月上线,迭代优化后成为有道答疑笔核心卖点,市场反响良好
行业参考:国内外同类创业团队布局,印证教育 AI Agent 赛道价值
转型契机:突破垂类边界,布局通用场景
现有痛点:垂类 Agent 能力局限,仅能解决单一场景问题,普适性不足
需求洞察:2025 年 AI 编码工具普及,非技术人员急需易用的 AI 办公工具
原型诞生:基于 Claude Agent SDK,两周打造内部 Demo,适配普通用户交互逻辑
2. 核心突破:早于行业的三大预判,奠定产品优势
关键背景:2026 年 1 月 Claude Cowork 推出,与团队思路高度契合,验证方向正确性
Skills 体系:打造 Agent 的“应用层”,内置 16+实用技能,支持用户自建、社区共享
定时任务:打造刚需自动化能力,支持 Cron 定时设置,实现 7×24 小时无人值守执行
手机远程控制:早于 OpenClaw 布局移动端,实现随时随地操控,适配移动办公需求
产品落地:OpenClaw 爆火后加速打磨,春节上线正式版,GitHub 开源一周 Star 超 3k
3. 产品定位与核心优势:差异化竞争壁垒
产品定位:7×24 小时全场景个人助理 Agent,聚焦办公人群,桌面端核心+移动端远程双模式,区别于同类个人助理定位
四大核心优势
认知领先:行业趋势形成前提前布局,非跟风模仿,先发优势明显
坚定开源:依托社区生态,开放共享,借助社区力量迭代优化产品
安全优先:双重安全保障,危险操作二次确认+虚拟机沙箱隔离,不破坏本地系统
多模型兼容:支持 OpenAI、Claude、Kimi 等多模型切换,不绑定单一平台
4. 场景落地:六大实用场景,覆盖全维度办公需求
桌面端核心场景
科技新闻聚合:自动拉取、去重,定时推送至邮箱/飞书,替代手动刷新闻
竞品分析 PPT 生成:一句话指令,自动搜集信息、整理图表,全程无人干预
文件智能整理:精准识别重复文件,安全备份可回退,操作便捷
移动端远程场景
定时新闻播客生成:飞书指令设置,每日自动推送精选内容
远程 PPT 制作:手机下发指令,电脑端自动完成,高效利用碎片时间
出行攻略生成:自动规划行程并同步 Obsidian,随时随地查看
5. 未来规划:产品迭代方向,持续优化升级
体验优化:打磨产品易用性,降低普通用户使用门槛
搭建 Skill Store:打造技能商城,方便用户发现、安装、分享 Skills
拓展 IM 渠道:接入企业微信、QQ 等更多通讯工具,提升操控便捷性
构建双层记忆系统:显式记忆+隐式记忆,基于关键词检索,降低使用门槛
这样的技术在实践过程中有哪些痛点?
技术研发与底层实现痛点
Agent 稳定性与复杂任务适配难题:跨工具联动、长时定时任务易出现执行中断、逻辑卡顿,自动排错能力不足。
多模型依赖与适配成本高:不同大模型的指令理解、输出格式差异显著,多模型切换后,Skills 技能需重新调试适配。
Skills 体系标准化与扩展性失衡:内置技能可保障质量,但拓展性有限;用户自建、社区共享技能缺乏统一的开发规范与审核标准,导致技能兼容性差、功能良莠不齐,甚至存在安全隐患。
2. 产品设计核心矛盾:易用性与开放性的博弈
这是通用 AI Agent 研发的核心底层矛盾,也是 LobsterAI 迭代中面临的关键挑战:
开放性越高,易用性越难保障:为满足技术用户的定制化需求,需开放技能开发、沙箱配置、模型参数调整等高级功能;但对非技术用户(如销售、供应链人员)而言,过多高级选项会造成认知负担,上手难度陡增,甚至出现误操作。
易用性优化,易牺牲功能开放性:若简化交互、隐藏高级设置,虽能降低普通用户门槛,但会限制技术用户与企业用户的定制化需求(如对接内部系统、自定义技能逻辑),导致产品失去核心竞争力。
3. 开源运营核心挑战:产品质量与社区开发的平衡
开源路线带来生态活力的同时,也给产品质量管控带来了前所未有的挑战:
社区贡献质量参差不齐:开源后大量社区开发者提交代码、技能与功能建议,但部分贡献缺乏完整测试,易引入 Bug,甚至破坏产品原有稳定的架构;尤其 Skills 社区共享板块,低质量技能会影响用户体验,损害产品口碑。
核心研发与社区迭代的协同成本高:社区需求分散,部分需求与产品核心定位不符(如非办公场景的娱乐化功能),需投入精力筛选、沟通;核心团队既要保障产品核心功能的迭代节奏,又要对接社区反馈,人力分配压力巨大。
演讲亮点
研发路径清晰:从教育垂类 Video-Tutor 落地,到提前预判行业趋势打造通用 LobsterAI,全程自研不跟风,技术预判与产品落地节奏领先行业
差异化优势突出:融合 Claude Cowork 易用 GUI 与 OpenClaw 远程操控优势,兼顾开源、安全、多模型兼容,打造独有的办公场景 AI 助理壁垒
落地性极强:摒弃纯技术理论,聚焦真实办公场景,六大实操场景可直接复用,开源产品可立即上手体验
行业参考价值高:分享 AI Agent 从垂类到通用的转型思路、工程化经验,以及产品从 Demo 到上线、开源的完整逻辑
听众收益
技术认知提升:搞懂 AI Agent 从“能聊天”到“能干活”的核心突破点,了解行业前沿布局方向与关键技术逻辑
实用工具获取:收获一款可免费使用、开源可定制的 7×24 小时 AI 办公助理,学会用它自动化完成日常办公任务,提升工作效率
产品研发思路:借鉴从场景痛点到产品落地的完整思路,掌握 AI 产品提前布局、差异化竞争的核心方法
资源与社群链接:获取产品官网、开源地址与官方社群渠道,可持续交流学习、参与产品共建
除此之外,本次大会还策划了Agentic Engineering、多模态理解与生成的突破、记忆觉醒:智能体记忆系统的范式重塑与产业落地、具身智能与物理世界交互、Agent Infra 架构设计、AI 重塑数据生产与消费、AI 原生基础设施、AI 驱动的技术债治理、小模型与领域适配模型、大模型算力优化、Agent 可观测性与评估工程、AI for SRE等 20 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京站现场带来前沿技术洞察和一线实践经验。
更多详情可扫码或联系票务经理 18514549229 进行咨询。






