企业级通用 Agent 技术落地过程中的实践与思考|AICon 北京

  • 2025-11-13
    北京
  • 本文字数:2373 字

    阅读完需:约 8 分钟

12 月 19-20 日, AICon全球人工智能开发与应用大会收官之站将在北京举办,本次大会 将以 “探索 AI 应用边界” 为主题,聚焦企业级 Agent 落地、上下文工程、AI 产品创新等多个热门方向,围绕企业如何通过大模型提升研发与业务运营效率的实际应用案例,邀请来自阿里、字节、华为、京东、快手、美团等头部企业、大厂以及明星创业公司的专家,带来一线的大模型实践经验和前沿洞察。一起探索 AI 应用的更多可能,发掘 AI 驱动业务增长的新路径!

实在智能合伙人/核心算法部负责人欧阳小刚已确认出席并将在「企业级 Agent 的设计与落地」专题发表题为企业级通用Agent技术落地过程中的实践与思考的主题分享。智能体技术已经不再是实验室里的“样品”,而逐渐成为走进各行各业、解决实际业务流程痛点的“新质生产力”工具;然而,当前通用智能体技术在面对场景多变、任务复杂、稳定性要求高等真实场景需求时,大模型幻觉、推理稳定性、GUI 操作精准度、工具选择和应用准确率、自主进化和学习能力等问题成为制约智能体技术走向更深、更广应用的瓶颈。

本次演讲聚焦于“实在 Agent”通用智能体在自身产品迭代和客户实际场景应用过程中的探索和尝试,重点探讨如何解决复杂任务推理、GUI 操作和工具调用、业务场景仿真和主动学习三大问题,从而实现业内首个结合大模型推理、多模态识别和无限制软件操作的通用智能体框架;此外还将介绍和剖析“实在 Agent”在产品迭代和落地应用过程真实问题和演化路径,展示“实在 Agent”在各行业、各场景中的巨大潜力;最后将展望和探讨实在智能对于 Agent 技术发展的思考和未来的工作方向。

欧阳小刚是清华大学自动化系本硕,国家优秀专利奖获得者,获评 36 氪 X-36 Under 36 S 级青年创业者代表,在计算机视觉和自然语言处理领域拥有多项授权发明专利,发表多篇国内外核心期刊和会议论文。 曾任职阿里巴巴资深算法工程师,在机器学习和运筹优化领域拥有大量的项目实践积累,深度参与会员评级体系的构建,支撑全集团数百亿交易流水.熟悉数据挖掘模型设计、项目管理和产品落地全流程。现任实在智能合伙人、核心算法部负责人,主导了电信、烟草、石油、核电、银行等多个人工智能项目的实施落地。他在本次会议的详细演讲内容如下:

演讲提纲

1.通用智能体技术的发展、现状和挑战

  • 通用智能体的技术发展脉络:从工作流到自主规划

  • 通用智能体的研究和应用现状:代表性技术和产品

  • 通用智能体技术落地过程的挑战:

1.复杂任务规划稳定性要求高

2.底层操作能力完备度要求高

3.自主迭代和学习的能力要求高

2.“实在 Agent”通用智能体的架构与核心能力构建

  • 任务规划:复杂流程拆解和推理的方案迭代

1.第一版方案:通用大模型+Trick 技术(CoT、ReAct、Function Call、RAG、MCP 等

2.第二版方案:训练和微调自有的任务拆解大模型(数据构造、SFT、强化学习等)

3.第三版方案:自有大模型+软件地图+流程状态控制(长短期记忆注意、执行过程反思等)

  • 流程执行:探索完备且精准的 GUI 操作和工具调用

1.通用多模态大模型(MLLM)在通用智能体领域存在的问题

2.GUI-MLLM 的能力突破和现存问题:GLM-4.5V、UITARS 等

3.我们的方案:针对通用智能体领域微调的 TARS-VL 多模态大模型

4.多模态大模型与 RPA 结合实现 GUI 操作的优势(数据采集、流程复用、容错机制等)

5.如何兼容 GUI 软件操作和外部工具的调用

  • 学习能力:寻找高效的场景迁移和在线学习技术

1.场景知识库+RAG 技术的利与弊

2.软件离线地图:软件操作路径仿真与自动构建

3.在线学习技术的工程和算法探索(个性化推荐、基于反馈的审核提示词优化等)

  • 整体框架:基于上述核心能力探索构建"实在 Agent"智能体框架

1.功能框架图

2.落地路径方案

3.“实在 Agent”通用智能体实践效果与案例分享

  • 产品落地效果

1.核心技术在产品中的效果展示

2.产品化过程中的技术选型

3.具体案例:京东商品数据采集

4.具体案例:投资报告生成和发送

  • 典型应用案例

1.某能源行业客户:“实在 Agent”通用智能体实现单据审核

2.某运营商客户:投诉工单分派与自动化处理

4.未来展望

  • 发展方向展望

1.大模型能力的提升将成为通用智能体研究和落地的核心驱动力

2.通用智能体技术的创新是一个系统工程,但又不仅仅是简单的技术缝合

3.通用智能体技术将驱动企业智能办公与人机协同模式 IDE 变革

  • 后续工作方向

1.围绕 TARS-RPA 和 TARS-VL 两个大模型的能力提升

2.提高长链复杂流程的稳定性、复用性和学习能力

实践技术痛点

  • 领域训练和微调模型必然在通用能力有所折损,需要结合具体场景选择合适模型

  • 软件地图现阶段依赖人工进行必要的质量检查,无法全自动构建

  • 实现真正的通用智能体需要更强大的推理模型和更丰富的工具

演讲亮点

  • 自主研发模型加持通用智能体从任务规划到 GUI 软件操作,完整覆盖数据构造、模型训练、任务微调和产品应用各阶段

  • 业内首个结合 LLM+RPA+GUI 操作的智能体,在任务通用性、操作完备性、流程可复用性等方面力求最佳平衡

听众收益

  • 系统了解企业级通用智能体从方案设计到技术落地的全流程,大量现状思考、踩坑经验助力听众对通用型自主规划智能体产品的开发难度、技术栈乃至能力上限有一个正确的认识

  • 全面介绍在企业级通用智能体落地过程中的核心技术难点和我们的解决方案,进而将多项人工智能和大模型技术串联,并映射到通用智能体的不同能力维度

除此之外,本次大会还策划了LLM 时代的软件研发新范式Context EngineeringData+AI / Agent 落地实践大模型系统工程企业级 Agent 的设计与落地大模型时代下的搜广推系统实践多模态从技术突破到创新应用落地等 10 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 50+资深专家在 AICon 北京站现场带来前沿技术洞察和一线实践经验。

现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。