蚂蚁 DeepInsight 智能分析 Agent 在业务场景的落地实践｜QCon 上海_AI&大模型_QCon全球软件开发大会_InfoQ精选文章



 写点什么

登录/注册



大小：858.67K时长：04:53

蚂蚁 DeepInsight 智能分析 Agent 在业务场景的落地实践｜QCon 上海

QCon 上海站开幕倒计时！如果你也关注 Agent、AI 搜索、多模态、工程化等话题，一定不要错过这 100+可落地的实践案例！

10 月 23 日-10 月 25 日，QCon全球软件开发大会将在上海举办。本次大会将聚焦 Agentic AI、具身智能、强化学习框架、端侧大模型实践、多智能体协作等热门话题，以及 AI 时代下的软件研发、可观测、开源等技术实践，邀请来自腾讯、阿里、字节跳动、华为、蚂蚁集团、小红书等企业的技术专家，和来自清华大学、北京邮电大学、浙江大学的顶尖高校讲师，和你一起重构技术认知与能力边界！

蚂蚁集团高级技术专家余志鹏已确认出席并发表题为《蚂蚁 DeepInsight 智能分析 Agent 在业务场景的落地实践》的主题分享。随着大模型能力的不断增强，基于大模型的智能分析 Agent 如雨后春笋般涌现。DeepInsight 自 2023 年初便开始在智能化领域不断探索。然而，目前智能分析 Agent 在特定领域仍面临诸多挑战，例如领域知识不足、模型幻觉以及 Reasoning 模型响应时间过长等问题，这些问题直接影响了用户体验和业务落地效果。

为应对这些挑战，余志鹏所在团队探索出了一系列创新解决方案：通过构建基于指标中心的缓存机制，有效解决了领域知识不足的问题；同时，借助模型蒸馏和强化学习（RL）技术，显著优化了 Reasoning 模型的响应时间和幻觉问题。核心命题聚焦于四个方面：1）提升智能分析 Agent 的正确率；2）降低模型幻觉；3）构建指标与知识中心；4）构建评测集。

本次演讲将重点介绍 DeepInsight 在智能分析 Agent 领域的创新实践，解决领域知识不足、模型幻觉和响应时间长等关键问题，以提升智能分析 Agent 的性能和用户体验。

余志鹏，蚂蚁集团高级技术专家，在性能优化、架构设计、数据分析以及 AI + BI 等方向，有着深厚的专业积累和实践经验。 2018 年加入蚂蚁集团，深耕大数据领域 7 年，目前负责蚂蚁数据分析平台 DeepInsight ，带领产品进入到智能化时代。此前，在阿里巴巴工作 5 年，负责 Aliexpress 营销平台，积累了丰富的平台运营与管理经验。他在本次会议的详细演讲内容如下：

演讲提纲

1. 业务问题定义

2. 大模型层的优化

基于 MCP 架构的 Self-Refine
反问澄清的设计
模型响应时间优化

3. 知识构建

知识的存储优化
知识的推理优化

4. 分析领域评测集构建

测评数据生成介绍
测评方法论和实践

您认为，这样的技术在实践过程中有哪些痛点？

如何解决既要模型的泛化能力，又要模型不出现幻觉的问题
如何满足推理性能的情况下优化响应时间
如何围绕以大模型为新生产工具，设计一套新的机制高效运转

演讲亮点

我们从推理工程优化（指标中心、知识库）、对模型优化（SFT、RL）等手段提升在领域场景的正确率
目前智能分析 Agent 落地成本普遍偏高，我们实践了一套高效的调试平台，用户在过程中可以修改 Prompt、知识以及自主评测，实现智能分析 Agent 不断低成本往前迭代
通过 MCP/A2A 协议实现联合 DeepInsight 以及外部多个工具平台，实现智能分析 Agent “大脑发达，四肢发达”，能想即能干

听众收益

成本与落地难题的解决之道：蚂蚁集团如何有效降低智能分析 Agent 的成本并成功落地，为面临类似困境的企业提供可借鉴的经验
Reasoning 模型效率提升：蚂蚁集团在缩短 Reasoning 模型思考时间、加快响应速度方面的具体探索和实践成果
模型结果验证方法：如何确保模型生成结果的正确性，蚂蚁集团在这一领域的验证方法和实践经验

除此之外，本次大会还策划了多模态融合技术与创新应用、混沌工程与全链路压测实践、Data Infra for AI、Agentic AI、加速与反哺：AI 时代的可观测实践、Vibe Coding、端侧大模型的创新与应用、大模型推理的工程实践、AI 搜索技术的深水区、模型训练与微调、具身智能：当 AI 学会“动手思考”、大模型驱动的制造革命、AI4SE：软件研发提质增效实践、AI 重塑视觉创作体验、从“炫技”走向“实用”的 AI 产品、大模型驱动的智能数据分析等 20 多个专题论坛，届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 上海站现场带来前沿技术洞察和一线实践经验。

目前，所有大会演讲嘉宾已结集完毕，更多详情可联系票务经理 18514549229 咨询。

评论

发布

暂无评论

直播源码搭建技术弹幕消息功能的实现

山东布谷科技

软件开发直播源码搭建直播源码

趋势分享 | 多云时代数据安全面临的挑战

带你彻底掌握Bean的生命周期

华为云开发者联盟

后端开发华为云华为云开发者联盟企业号 6 月 PK 榜

PWA和小程序的比较与优势

没有用户名丶

【直播预告】今晚7点，来HarmonyOS极客松直播间与技术专家聊聊新技术！

HarmonyOS开发者

2024深圳电博会

电子信息展

强化学习从基础到进阶-常见问题和面试必知必答[2]：马尔科夫决策、贝尔曼方程、动态规划、策略价值迭代

汀丶人工智能

人工智能深度学习强化学习马尔科夫决策 6 月优质更文活动

强化学习从基础到进阶-案例与实践[2]：马尔科夫决策、贝尔曼方程、动态规划、策略价值迭代

汀丶人工智能

人工智能深度学习强化学习马尔科夫决策 6 月优质更文活动

对线面试官-Redis(一)

龙蜥操作系统完成与高通 Cloud AI 100 兼容认证

OpenAnolis小助手

开源操作系统龙蜥社区兼容适配高通

CSR格式如何更新？ GES图计算引擎HyG揭秘之数据更新

华为云开发者联盟

大数据华为云华为云开发者联盟企业号 6 月 PK 榜

火山引擎数智平台最新直播活动：ByteHouse技术架构与最佳实践分享

字节跳动数据平台

数据活动直播

软件设计原则与设计模式

开源软件开发前端开发后端开发小程序开发

从0到1构造自定义限流组件 | 京东云技术团队

京东科技开发者

限流算法令牌桶算法企业号 6 月 PK 榜接口限流

堡垒机免费版在哪里下载？是否安全可靠？

网络安全堡垒机免费堡垒机

杭州市等级保护测评机构名录-2023年

等保等级保护等保测评杭州

K8S中的Node管理

穿过生命散发芬芳

k8s 6 月优质更文活动

如何设计一个高效的分布式日志服务平台

分布式企业号 6 月 PK 榜服务平台大模型结合 6 月优质更文活动

DevOps｜中式土味OKR与绩效考核落地与实践

DevOps OKR 研发效能绩效考核

龙蜥白皮书精选：Ancert——硬件兼容性验证与守护

OpenAnolis小助手

开源龙蜥社区龙蜥操作系统 Ancert 硬件兼容性

英特尔锐炫：驱动持续进步，尽展硬件潜力

规则引擎调研及初步使用 | 京东云技术团队

京东科技开发者

算法规则引擎企业号 6 月 PK 榜匹配算法 rete

移动端浏览器性能优化探索

性能优化移动端开发

Flutter状态管理新的实践 | 京东云技术团队

京东科技开发者

flutter ios 企业号 6 月 PK 榜声明式UI

一场专属开发者的技术盛宴——华为开发者联创日首站登陆深圳

云计算 AI 华为云华为开发者大会2023

软件测试/测试开发丨Pytest结合数据驱动-JSON

json 程序员软件测试数据驱动 pytest

ChatGPT小型平替之ChatGLM-6B本地化部署、接入本地知识库体验 | 京东云技术团队

京东科技开发者

知识库企业号 6 月 PK 榜 ChatGLM-6B LLM模型