写点什么

蚂蚁 DeepInsight 智能分析 Agent 在业务场景的落地实践|QCon 上海

  • 2025-10-15
    北京
  • 本文字数:1648 字

    阅读完需:约 5 分钟

大小:858.67K时长:04:53
蚂蚁 DeepInsight 智能分析 Agent 在业务场景的落地实践|QCon 上海

QCon 上海站开幕倒计时!如果你也关注 Agent、AI 搜索、多模态、工程化等话题,一定不要错过这 100+可落地的实践案例!


10 月 23 日-10 月 25 日,QCon全球软件开发大会将在上海举办。本次大会将聚焦 Agentic AI、具身智能、强化学习框架、端侧大模型实践、多智能体协作等热门话题,以及 AI 时代下的软件研发、可观测、开源等技术实践,邀请来自腾讯、阿里、字节跳动、华为、蚂蚁集团、小红书等企业的技术专家,和来自清华大学、北京邮电大学、浙江大学的顶尖高校讲师,和你一起重构技术认知与能力边界!


蚂蚁集团高级技术专家余志鹏已确认出席并发表题为蚂蚁 DeepInsight 智能分析 Agent 在业务场景的落地实践的主题分享。随着大模型能力的不断增强,基于大模型的智能分析 Agent 如雨后春笋般涌现。DeepInsight 自 2023 年初便开始在智能化领域不断探索。然而,目前智能分析 Agent 在特定领域仍面临诸多挑战,例如领域知识不足、模型幻觉以及 Reasoning 模型响应时间过长等问题,这些问题直接影响了用户体验和业务落地效果。


为应对这些挑战,余志鹏所在团队探索出了一系列创新解决方案:通过构建基于指标中心的缓存机制,有效解决了领域知识不足的问题;同时,借助模型蒸馏和强化学习(RL)技术,显著优化了 Reasoning 模型的响应时间和幻觉问题。核心命题聚焦于四个方面:1)提升智能分析 Agent 的正确率;2)降低模型幻觉;3)构建指标与知识中心;4)构建评测集。


本次演讲将重点介绍 DeepInsight 在智能分析 Agent 领域的创新实践,解决领域知识不足、模型幻觉和响应时间长等关键问题,以提升智能分析 Agent 的性能和用户体验。


余志鹏,蚂蚁集团高级技术专家,在性能优化、架构设计、数据分析以及 AI + BI 等方向,有着深厚的专业积累和实践经验。 2018 年加入蚂蚁集团,深耕大数据领域 7 年,目前负责蚂蚁数据分析平台 DeepInsight ,带领产品进入到智能化时代。此前,在阿里巴巴工作 5 年,负责 Aliexpress 营销平台,积累了丰富的平台运营与管理经验。他在本次会议的详细演讲内容如下:


演讲提纲

1. 业务问题定义

2. 大模型层的优化

  • 基于 MCP 架构的 Self-Refine

  • 反问澄清的设计

  • 模型响应时间优化

3. 知识构建

  • 知识的存储优化

  • 知识的推理优化

4. 分析领域评测集构建

  • 测评数据生成介绍

  • 测评方法论和实践

您认为,这样的技术在实践过程中有哪些痛点?

  • 如何解决既要模型的泛化能力,又要模型不出现幻觉的问题

  • 如何满足推理性能的情况下优化响应时间

  • 如何围绕以大模型为新生产工具,设计一套新的机制高效运转

演讲亮点

  • 我们从推理工程优化(指标中心、知识库)、对模型优化(SFT、RL)等手段提升在领域场景的正确率

  • 目前智能分析 Agent 落地成本普遍偏高,我们实践了一套高效的调试平台,用户在过程中可以修改 Prompt、知识以及自主评测,实现智能分析 Agent 不断低成本往前迭代

  • 通过 MCP/A2A 协议实现联合 DeepInsight 以及外部多个工具平台,实现智能分析 Agent “大脑发达,四肢发达”,能想即能干

听众收益

  • 成本与落地难题的解决之道:蚂蚁集团如何有效降低智能分析 Agent 的成本并成功落地,为面临类似困境的企业提供可借鉴的经验

  • Reasoning 模型效率提升:蚂蚁集团在缩短 Reasoning 模型思考时间、加快响应速度方面的具体探索和实践成果

  • 模型结果验证方法:如何确保模型生成结果的正确性,蚂蚁集团在这一领域的验证方法和实践经验


除此之外,本次大会还策划了多模态融合技术与创新应用混沌工程与全链路压测实践Data Infra for AIAgentic AI加速与反哺:AI 时代的可观测实践Vibe Coding端侧大模型的创新与应用大模型推理的工程实践AI 搜索技术的深水区模型训练与微调具身智能:当 AI 学会“动手思考”大模型驱动的制造革命AI4SE:软件研发提质增效实践AI 重塑视觉创作体验从“炫技”走向“实用”的 AI 产品大模型驱动的智能数据分析等 20 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 上海站现场带来前沿技术洞察和一线实践经验。


目前,所有大会演讲嘉宾已结集完毕,更多详情可联系票务经理 18514549229 咨询。


2025-10-15 10:1211

评论

发布
暂无评论

GitHub万人斩!Java系列面试宝典,我拿到之后直接反杀了面试官

java小李

git cherry-pick

搜客系统软件开发公司

一周信创舆情观察(7.19~7.25)

统小信uos

【共识专栏】共识的分类(上)

趣链科技

区块链 联盟共识 共识机制 共识算法

短视频询盘软件系统开发内容

5年经验Android程序员面试27天,从理论到实践!

欢喜学安卓

android 程序员 面试 移动开发

裸辞后吊打大厂面试官,四面拿到阿里offer后我还是选择了美团

java小李

tomcat elasticsearch

Tensorflow serving with docker

毛显新

tensorflow Docker

抖音获客APP开发,抖音获客系统开发(成功案例),抖音获客系统源码

系统开发咨询1357O98O718

直播时各种背景是怎么实现的?聊一聊虚拟背景背后的技术

阿里云CloudImagine

阿里云 计算机视觉 视频会议 虚拟背景 人像抠图

330页PDF,10万字的知识点总结,架构师必备!

欢喜学安卓

android 程序员 面试 移动开发

差之毫厘:etcd 3 完美支持 HTTP 访问?

API7.ai 技术团队

etcd 网关 APISIX

基于docker的分布式性能测试框架功能验证(一)

FunTester

性能测试 接口测试 测试框架 测试开发 分布式压测

直呼内行!靠着这份阿里10w字面试总结,我成功收到了4个大厂offer

Java 程序员 架构 面试 计算机

询盘获客软件系统开发详情

短视频SEO软件系统开发资料

Go语言:如何通过 RPC 来实现跨平台服务!

微客鸟窝

Go 语言

只出现一次的数字

Memorys

Java 面试 算法

马士兵「研发」对标阿里Java架构师P5—P9成长路线,文档+教程

Java架构追梦

Java 数据库 架构 JVM 多线程与高并发

10天拿到腾讯Android岗offer,大厂直通车!

欢喜学安卓

android 程序员 面试 移动开发

短视频营销获客软件系统开发内容

浅谈工业4.0背景下的空中数据端口,无人机 3D 可视化系统的应用

一只数据鲸鱼

无人机 数据可视化 工业4.0 数字孪生 智慧工业

详解云安全攻防模型,这些攻击战略和战术越早知道越好!

博文视点Broadview

抖音获客系统开发(软件开发),抖音获客源码模式

系统开发咨询1357O98O718

分布式性能测试框架用例方案设想(一)

FunTester

性能测试 接口测试 测试框架 测试开发 分布式压测

逆袭成功,不愧是阿里内部面试参考指南,已帮我拿下了8个大厂的offer

Java 程序员 架构 面试 计算机

短视频SEO获客系统软件开发简介

仅仅上线一小时,下载量就破10W!阿里内部Java性能优化实战手册

java小李

面试 JVM

索信达控股:探寻金融数字化转型契机下的高增长“密码”

索信达控股

花朵分类(一)

毛显新

深度学习 tensorflow keras

后端开发-Reactor设计模式

Linux服务器开发

reactor 设计模式 网络编程 线程池 epoll

蚂蚁 DeepInsight 智能分析 Agent 在业务场景的落地实践|QCon 上海_AI&大模型_QCon全球软件开发大会_InfoQ精选文章