写点什么

又一数据分析智能体重磅开源,现已登顶 BIRD!非专业人员也能轻松查阅和分析数据

  • 2025-12-15
    北京
  • 本文字数:1282 字

    阅读完需:约 4 分钟

大小:688.23K时长:03:54
又一数据分析智能体重磅开源,现已登顶BIRD!非专业人员也能轻松查阅和分析数据

12 月 13 日,蚂蚁数科宣布开源旗下数据智能体关键技术 Agentar SQL 全套论文、代码、模型和使用指南。该智能体技术可让非专业人员通过日常语言进行商业数据查询和分析,为企业数智化提供更精准可用的智能数据分析基座。


开源地址:https://github.com/antgroup/Agentar-Scale-SQL


蚂蚁数科首期开源实时文本转化结构化查询语言(Text-to-SQL)框架,为开发者提供一套开箱即用的数据查询方案,提升文本与数据库查询交互效率。


2026 年,蚂蚁数科将陆续开源数据库理解与挖掘、行业知识挖掘、实时多轮交互技术框架,覆盖意图理解、业务理解到数据理解的全链路数据能力。


据了解,在某头部城商行试运营期间,蚂蚁数科 Agentar SQL 多个工具的平均查询准确率超 92%,较传统查询方案提升超 3 倍。



今年 9 月 25 日,由该技术支持的蚂蚁数科数据分析智能体 Agentar-Scale-SQL 登顶全球最具权威性的自然语言转结构化查询语言(NL2SQL)评测基准 BIRD-SQL,超越 Google 等诸多国内外厂商。目前,该智能体仍在执行准确率排行榜以及执行效率榜保持双榜第一,已持续领跑超两月。



研究机构预测,全球商业智能市场规模 2025 年达 474.8 亿。中国商业智能与分析软件市场规模 2025 年达 12 亿。预计到 2028 年,中国商业智能软件市场规模将达到 17.9 亿美元,未来 5 年市场年复合增长率(CAGR)为 12.7%,成为未来构建企业智能技术的重要且必要的投资领域。


目前,中国企业对商业智能与分析产品的使用深度差异较大,大部分集中在报表、驾驶舱、仪表板、数据大屏等数据可视化和简单分析需求。而如何在保持准确性的前提下,提升在真实生产环境中的可用性被认为是 NL2SQL 在产业中规模化落地的普遍挑战。


蚂蚁数科 AI 技术负责人章鹏指出,NL2SQL 在实际落地中面临四大严峻挑战:理解模糊多义的人类口语、注入庞大的行业专业知识、解析复杂的数据库结构与关联,以及生成准确无误的复杂 SQL 语句。这些挑战意味着,简单的模型“套壳”远不足以满足企业级应用的可靠性与准确性要求。


例如金融领域从业者往往需要结合复杂业务规则与多条件组合进行数据查询才能有效地进行产品数据分析;业务管理中,非专业数据分析人员口语化提问,则需要背后的产品保证行业术语、询问意图的正确理解,再与数据库字段精准匹配,才能产出真实准确的结果。


章鹏强调,BIRD-SQL 主要评测 SQL 的复杂度生成能力(在线扩展 Online Scaling),但要真正实现产业可用的 NL2SQL 乃至数据智能体技术,必须构建更完整的能力栈。除了在线扩展,还需包含:


1. 离线扩展(Offline Scaling):对数据库的深度理解与知识结构化。

2. 人机交互(Human Interaction):智能体识别自身不确定性,主动与用户澄清意图,实现白盒化、可纠错的协作。

3. 自我进化(Self Evolution):通过“记忆”优化、工具(如 UDF)创建与复用等“免调优”技术,使智能体能够从错误中学习,持续提升,降低对大量标注数据和专家调优的依赖。


蚂蚁数科计划逐步将这些更全面的能力模块持续开源,如理解数据库的 Agentar Profiling-SQL、实现免调优进化的 Agentar TuningFree-SQL 等。首期在线扩展框架 Agentar-Scale-SQL 开源内容已发布在 arXiv、GitHub、ModelScope 及 Hugging Face 等平台,并迅速获得了开发者的关注。

2025-12-15 17:018
用户头像
李冬梅 加V:busulishang4668

发布了 1232 篇内容, 共 849.7 次阅读, 收获喜欢 1323 次。

关注

评论

发布
暂无评论

线上观看人次近 2 万,龙蜥社区走进中兴通讯 MeetUp 圆满结束

OpenAnolis小助手

开源 AI 操作系统 龙蜥社区 龙蜥meetup

RISC-V基金会Datacenter SIG月会圆满举办,探讨RAS、PMU性能分析实践和经验

OpenAnolis小助手

操作系统 risc-v 龙蜥社区 Datacenter SIG 龙蜥 RISC-V SIG

龙蜥邀您参加 2025 开放原子开源生态大会

OpenAnolis小助手

操作系统 龙蜥社区 开放原子开源生态大会

FlagRelease上线:自动迁移发布大模型多芯高效版本,用户下载即用

智源研究院

开源 大模型

CST的UAV无人机RCS:双站, TLM求解器,各向异性Thin Panel,碳纤维复合材料CFRP,

思茂信息

无人机 CST Studio Suite TLM求解器 PEC

(在线CAD插件)WEB CAD二开形位公差标注

WEB CAD SDK

网页CAD 在线CAD

图谱不是玄学:时序数据库 TDengine 一步接入 Ontop,让时序数据更聪明

TDengine

tdengine 时序数据库 时序数据库tdengine

中烟创新AI审核平台,打造烟草行业采购全链条合规管理新范式

中烟创新

中烟创新智能稽核平台:为烟草行业定制的数字化风控引擎

中烟创新

系统化解析超智融合算力中心的搭建路径 | 干货推荐

OpenAnolis小助手

操作系统 算力 龙蜥社区 龙蜥大讲堂 超智融合

从批到流,Zoom 基于 DolphinScheduler 的流批统一调度系统演进

白鲸开源

开源 大数据任务调度 Zoom 视频会议 Apache DolphinScheduler

开源能源管理系统应用指南

开源能源管理系统

开源 生产 能源管理系统 国能国标

AI、大模型如何重塑海外舆情监测行业

沃观Wovision

人工智能、 海外舆情监控 AI 大模型 沃观Wovision 舆情监测系统

CORE漏洞赏金计划:携手社区共筑安全防线

qife122

智能合约 区块链安全

【HarmonyOS 5】鸿蒙App,Application,Ability以及页面和组件生命周期函数

GeorgeGcs

漏洞扫描器无法做到的关键一件事——漏洞链式利用

qife122

网络安全 漏洞扫描

京东商品详情API响应数据解析

tbapi

京东商品详情接口 京东商品详情API 京东数据采集 京东数据分析

京东商品列表API响应数据解析

tbapi

京东商品列表数据采集 京东商品列表接口 京东商品列表API 京东数据分析

MyEMS开源能源管理系统核心代码解读017

开源能源管理系统

开源 代码解读 能源管理系统

软件工程3.0时代,为什么人工测试仍必不可少?

禅道项目管理

人工智能 AI 自动化测试

采购那些事儿,如何把握性价比采购逻辑?

积木链小链

数字化转型 智能制造 采购管理

Manus“跑路”风波背后,AI Agent的商业化困局

脑极体

AI

大数据-48 Redis 深入理解Redis通信机制:从RESP协议到Reactor事件驱动模型

武子康

Java redis 大数据 缓存 分布式

从 0 到 1 学 AI 大模型接入(Go/Java 实战)

王中阳Go

AI

快手 AutoThink 大模型 KAT-V1 正式开源,40B版本比肩满血版R1,技术报告全公开!

快手技术

开源 大模型

零碳园区:绿色发展新引擎,MyEMS 助力启航

开源能源管理系统

开源 能源管理系统 国能国标

又一数据分析智能体重磅开源,现已登顶BIRD!非专业人员也能轻松查阅和分析数据_生成式 AI_李冬梅_InfoQ精选文章