写点什么

达摩院 AliceMind 上新!首个中文表格预训练模型发布,已向业界开源

  • 2021-12-02
  • 本文字数:834 字

    阅读完需:约 3 分钟

达摩院AliceMind上新!首个中文表格预训练模型发布,已向业界开源

12 月 2 日,InfoQ 获悉,达摩院深度语言模型体系 AliceMind 发布中文社区首个表格预训练模型 SDCUP,该模型在全球权威表格数据集 WikiSQL、SQuALL 上取得了业界最优效果,且模型和训练代码均已对外开源。


开源地址:


https://github.com/alibaba/AliceMind



表格是应用普遍的结构化数据,也是智能对话系统和搜索引擎的重要答案来源。但传统表格查询需技术人员撰写专业查询语句,阻碍了表格查询的大规模应用。


新兴的表格问答技术,可将自然语言转换为查询语句,使用户能通过简单问句直接与表格数据库交互,具有广泛应用前景。

 

不过,由于表格内容复杂多样、涉及各行业专业知识,表格问答任务一直是自然语言处理领域的难题。此前,谷歌、微软、亚马逊等海外公司开展了相关探索,但在中文场景,该方向处于空白。

 

本次,达摩院对话智能团队提出了首个中文表格预训练模型 SDCUP,其基于“模式依存”方法,通过模型直接预测自然语言与表格结构内容的关键词映射,提升了表格问答的准确率。


具体而言,即参考语义依存分析方法对 Schema Dependency 任务建模,使用全连接网络获取每个节点作为父亲节点和作为孩子节点的语义表示,然后使用双仿射网络预测每个边存在的概率和该边关系类型的概率。同时,团队使用了模仿人类的“课程学习”方法减少数据噪声。

 


 SDCUP 生成 SQL 示例


在耶鲁大学发布的业界最大规模的英文文本-表格数据集 WikiSQL,以及微软构建的英文文本-表格高难度预测任务 SQuALL 数据集上,SDCUP 模型均取得业界最优效果。在达摩院构建的表格问答中文数据集 TaBLUE 上,SDCUP 比同参数规模 BERT 模型效果提升约 3 个百分点。


 SDCUP 在 WikiSQL 数据集上取得业界最优效果

 


 SDCUP 在 SQuALL 数据集上取得业界最优效果

 

达摩院资深算法专家李永彬介绍,SDCUP 模型是达摩院表格对话技术系列研发的一部分,后续将持续对外开源。其相关技术先后在四大国际公开数据集 WikiSQL、Spider、SParC、CoSQL 上取得第一。

 

据了解,该技术完成了产品化,已通过阿里云智能客服为政务、金融、零售等行业客户提供表格问答和数据库自然交互服务。

2021-12-02 18:153027
用户头像
刘燕 InfoQ高级技术编辑

发布了 1123 篇内容, 共 605.1 次阅读, 收获喜欢 1982 次。

关注

评论

发布
暂无评论
发现更多内容

让 Agent 告别低效工具调用:用代码执行重构 MCP 工作流,节省 90% 的上下文开销

莫尔索

智能体 agent Agents MCP MCP协议

主动交互和情境感知,AI 硬件是脱离手机屏幕掌控的蓝海机会丨硬件和端侧模型专场@RTE2025 回顾

RTE开发者社区

好消息,.NET 10 正式发布,更智能、更安全、更高性能的统一开发平台!

追逐时光者

C# .net 微软

Tavus发布多模态数字伙伴PALs,能看、听、推理;李飞飞团队推出首款商用世界模型World Labs Marble丨日报

RTE开发者社区

如何构建数据驱动的 Agent 评估体系,解决生产环境 Agent 可靠性问题

莫尔索

agent Agents 智能体评估 Agent 评估 Agent Skills

低延迟直播全攻略:从协议选型到海外直播系统搭建部署的完整技术栈

山东布谷网络科技

海外直播平台开发 直播APP延迟 直播源码解决方案 国际版直播平台源码

穿越沙海:中国AI的中东远征

脑极体

AI

小伙伴们学习 C#/.NET 相关技术栈的学习心得和路线

追逐时光者

C# .net

服装门店出入口推荐哪款AI算法RFID门禁?

斯科信息

AI算法RFID门禁 RFID智能门禁

百度慧播星开放罗永浩同款数字人技术,商家转化率提升超63%

极客天地

Spring Boot 进阶:企业级性能与可观测性指南

程序猿DD

Spring Boot

Agentic AI基础设施实践经验系列(八):Agent应用的隐私和安全

亚马逊云科技 (Amazon Web Services)

区块链 Web3 项目的开发费用

北京木奇移动技术有限公司

区块链开发 软件外包公司 web3开发

股票市场财报分析系统的开发

北京木奇移动技术有限公司

软件外包公司 财报分析 股票分析

财务报表分析软件系统开发

北京木奇移动技术有限公司

数据分析 软件外包公司 财报分析

如何实现绿电的"秒级"匹配?西格电力AI驱动下的供需动态优化方案

西格电力

光伏发电 可再生能源 能源可再生 绿电直连 可再生能源发电

如何构建绿电直连"神经末梢"?西格电力感知层核心技术与实战方案

西格电力

光伏产业 可再生能源 风电 绿电直连 低碳经济

“好话坏话”自动分?揭秘出海舆情监测网站的情感分析功能

沃观Wovision

舆情分析 舆情监测 海外舆情监控 海外舆情监测

谷歌起诉网络犯罪团伙Smishing Triad,揭露大规模钓鱼攻击

qife122

网络安全 网络安全网络犯罪

代码江湖:一个“小功能”的需求引发的血案!

六边形架构

程序员 日常工作 需求开发

Agentic AI基础设施实践经验系列(八):Agent应用的隐私和安全

亚马逊云科技 (Amazon Web Services)

人工智能

共同探讨AI技术前沿趋势“2026中原国际人工智能展”定档4月份

AIOTE智博会

人工智能展会 人工智能博览会 人工智能展 郑州人工智能展

优秀的海外舆情监测平台一般具备什么特点?如何筛选?

沃观Wovision

舆情分析 舆情监测 海外舆情监测 舆情监测平台

告别手动PPT:探秘海外舆情分析平台的自动化报告生成与可视化

沃观Wovision

舆情分析 海外舆情 出海舆情 海外舆情平台

大数据-152 Apache Druid 集群模式 [下篇] 低内存集群实操:JVM/DirectMemory与启动脚本

武子康

Java 大数据 分布式 Druid Apache Druid

企业即时通讯平台:撬动企业数字化的核心支点

BeeWorks

即时通讯 IM 私有化部署

如何提升 LLMs 处理表格的准确率?一项针对 11 种格式的基准测试

Baihai IDP

程序员 AI LLM 检索增强生成 表格数据

使用CDN时如何防劫持

天翼云开发者社区

CDN

AI智能体 - 使用工具模式 Function Calling

Hernon AI

AI智能体 AI应用开发 AI开发框架 AI开发方法论

探索 Java 中的新 HTTP 客户端

程序猿DD

使用CDN后如何更新同名文件

天翼云开发者社区

CDN

达摩院AliceMind上新!首个中文表格预训练模型发布,已向业界开源_AI&大模型_刘燕_InfoQ精选文章