【AICon】 如何构建高效的 RAG 系统?RAG 技术在实际应用中遇到的挑战及应对策略?>>> 了解详情
写点什么

滴滴开源 DELTA:AI 开发者可轻松训练自然语言模型

  • 2019-09-19
  • 本文字数:1206 字

    阅读完需:约 4 分钟

滴滴开源DELTA:AI开发者可轻松训练自然语言模型

8 月 2 日消息,自然语言处理领域顶级会议 ACL2019 在意大利弗洛伦萨继续召开。会上滴滴正式宣布开源基于深度学习的语音和自然语言理解模型训练平台 DELTA,以进一步帮助 AI 开发者创建、部署自然语言处理和语音模型,构建高效的解决方案,助力 NLP 应用更好落地。


DELTA 是滴滴第 22 个开源项目。自然语言处理模型和语音模型是很多 AI 系统与用户交互的接口,此次滴滴正式这一开源深度学习模型训练框架,旨在进一步降低开发者创建、部署自然语言处理系统和语音模型的难度。



滴滴自然语言处理首席科学家 Kevin Knight 在 ACL2019 现场


DELTA 主要基于 TensorFlow 构建,能同时支持 NLP(自然语言处理)和语音任务及数值型特征的训练。整合了包括文本分类、命名实体识别、自然语言推理、问答、序列到序列文本生成、语音识别、说话人验证、语音情感识别等重要算法模型,形成一致的代码组织架构,整体包装统一接口。


用户准备好模型训练数据,并指定好配置 Configuration,模型训练 pipeline 可以根据配置进行数据处理,并选择相应的任务和模型,进行模型训练。在训练结束之后,自动生成模型文件保存。该模型文件形成统一接口,可以直接上线使用,快速产品化,能让从研究到生产变得更容易。



值得注意的是,除可支持多种模型的训练,DELTA 还支持灵活配置,开发者可基于 DELTA 搭建成多达几十种的复杂的模型;此外,DELTA 在多种常用任务上提供了稳定高效的 benchmark,用户可以简单快速的复现论文中的模型的结果,同时也可以在此基础上扩展新的模型。在模型构建完成后,用户可以使用 DELTA 的部署流程工具,迅速完成模型上线。从论文到产品部署无缝衔接。


目前 AI 开发者可登陆 Github(https:// github. com/didi/delta)查看 DELTA 的详细介绍和源代码,利用 DELTA 加快实验进度,部署用于文本分类、命名实体识别、自然语言推理、问答、序列到序列文本生成、语音识别、说话人验证、语音情感识别等任务的系统。用户亦可在滴滴的开源平台上(https:// didi.github.io/)获取更多滴滴开源项目的相关信息。


实际上,NLP 和语音技术在滴滴已经有广泛的应用。通过大量应用了包括自然语言处理、深度学习、知识图谱、语音、推荐等技术,滴滴自建了基于 AI 的智能客服系统,能利用人工智能技术辅助人工客服,提高人工客服处理问题的效率,并减少人工客服在重复、简单问题上的处理量。此外,基于语音识别以及自然语言理解技术,滴滴也在构建驾驶员语音助手,日本和澳洲的滴滴司机即将能用语音直接“免接触”接单。而在未来,这一语音助手也将支持全方位的语音交互服务,包括影音娱乐、信息查询、车内环境调节,到乘客通信、客服,甚至是加油、充电或维保服务。与此同时,滴滴也在积极推进相关能力的开放,通过提供一站式自然语言处理工具、一站式机器人开放平台,帮助行业合作伙伴更好地实现 AI 应用落地。


本文转载自公众号滴滴技术(ID:didi_tech)。


原文链接:


https://mp.weixin.qq.com/s/EJJ2p7WoUatHJzk6xzE_rg


2019-09-19 14:161092
用户头像

发布了 52 篇内容, 共 16.3 次阅读, 收获喜欢 165 次。

关注

评论

发布
暂无评论
发现更多内容

“湘”遇区块链 赋能新业态

CECBC

美国工程院士、谷歌首席架构师 杰夫·迪恩(JeffDean) John 易筋 ARTS 打卡 Week 45

John(易筋)

ARTS 打卡计划

应用区块链技术打通各自为战形成的壁垒

CECBC

【LeetCode】解码方法Java题解

Albert

算法 LeetCode 4月日更

读《乌克兰拖拉机简史》有感

箭上有毒

读书笔记 4月日更

Semaphore自白:限流器用我就对了!

王磊

Java 多线程 Semaphore

源中瑞区块链农产品溯源--推动农业科技发展

13530558032

区块链电子合同签约,推动合同签约数字化转型

13530558032

《采访提纲:声网 Agora.io 资深 iOS 开发工程师--龚宇华》

空城机

签约计划 4月日更 热门活动

NumPy之:NumPy简介教程

程序那些事

Python 数据分析 Python3 Numpy 程序那些事

哭了!“日志注入”为什么跟想象中的不一样

华为云开发者联盟

Java 参数 日志注入 log4j2框架 异常堆栈

【Knative系列】看完这篇还不懂 Knative Serving,你来打我~(史上最详细)

公众号:云原生Serverless

Serverless 云原生 Knative

别再问我 2050 可以干什么,Make a Movie in a Day!

阿里云视频云

电影

区块链电子证据的司法应用现状与展望

CECBC

使用 SpringBoot 的 CommandLineRunner 遇到的坑

Java小咖秀

容器 开发 springboot CommandLineRunner ApplicationRunner

聪明人的训练(二十一)

Changing Lin

4月日更

四两拨千斤——你不知道的VScode编码TypeScript的技巧

葡萄城技术团队

MySQL内置函数

Sakura

4月日更

网络安全传奇吴翰清采访提纲 |调查采访能力考核

清秋

网络安全 签约计划 调查采访能力考核

ES 终于可以搜到“悟空哥”了!

悟空聊架构

中文分词 elasticsearch 分词 ES ik

张超 - 机锋网联合创始人 - 采访提纲:那些 3 个月就上线的产品,如何去做技术规划?

梦想橡皮擦

签约计划

智慧平安社区建设--赋能基层治理

13530558032

专访彩食鲜 CTO 乔新亮:CTO的“升级”秘笈

IT蜗壳-Tango

存储成本降低80%!US3在海量数据归档存储下的成本优化技术实践

UCloud技术

存储 海量数据 存储成本

AUC/ROC:面试中80%都会问的知识点

华为云开发者联盟

机器学习 面试 mindspore roc AUC

加密原理详解:对称式加密VS非对称式加密

vivo互联网技术

加密 rsa

Zookeeper基础原理&应用场景详解

leonsh

zookeeper 中间件 ZooKeeper原理

LiteOS内核源码分析:消息队列Queue

华为云开发者联盟

队列 LiteOS LiteOS内核 消息队列Queue 队列池

python内置数据结构list、set、dict、tuple(二)

若尘

List 数据结构 set 元组 Python编程

库存溯源之批次管理

陈俊

溯源 供应链 仓储 冷链 wms

阿里巴巴研究员吴翰清采访提纲:天才少年之路

Nydia

签约计划

滴滴开源DELTA:AI开发者可轻松训练自然语言模型_文化 & 方法_滴滴技术_InfoQ精选文章