【AICon】AI 基础设施、LLM运维、大模型训练与推理,一场会议,全方位涵盖! >>> 了解详情
写点什么

艾伦人工智能研究所发布 AllenNLP 1.0 ,设计和评估新深度学习模型更容易

  • 2020-07-03
  • 本文字数:1693 字

    阅读完需:约 6 分钟

艾伦人工智能研究所发布 AllenNLP 1.0 ,设计和评估新深度学习模型更容易

本文最初发布在 Medium 博客,经原作者 Michael Schmitz 授权,InfoQ 中文站翻译并分享。


AI2 已发布其免费 NLP 库的官方版本 v1。AllenNLP 使得为几乎任何自然语言处理问题设计和评估新的深度学习模型变得更加容易,同时还提供了在云端或笔记本计算机上轻松运行这些模型的基础架构。

AllenNLP 1.0 现已发布

AllenNLP GitHub 项目地址:https://github.com/allenai/allennlp


AllenNLP 是一个来自 AI2 的免费、开源的自然语言处理平台,该平台的设计初衷是让研究人员能够轻松地构建最先进的模型。AllenNLP 通过提供与研究人员熟悉的概念相关的抽象和 API,以及一套近期文献中的参考实现,加快了将想法转化为有效模型的速度。最近,AI2 发布了 AllenNLP 1.0,为社区提供了新的模型、更好的性能以及新的资源。


AllenNLP 1.0 版本是 AI2 工程团队工作几个月以来的成果(包括超过 500 次 GitHub 提交),代表了该库重要的成熟里程碑。AI2 已经改进了平台的几乎每个角落,从文档到添加新的 NLP 组件,再到调整 API,从而使它们可以更好地为社区提供长期服务。



AllenNLP 演示中的命名实体识别示例。


需要注意的是,目前 AllenNLP 需要 Python 3.6.1 或更高版本。安装 AllenNLP 的首选方式是通过 pip。只需在 Python 环境中运行 pip install allennlp 即可。AllenNLP 支持 Linux 和 Mac OSX,尚不支持 Windows。


AllenNLP 库于 2017 年发布,提供了自然语言组件,研究人员可以轻松地构建新模型。模型架构可以由高级配置语言清楚地指定,这也为科学家们提供了一种简单的方法来实验不同的架构和参数。自发布以来,AllenNLP 已经发展到包括许多模型的参考实现,有超过 20 个模型的交互式演示。GitHub 上有 800 多个开源项目使用了这个库,学术出版物也引用了数百次。要了解更多关于 AllenNLP 平台的信息,请阅读白皮书或查看 AI2 的新指南


为了保持相关性,平台工程师与 AI2 的研究科学家紧密合作,他们正在自然语言处理和人工智能的前沿领域进行着更广泛的创新。ELMo 就是一个这样的例子,在论文《深层次上下文词表征》(Deep contextualized word representations)中已有描述,该论文首先展示了语言模型如何在各种任务中产生显著效果。(要了解更多关于这些模型及其影响的信息,请参阅《上下文词表征:将单词输入计算机》(Contextual Word Representations: Putting Words into Computers))AllenNLP 平台旨在加速新的研究,这些研究利用了 ELMo 等通用模块以及此后开发的其他模块。

版本 1.0 都包括什么?

版本 1.0 的主要亮点包括:


  1. 几个新模型,包括 TransformerQA共指模型(Coreference model)、NMN 阅读理解模型、以及用于文本蕴涵(Textual entailment,TE)的 RoBERTa 模型


译注:文本蕴涵(Textual entailment TE)在自然语言处理是一个文本片段之间的定向关系。拥有一个文本片段的含意时,可以从另一个文本如下关系。TE 的框架中,将会导致必须需要的文本被称为文本(T)和假设(H)作为分别。文本蕴涵是不一样的纯逻辑蕴涵,它有一个更宽松的定义:“T 推导到 H”(T⇒H),通常情况下,如果一个人阅读 T 将推断为 H 是最有可能的正确的关系。文本蕴含关系是有方向性的,如正向的“T 推导到 H”或反向的“H 推导到 T”。


  1. 新的《AllenNLP 指南》(AllenNLP Guide,),这是一个交互式资源,全面介绍了 AI2 的库和实验框架。

  2. 整个库的性能改进,包括切换到原生 PyTorch 数据加载,通过 Apex 启用对 16 位浮点的支持,以及提高多 GPU 训练的效率。

  3. 将模型拆分为单独的模型仓库(allennlp-models),从而提供一个具有较少依赖性的干净核心库。

  4. 将实验框架从核心库组件中解耦,无需实验框架即可更轻松地使用该库,并简化了过程中的配置文件。



AllenNLP 演示中的文本蕴涵示例。

AllenNLP 的下一步

现在版本 1.0 已经发布,AI2 正在壮大他们的平台团队,这样他们就可以更好地为科学家提供构建最先进的自然语言处理模型所需的研究成果。


AI2 计划继续在性能改进和基础设施方面进行投资,以使建立一个广泛的演示库变得更容易,并与 AI2 研究科学家密切合作,以确保该库能够跟上他们的最新研究。


原文链接:


https://medium.com/ai2-blog/allennlp-1-0-df0327445509


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2020-07-03 08:001449
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 495.2 次阅读, 收获喜欢 1968 次。

关注

评论

发布
暂无评论
发现更多内容

Pisanix v0.2.0 发布|新增动态读写分离支持

SphereEx

数据库 开源 ShardingSphere SphereEx

智能电视可以打开小程序应用,再也不用头痛内存了

Geek_99967b

小程序

开发者独立搭建一个跨模态搜索应用有多难?

Jina AI

深度学习 云原生 神经搜索 跨模态应用 多模态数据

《中国综合算力指数》《中国算力白皮书》《中国存力白皮书》《中国运力白皮书》在首届算力大会上重磅发出

蓝海大脑GPU

快速打造安全的车联网平台

Geek_99967b

小程序

直播系统开发——直播间架构的设计及难点分析

开源直播系统源码

软件开发 语聊房 语音聊天源码 直播系统开发

大数据开发,Hadoop Spark太重?你试试esProc SPL

华为云开发者联盟

大数据 开源 后端

百度APP Android包体积优化实践(三)资源优化

百度Geek说

Andriod

Vue3 初探

怀府风

《2022 年上半年全球独角兽企业发展研究报告》发布——DEMO WORLD世界创新峰会圆满落幕

创业邦

如何防止重复下单?

三分恶

8月月更

攻防视角下,初创企业安全实战经验分享

声网

网络安全

中大型商业银行堡垒机升级改造就用行云管家!必看!

行云管家

信息安全 银行 堡垒机 IT安全

如何在Linux (CentOS7.3) 下安装JDK1.8?【一篇文章教会你】

Bug终结者

java; Linux Kenel 8月月更

IDC:阿里云稳居中国大数据平台公有云市场第一位

阿里云大数据AI技术

阿里云

HTTP和HTTPS的区别

开发微hkkf5566

SAP ABAP SteamPunk 蒸汽朋克的最新进展 - 嵌入式蒸汽朋克

Jerry Wang

云原生 Cloud 云平台 SAP 8月月更

【SpringBoot 一】SpringApplication启动类的Args详解

石臻臻的杂货铺

spring-boot 8月月更

【SpringBoot 二】spring.factories加载时机分析

石臻臻的杂货铺

springboot 8月月更

基于 Next.js实现在线Excel

葡萄城技术团队

前端 在线excel nextjs 表格 控件

并发程序的隐藏杀手——假共享(False Sharing)

了不起的程序猿

编程 高并发 java程序员

兆骑科创创新创业大赛活动举办,线上直播路演,投融资对接

兆骑科创凤阁

使用python获取浏览器收藏夹和历史浏览记录,然后可以...

技能实验室

签约计划第三季

2022年7月国产数据库大事记-墨天轮

墨天轮

数据库 腾讯云 GaussDB 国产数据库 KingBase

重构指标之如何监控代码圈复杂度

京东科技开发者

测试 重构 软件重构 分布式应用软件

Mybatis中#{}和${}的区别

开发微hkkf5566

信创是什么意思?涉及哪些行业?为什么要发展信创?

行云管家

信息安全 信创

如何通过使用“缓存”相关技术,解决“高并发”的业务场景案例?

冉然学Java

高并发 java; 单线程 redis'

化繁为简,聊一聊复制状态机系统架构抽象

阿里技术

数据库 架构

《分布式云最佳实践》分论坛,8月11日深圳见

阿里云弹性计算

分布式云 飞天 数字化升级 一云多形态

从-99打造Sentinel高可用集群限流中间件

艾小仙

Java 高可用 sentinel 集群限流

艾伦人工智能研究所发布 AllenNLP 1.0 ,设计和评估新深度学习模型更容易_AI&大模型_Michael Schmitz_InfoQ精选文章