收录了 xnli 频道下的 10 篇内容
自然语言处理系统依赖于使用基于标注数据的有监督学习提高模型的处理能力。目前,许多模型是使用单一语言训练的,并不能直接应用于其他语言。鉴于收集每种语言的语料数据是不现实的,因此如何实现跨语言句子理解和低资源的跨语言迁移得到了越来越多的关注。XNLI论文进一步将多类型自然语言推理语料库的开发和测试集扩展到15种语言,其中甚至包括斯瓦希里语和乌尔都语等低资源语言,构建了一种用于XLU的基准测试数据集。
本文详细介绍目前多语种NLP常用的工具、前沿的算法以及百分点在实际业务中的实验结果等
留不住华人高管的美国企业。
为了加速自然语言处理(NLP)在更多语言上进行零样本迁移,Facebook 扩展并增强了LASER(Language-Agnostic SEntence Representations)工具包,并将其开源。这是第一个成功探索大型多语种句子表示并与广大NLP社区共享的工具。
不少科学家正在研究如何用人工智能使用不同的语言工作,XTREME 便是其中之一。
奇点机智技术团队将结合利用BERT在AI-Challenger机器阅读理解赛道的实践表现以及多年的NLP经验积累,为大家奉上BERT在中文数据集上的fine tune全攻略。
跨越2018,迈入2019,这一周AI领域又发生了哪些新鲜事呢?
本文介绍了5个流行的Python NLP库和它们的入门用法,这些库涵盖了语言数据可视化、数据预处理、多任务功能、一流语言建模等用例。
近期在尝试解决低资源场景下的文本分类任务时,发现使用一些在 ModelScope 社区上开源的零样本分类模型就可以极大提高分类准确率。因此对零样本文本分类模型进行了梳理,希望对大家有所帮助。
对 SPDK 的概念原理做了介绍,包括 SPDK 实现高性能的核心要点、SPDK 线程模型、通道模型等