语言模型

收录了语言模型频道下的 50 篇内容

NLP 中的预训练语言模型总结

本文以QA形式总结对比了nlp中的预训练语言模型。

作者 : JayLou 策划: 陈思

2019-09-02

8469

大语言模型进化之谜：涌现现象的挑战与争议

本文围绕大语言模型的涌现相关现象介绍、可能的解释，以及目前关于此的一些争论。

作者 : 张俊林

2023-06-09

字节跳动冯佳时：大语言模型在计算机视觉领域的应用、问题和我们的解法

本次演讲将介绍字节跳动视觉基础研究团队在这个方向的探索与进展，包括 LLMs 在图像理解与视频生成上的阶段性结果。

冯佳时策划: 蔡芳芳AICon 全球人工智能开发与应用大会

2024-09-10

大语言模型加持，是智能运维架构的未来吗？

字节跳动 SRE－Copliot 框架的优势、架构及技术细节。

作者 : 傅宇琪褚杏娟

2024-05-27

面向中文地址的预训练语言模型 GeoBERT

本文来自微信京东数科技术说公众号。

作者 : 京东数字科技产业AI中心

2020-03-22

效果逆天的通用语言模型 GPT 2.0 来了，它告诉了我们什么？

OpenAI在官博介绍了一个大规模无监督NLP模型：GPT 2.0，被称为“史上最强通用NLP模型”。今天这篇文章，来自新浪微博AI Lab的算法专家张俊林将谈一谈自己对GPT 2.0的一些想法。

作者 : 张俊林

2019-02-17

6244

如何在 Java 中基于 LangChain 编写大语言模型应用

如何使用LangChain4j库提供的用来构建大语言模型应用的构建基块。

作者：Kumar Chandrakant 译者: 张卫滨策划: 张卫滨

03-22

解读预训练语言模型的 2019：爆款新模型井喷，BERT 要被全面碾压了吗？

预训练语言模型这一年：“百花”齐放，大厂竞赛持续，超越BERT不止步

作者 : 魏俊秋策划: 刘燕

2019-12-31

3067

《2023 大语言模型综合能力测评报告》出炉：以文心一言为代表的国内产品即将冲出重围

国内外大语言模型的产品能力差异真的很大吗？好像并不是...

作者 : 鲁冬雪

2023-05-29

阿里发布 PLUG：270 亿参数，中文社区最大规模预训练语言模型

刚刚在最权威的中文语言模型榜单 CLUE 上拿到了分类领域第一。

作者 : 赵钰莹

2021-04-19

地表最强语言模型 GPT-3 的局限与出路

在使用这项技术之前，退后几步，想想可能发生的最坏情况。

作者 : Eliza Strickland 译者: Sambodhi 策划: 刘燕

2021-03-24

微软发布 Guidance 语言，用于控制大语言模型

微软推出了一种名为Guidance的领域专属语言，旨在增强开发人员管理当代语言模型的能力。

作者：Andrew Hoblitzell 译者: 平川策划: 丁晓昀

2023-07-06

大型语言模型的提示注入

文章介绍了针对大型语言模型（LLM）的提示注入和提示窃取攻击方式。前者如欺骗汽车经销商机器人达成不合理交易，后者是获取系统提示。攻击 LLM 的原因包括访问业务数据等。防范手段有在提示中加指令、使用对抗性提示检测器和微调模型，但目前没有完全阻止攻击的可靠方案。

作者：Georg Dresler 译者: 平川策划: Tina

02-27

华为预训练语言模型技术与行业应用

在 AICon 北京 2019 大会上，魏俊秋讲师做了《华为预训练语言模型技术与行业应用》主题演讲。

作者 : 魏俊秋

2020-02-12

比 Spark 快 9 倍，超越 ClickHouse，在大语言模型时代构建全新数据平台

人工智能的迅速发展正在改变着我们的世界，对于大数据企业来说更是如此。

作者 : Tina

2023-09-01



华为预训练语言模型技术与行业应用丨 AlCon

，在自然语言生成任务上带来了惊人表现，自此，预训练语言模型开始得到学术界和工业界的极大关注，被认为是开启了自然语言处理的新篇章。

演讲人: 魏俊秋

2020-04-27

微软发布 T-NLG：一个 170 亿参数的语言模型

该模型在硬件和软件层面均由突破性成果进行训练

作者 : Corby Rosset 译者: 王强策划: 赵钰莹

2020-03-09

771

微软和英伟达推出训练语言模型 MT-NLG：5300 亿参数量，是 GPT-3 的 3 倍

OpenAI 最强预训练语言模型 GPT-3 具有 1750 亿个参数，MT-NLG 参数量是前者的 3 倍。

作者 : 核子可乐凌敏

2021-10-12

GPT-3：一个令人失望的语言模型

GPT-3来了，它是否仍然强大？

作者 : nostalgebraist 译者: 王强策划: 陈思

2020-06-15

谷歌开源先进语言模型 Transformer-XL：集 Transformer 和 RNN 之大成

与最先进Transformer模型相比，推理速度能提高300-1800倍

作者 : Rani Horev 译者: Malefikus

2019-01-26

11408

创作场景