时隔16年Jeff Barr重返10.23-25 QCon上海站，带你看透AI如何重塑软件开发！了解详情 



 写点什么

GPT-2

收录了 GPT-2 频道下的 50 篇内容

效果逆天的通用语言模型 GPT 2.0 来了，它告诉了我们什么？

OpenAI在官博介绍了一个大规模无监督NLP模型：GPT 2.0，被称为“史上最强通用NLP模型”。今天这篇文章，来自新浪微博AI Lab的算法专家张俊林将谈一谈自己对GPT 2.0的一些想法。

作者 : 张俊林

2019-02-17

6244

深度迁移学习在 NLP 中的应用：选 BERT 还是被评逆天的 GPT 2.0？

吴恩达曾说：迁移学习将会是继监督学习之后下一个机器学习商业成功的驱动力。

作者 : 赵钰莹

2019-12-04

2896

GPT-2 和 Transformer 很好用，但不是 AI 生成文本的最终目标

如何使用GPT-2制作自定义AI生成的文本。

作者 : Max Wolf 译者: 姚佳灵策划: 陈思

2019-10-16

894

Karpathy 又整活儿了！一天训练出 GPT-2、成本还骤降 100 倍，网友：dream 老黄把价格再打下来

单个八 H100节点+24小时+672美元+llm.c=成功重现GPT-2（1.6B）

作者 : 褚杏娟核子可乐

2024-07-12

我用 GPT-2 开发了一个 AI 写作应用，并总结了这些经验教训

我们的主要目标是构建一套能够快速交付OpenAI GPT-2 Medium（一套用于生成文本的机器学习模型），并同时支持10到20款面向重度用户的应用程序。

作者 : Senrigan 译者: 核子可乐策划: 蔡芳芳

2019-11-30

2662

GPT-2 大战 GPT-3：OpenAI 内部的一场终极对决

GPT-2 和GPT-3 哪个好，应该选哪个 Transformer ？

作者 : Kevin Vu 译者: Sambodhi 策划: 刘燕

2021-02-23

神秘大模型一夜“征服”所有人，超 GPT-4 却无人认领？网友：OpenAI 要有大麻烦了

整理 | 华卫基准测试网站的神秘模型，在大模型领域掀起了巨大波澜。gpt2-chatbot。没有出处，也没有介绍，在没有官方文件的情况下，一夜间“惊艳”所有人的视线。

作者 : 华卫

2024-04-30

强大如 GPT-3，1750 亿参数也搞不定中国话

给GPT-3泼点儿冷水。

作者 : 陈思

2020-08-14

史上最强 NLP 模型不开源惹众怒，马斯克亲自回应

创始人退出，新模型被骂，OpenAI到底犯了什么错？

作者 : 陈利鑫

2019-02-19

3701

OpenAI 官宣旗舰模型 GPT-4o，完全免费、无障碍与人交谈！奥特曼：这是我们最好的模型

就在刚刚，OpenAI 官宣了 Altman 口中的“就像魔法一样”的东西。

作者 : 李冬梅褚杏娟

2024-05-14

基于 Mindspore2.0 的 GPT2 预训练模型迁移教程

这篇文章主要目的是为了让大家能够清楚如何用MindSpore2.0来进行模型的迁移。

人工智能

华为云

华为云开发者联盟

企业号 3 月 PK 榜

华为云开发者联盟

2023-03-10

大语言模型的预训练 [2]:GPT、GPT2、GPT3、GPT3.5、GPT4 相关理论知识和模型实现、模型应用以及各个版本之间的区别详解 |社区征文

大语言模型的预训练[2]:GPT、GPT2、GPT3、GPT3.5、GPT4相关理论知识和模型实现、模型应用以及各个版本之间的区别详解 |社区征文

人工智能

自然语言处理

GPT

GPT-4

年中技术盘点

汀丶人工智能

2023-07-18

Python 之父宣布退休；谷歌推出 TensorFlow 企业版；OpenAI 随时准备开源 GPT-2 完整代码 | AI 一周资讯

AI一周资讯甄选全球最新行业动态，着眼影响技术变革的大事件，聚焦业内专家学者的发声，为读者呈现出内容丰富且有价值的新闻资讯。

作者 : 李冬梅

2019-11-03

2767

NLP 中的预训练语言模型总结

本文以QA形式总结对比了nlp中的预训练语言模型。

作者 : JayLou 策划: 陈思

2019-09-02

8469

AI 周报：Tumblr 用户控诉 TensorFlow 不如 PyTorch；2019 全球 AI 报告：每天 2 亿美元投入 AI 领域，1/10 砸向自动驾驶；纽约大学开发出 BLiMP，可测试 BERT 和 GPT-2 等语言模型

“AI 一周资讯”栏目甄选全球最新行业动态，着眼影响技术变革的大事件，聚焦业内专家学者的发声，为读者呈现出内容丰富且有价值的新闻资讯。

作者 : 李冬梅

2019-12-15

2447

最强 NLP 预训练模型库 PyTorch-Transformers 正式开源：支持 6 个预训练框架，27 个预训练模型

日前，Github 上有一个非常不错的 NLP 工具发布了：PyTorch-Transformers。该项目支持 BERT、GPT、GPT-2、Transformer-XL、XLNet、XLM等，并包含了 27 个预训练模型。

作者 : Hugging Face 译者: Sambodhi

2019-07-23

8462

第四范式开源强化学习研究通用框架，支持单智能体、多智能体训练，还可训练自然语言任务！训练速度提升 17%

OpenRL 是由第四范式强化学习团队开发的基于 PyTorch 的强化学习研究框架，支持单智能体、多智能体、自然语言等多种任务的训练。OpenRL 基于 PyTorch 进行开发，目标是为强化学习研究社区提供一个简单易用、灵活高效、可持续扩展的平台。

作者：黄世宇，第四范式强化学习研究员策划: 刘燕

2023-05-06

“真男人就应该用 C 编程”！用 1000 行 C 代码手搓了一个大模型，Mac 即可运行，特斯拉前 AI 总监爆火科普 LLM

徒手用 1000 行 C 语言实现，不依赖庞大的外部库，Mac 即可运行。

作者 : 核子可乐Tina

2024-04-09

被全球追捧的 ChatGPT，在实际 AI 应用场景表现如何？

我们在实际NLP应用场景下对比了ChatGPT和自研技术的效果。

作者 : 詹坤林策划: 刘燕

2023-03-14

最强假新闻生成器 GPT-2 终于开源完整版本，15 亿参数模型全部公开

OpenAI表示：目前暂没有直接证据表明GPT-2遭到滥用。

作者 : OpenAI官博译者: 核子可乐陈思策划: 蔡芳芳

2019-11-06

1902

创作场景

GPT-2

效果逆天的通用语言模型 GPT 2.0 来了，它告诉了我们什么？

深度迁移学习在 NLP 中的应用：选 BERT 还是被评逆天的 GPT 2.0？

GPT-2 和 Transformer 很好用，但不是 AI 生成文本的最终目标

Karpathy 又整活儿了！一天训练出 GPT-2、成本还骤降 100 倍，网友：dream 老黄把价格再打下来

我用 GPT-2 开发了一个 AI 写作应用，并总结了这些经验教训

GPT-2 大战 GPT-3：OpenAI 内部的一场终极对决

神秘大模型一夜“征服”所有人，超 GPT-4 却无人认领？网友：OpenAI 要有大麻烦了

强大如 GPT-3，1750 亿参数也搞不定中国话

史上最强 NLP 模型不开源惹众怒，马斯克亲自回应

OpenAI 官宣旗舰模型 GPT-4o，完全免费、无障碍与人交谈！奥特曼：这是我们最好的模型

基于 Mindspore2.0 的 GPT2 预训练模型迁移教程

大语言模型的预训练 [2]:GPT、GPT2、GPT3、GPT3.5、GPT4 相关理论知识和模型实现、模型应用以及各个版本之间的区别详解 |社区征文

Python 之父宣布退休；谷歌推出 TensorFlow 企业版；OpenAI 随时准备开源 GPT-2 完整代码 | AI 一周资讯

NLP 中的预训练语言模型总结

AI 周报：Tumblr 用户控诉 TensorFlow 不如 PyTorch；2019 全球 AI 报告：每天 2 亿美元投入 AI 领域，1/10 砸向自动驾驶；纽约大学开发出 BLiMP，可测试 BERT 和 GPT-2 等语言模型

最强 NLP 预训练模型库 PyTorch-Transformers 正式开源：支持 6 个预训练框架，27 个预训练模型

第四范式开源强化学习研究通用框架，支持单智能体、多智能体训练，还可训练自然语言任务！训练速度提升 17%

“真男人就应该用 C 编程”！用 1000 行 C 代码手搓了一个大模型，Mac 即可运行，特斯拉前 AI 总监爆火科普 LLM

被全球追捧的 ChatGPT，在实际 AI 应用场景表现如何？

最强假新闻生成器 GPT-2 终于开源完整版本，15 亿参数模型全部公开

热点文章