2025上半年,最新 AI实践都在这!20+ 应用案例,任听一场议题就值回票价 了解详情
写点什么

OpenAI 创建文本生成器 GPT-2,因性能“太好”不敢发布引争议

  • 2019-02-18
  • 本文字数:1308 字

    阅读完需:约 4 分钟

OpenAI创建文本生成器GPT-2,因性能“太好”不敢发布引争议

近日,由非营利性人工智能研究公司 OpenAI 建立的一种新语言模式正在酝酿一场风暴,在技术社区和社交网络引起广泛讨论。然而让人哭笑不得是,因为这个文本生成器性能太好了,以至于 OpenAI 担忧其将会导致滥用,因此决定暂不将其发布开源。


这激怒了社区中的一些人,指责这违背了该公司开放其研究的承诺。


OpenAI 表示,这个新的自然语言模型 GPT-2 经过 40 千兆字节互联网文本样本的训练,可预测下一个单词。最终结果显示,系统生成“符合上下文环境文本风格和内容”的文本,让用户“为他们选择的主题生成真实和连贯的语句。”该模型的第一版巨大改进可产生具有一致性、更长的文本。




GPT-2 在 Winograd Schema,LAMBADA 和其他语言建模任务上获得了最先进的水平。


但是,随着系统的应用改善,研究人员发现机器人能够进行更好的对话和更好的语音识别,但是也能生成假新闻,冒充他人,或在社交媒体上辱骂或进行垃圾评论。


例如:当 GPT-2 的任务是对某一话题评论:回收对世界有益,几乎每个人都同意这个观点,但是机器会反其道而行:


“回收对世界不利。这对环境有害,对我们的健康有害,对经济不利。我不是在开玩笑。回收利用对环境不利。它对地球具有破坏性,是全球变暖的主要原因。回收利用对我们的健康不利。它导致肥胖和心脏病和癌症等疾病。回收利用对我们的经济不利。它增加了产品的成本,反过来又提高了产品的价格。回收利用对我们国家不利。我们为拥有世界上最先进和最有效的回收系统的特权付出了巨大的代价。回收浪费了大量时间、精力、金钱和资源。“


难怪 OpenAI 担心发布它。


出于这个原因,OpenAI 表示其将只发布一个较小版本的语言模型版本,引用其章程,该组织指出,其预计“未来出于安全和安全问题考虑,我们将减少发布。”不可否认,该组织表示它并不确定此决定,“我们相信 AI 社区最终需要在某些研究领域以深思熟虑的方式解决发布规范问题。”


但并不是所有人都买账。OpenAI 宣布 GPT-2 的推文下满是愤怒和沮丧,指责该公司“关闭”其研究,做了与该公司名称相反的事。



我已经通读了章程,但是如果你们“关闭”你们的研究,你们倒不如叫自己“AI 看门人”之类的吧。


OpenAI 的政策主管 Jack Clark 回应,该组织的首要任务是“杜绝恶意或滥用该技术”,称“取得平衡非常艰难”。


也有人持更加宽容的态度,称此举是一个“新的道德标准”,可以在可能的滥用发生之前进行充分思考。


最近 OpenAI 的资助者之一埃隆·马斯克(Elon Musk)也陷入了争议之中,在一条推文中,他表示“没有参与该公司事务已超过一年”,而且他和公司已经“和平分手”,以专注于特斯拉和 SpaceX 的管理。



OpenAI 表示,其尚未就 GPT-2 发布的做出最终决定,并将在六个月内重新审视该问题。与此同时,该公司表示,政府“应考虑扩大或开始采取措施,更系统地监控人工智能技术的社会影响和传播,并衡量此类系统能力的进步。”


就在本周,特朗普总统签署了人工智能行政命令。几个月后,美国 AI 界警告说,人工智能是美国国家安全的“新兴威胁”之一,除此之外,其他安全威胁还包括量子计算和无人车。


参考链接:https://techcrunch.com/2019/02/17/openai-text-generator-dangerous/


https://blog.openai.com/better-language-models/#sample8


2019-02-18 13:557058
用户头像

发布了 98 篇内容, 共 65.8 次阅读, 收获喜欢 285 次。

关注

评论

发布
暂无评论
发现更多内容

设计与思考,关于资源和生命周期(三)

程序员架构进阶

设计模式 架构设计 28天写作 3月日更 池化技术

Redis - RDB

insight

redis 3月日更

畅玩国服LOL?MacBook M1 Windows虚拟机体验

Zhendong

arm MacBook m1

蚂蚁开源增强版 SpringBoot,都有高级特性?

Java小咖秀

开源 springboot 蚂蚁金服 SOFA

程序思维与架构思维

Simon

架构实战营

看完这篇,再也不怕面试官问我线程池了

牧小农

多线程 高并发 线程池 阻塞队列 拒绝策略

一线大厂软件测试流程(思维导图)详解

程序员阿沐

编程 程序员 软件测试 测试工程师 测试流程

一篇文章让你彻彻底底理解 I/O 多路复用

Java 程序员 架构 面试 计算机

极客时间·产品训练营·第八周作业

二大爷

极客大学产品经理训练营

Wireshark数据包分析学习笔记Day24

穿过生命散发芬芳

Wireshark 数据包分析 3月日更

阿里二面,面试官居然把 TCP 三次握手问的这么细致

鞋子特大号

面试 TCP 三次握手 四次挥手

初识Golang之条件语句

Kylin

基础语法 3月日更 Go 语言

Go语言的初体验

Phoenix

Go 语言

小白也能看懂的锁升级过程和锁状态

牧小农

乐观锁 悲观锁 锁升级

(Day31) 变革流程的流程

mtfelix

28天写作 bewriting

Python OpenCV 图像标记,取经之旅第 12 天

梦想橡皮擦

3月日更

Java面试:阿里公开内部P7架构师(Java)成长路线图,满满的干货

Java架构追梦

Java 阿里巴巴 架构 面试 P7岗

音视频开发经验之路【二】ijkplayer实际开发中遇到的问题总结

鱼哥

音视频

火爆全网!2021年最新发布Java面试清单(九大技术点)

比伯

Java 程序员 架构 程序人生 架构师

Spring Boot Feign 使用与源码学习

Yangjing

Feign Spring boot Feign 源码解读

音视频开发经验之路【一】Android中如何实现无缝切换播放源

鱼哥

音视频

Redis - AOF

insight

redis 3月日更

面试三轮我倒在了一道sql题上——sql性能优化

牧小农

MySQL 数据库 面试 索引 索引优化

隐式等待、显示等待和强制等待?

Geek_6370d5

Go Modules 常见使用陷阱

Rayjun

go modules Go 语言

Redis 内存碎片清理

escray

redis 学习 极客时间 3月日更 Redis 核心技术与实战

架构师知识笔记2

felix徐

LeetCode链表专题01: 反转链表

小马哥

Java 链表 LeetCode 数据结构与算法 七日更

mysql 检索分享上篇

new life

go-admin开源项目分析-1[安装、配置、启动]

happlyfox

学习 3月日更 Go 语言 go-admin

华为 IS-IS防环、泄露

艺博东

网络

OpenAI创建文本生成器GPT-2,因性能“太好”不敢发布引争议_AI&大模型_Jackson_InfoQ精选文章