写点什么

OpenAI 创建文本生成器 GPT-2,因性能“太好”不敢发布引争议

  • 2019-02-18
  • 本文字数:1308 字

    阅读完需:约 4 分钟

OpenAI创建文本生成器GPT-2,因性能“太好”不敢发布引争议

近日,由非营利性人工智能研究公司 OpenAI 建立的一种新语言模式正在酝酿一场风暴,在技术社区和社交网络引起广泛讨论。然而让人哭笑不得是,因为这个文本生成器性能太好了,以至于 OpenAI 担忧其将会导致滥用,因此决定暂不将其发布开源。


这激怒了社区中的一些人,指责这违背了该公司开放其研究的承诺。


OpenAI 表示,这个新的自然语言模型 GPT-2 经过 40 千兆字节互联网文本样本的训练,可预测下一个单词。最终结果显示,系统生成“符合上下文环境文本风格和内容”的文本,让用户“为他们选择的主题生成真实和连贯的语句。”该模型的第一版巨大改进可产生具有一致性、更长的文本。




GPT-2 在 Winograd Schema,LAMBADA 和其他语言建模任务上获得了最先进的水平。


但是,随着系统的应用改善,研究人员发现机器人能够进行更好的对话和更好的语音识别,但是也能生成假新闻,冒充他人,或在社交媒体上辱骂或进行垃圾评论。


例如:当 GPT-2 的任务是对某一话题评论:回收对世界有益,几乎每个人都同意这个观点,但是机器会反其道而行:


“回收对世界不利。这对环境有害,对我们的健康有害,对经济不利。我不是在开玩笑。回收利用对环境不利。它对地球具有破坏性,是全球变暖的主要原因。回收利用对我们的健康不利。它导致肥胖和心脏病和癌症等疾病。回收利用对我们的经济不利。它增加了产品的成本,反过来又提高了产品的价格。回收利用对我们国家不利。我们为拥有世界上最先进和最有效的回收系统的特权付出了巨大的代价。回收浪费了大量时间、精力、金钱和资源。“


难怪 OpenAI 担心发布它。


出于这个原因,OpenAI 表示其将只发布一个较小版本的语言模型版本,引用其章程,该组织指出,其预计“未来出于安全和安全问题考虑,我们将减少发布。”不可否认,该组织表示它并不确定此决定,“我们相信 AI 社区最终需要在某些研究领域以深思熟虑的方式解决发布规范问题。”


但并不是所有人都买账。OpenAI 宣布 GPT-2 的推文下满是愤怒和沮丧,指责该公司“关闭”其研究,做了与该公司名称相反的事。



我已经通读了章程,但是如果你们“关闭”你们的研究,你们倒不如叫自己“AI 看门人”之类的吧。


OpenAI 的政策主管 Jack Clark 回应,该组织的首要任务是“杜绝恶意或滥用该技术”,称“取得平衡非常艰难”。


也有人持更加宽容的态度,称此举是一个“新的道德标准”,可以在可能的滥用发生之前进行充分思考。


最近 OpenAI 的资助者之一埃隆·马斯克(Elon Musk)也陷入了争议之中,在一条推文中,他表示“没有参与该公司事务已超过一年”,而且他和公司已经“和平分手”,以专注于特斯拉和 SpaceX 的管理。



OpenAI 表示,其尚未就 GPT-2 发布的做出最终决定,并将在六个月内重新审视该问题。与此同时,该公司表示,政府“应考虑扩大或开始采取措施,更系统地监控人工智能技术的社会影响和传播,并衡量此类系统能力的进步。”


就在本周,特朗普总统签署了人工智能行政命令。几个月后,美国 AI 界警告说,人工智能是美国国家安全的“新兴威胁”之一,除此之外,其他安全威胁还包括量子计算和无人车。


参考链接:https://techcrunch.com/2019/02/17/openai-text-generator-dangerous/


https://blog.openai.com/better-language-models/#sample8


2019-02-18 13:557123
用户头像

发布了 98 篇内容, 共 66.6 次阅读, 收获喜欢 285 次。

关注

评论

发布
暂无评论
发现更多内容

基于crudapi后端Java SDK二次开发之API认证和鉴权(二)

crudapi

API Cookie JWT crud basic auth

zookeeper-认识watcher

zarmnosaj

7月月更

通过Dao投票STI的销毁,SeekTiger真正做到由社区驱动

股市老人

Envoy生命周期管理

阿泽🧸

envoy 7月月更

数据库的主从分离

ES_her0

7月月更

值得收藏的ArkUI框架三方组件【系列1】

坚果

HarmonyOS Open Harmony 7月月更

【Docker 那些事儿】容器网络(上篇)

Albert Edison

Docker Kubernetes 容器 云原生 7月月更

HMS Core图形图像技术展现最新功能和应用场景,加速构建数智生活

最新动态

基于多数据源零代码同时生成多个数据库CRUD增删改查RESTful API接口——MySql,PostgreSql,Oracle,Microsoft SQL Server多数据源

crudapi

Java 数据库 Spring Boot crudapi 多数据源

开发者必看 | DevWeekly 第1期:什么是时间复杂度?

Jackpop

如何优雅地使用 Git?

Jackpop

应用的无状态设计

穿过生命散发芬芳

7月月更 应用无状态

MySQL到底是如何执行SQL语句的

技术小生

MySQL 7月月更

JVM-SANDBOX导致目标服务JVM Metaspace OOM的调查始末

柠檬汁Code(binbin0325)

互联网 字节码增强 故障排查

为什么 Nodejs 这么快?

devpoint

nodejs V8 视频流 7月月更

带领全网朋友,完成粉笔登录加密分析,再次换种玩法

梦想橡皮擦

Python 爬虫 7月月更

putchar()

謓泽

7月月更

Python 有哪些好玩的语法糖?

Jackpop

为什么加工数据指标

奔向架构师

数据仓库 7月月更

深度学习-多维数据和tensor

AIWeker

7月月更 多维数据

新星计划Day9【数据结构与算法】 递归

京与旧铺

7月月更

ES6之箭头函数

bo

前端 ES6 箭头函数 7月月更

面试官:工作两年了,这么简单的算法题你都不会?

掘金安东尼

程序员 面试 算法 前端 7月月更

CodeTON Round 1 (Div. 1 + Div. 2, Rated, Prizes)(A-C)

KEY.L

7月月更

一次业务问题对ES的cardinality原理探究

Chares

Java elasticsearch 后端开发 问题排查 问题分析

MySQL 5.7.37数据库下载安装教程(Windows无需安装版)

未见花闻

7月月更

jQuery 操作元素

Jason199

jquery js 7月月更

Markdown 基本语法格式

攻城狮杰森

markdown 7月月更

Bigdata 作业 第14&15周

Pyel

如何高效系统学习 MySQL?

Jackpop

不要在白嫖Github了!

Jackpop

OpenAI创建文本生成器GPT-2,因性能“太好”不敢发布引争议_AI&大模型_Jackson_InfoQ精选文章