AI实践哪家强?来 AICon, 解锁技术前沿,探寻产业新机! 了解详情
写点什么

OpenAI 创建文本生成器 GPT-2,因性能“太好”不敢发布引争议

  • 2019-02-18
  • 本文字数:1308 字

    阅读完需:约 4 分钟

OpenAI创建文本生成器GPT-2,因性能“太好”不敢发布引争议

近日,由非营利性人工智能研究公司 OpenAI 建立的一种新语言模式正在酝酿一场风暴,在技术社区和社交网络引起广泛讨论。然而让人哭笑不得是,因为这个文本生成器性能太好了,以至于 OpenAI 担忧其将会导致滥用,因此决定暂不将其发布开源。


这激怒了社区中的一些人,指责这违背了该公司开放其研究的承诺。


OpenAI 表示,这个新的自然语言模型 GPT-2 经过 40 千兆字节互联网文本样本的训练,可预测下一个单词。最终结果显示,系统生成“符合上下文环境文本风格和内容”的文本,让用户“为他们选择的主题生成真实和连贯的语句。”该模型的第一版巨大改进可产生具有一致性、更长的文本。




GPT-2 在 Winograd Schema,LAMBADA 和其他语言建模任务上获得了最先进的水平。


但是,随着系统的应用改善,研究人员发现机器人能够进行更好的对话和更好的语音识别,但是也能生成假新闻,冒充他人,或在社交媒体上辱骂或进行垃圾评论。


例如:当 GPT-2 的任务是对某一话题评论:回收对世界有益,几乎每个人都同意这个观点,但是机器会反其道而行:


“回收对世界不利。这对环境有害,对我们的健康有害,对经济不利。我不是在开玩笑。回收利用对环境不利。它对地球具有破坏性,是全球变暖的主要原因。回收利用对我们的健康不利。它导致肥胖和心脏病和癌症等疾病。回收利用对我们的经济不利。它增加了产品的成本,反过来又提高了产品的价格。回收利用对我们国家不利。我们为拥有世界上最先进和最有效的回收系统的特权付出了巨大的代价。回收浪费了大量时间、精力、金钱和资源。“


难怪 OpenAI 担心发布它。


出于这个原因,OpenAI 表示其将只发布一个较小版本的语言模型版本,引用其章程,该组织指出,其预计“未来出于安全和安全问题考虑,我们将减少发布。”不可否认,该组织表示它并不确定此决定,“我们相信 AI 社区最终需要在某些研究领域以深思熟虑的方式解决发布规范问题。”


但并不是所有人都买账。OpenAI 宣布 GPT-2 的推文下满是愤怒和沮丧,指责该公司“关闭”其研究,做了与该公司名称相反的事。



我已经通读了章程,但是如果你们“关闭”你们的研究,你们倒不如叫自己“AI 看门人”之类的吧。


OpenAI 的政策主管 Jack Clark 回应,该组织的首要任务是“杜绝恶意或滥用该技术”,称“取得平衡非常艰难”。


也有人持更加宽容的态度,称此举是一个“新的道德标准”,可以在可能的滥用发生之前进行充分思考。


最近 OpenAI 的资助者之一埃隆·马斯克(Elon Musk)也陷入了争议之中,在一条推文中,他表示“没有参与该公司事务已超过一年”,而且他和公司已经“和平分手”,以专注于特斯拉和 SpaceX 的管理。



OpenAI 表示,其尚未就 GPT-2 发布的做出最终决定,并将在六个月内重新审视该问题。与此同时,该公司表示,政府“应考虑扩大或开始采取措施,更系统地监控人工智能技术的社会影响和传播,并衡量此类系统能力的进步。”


就在本周,特朗普总统签署了人工智能行政命令。几个月后,美国 AI 界警告说,人工智能是美国国家安全的“新兴威胁”之一,除此之外,其他安全威胁还包括量子计算和无人车。


参考链接:https://techcrunch.com/2019/02/17/openai-text-generator-dangerous/


https://blog.openai.com/better-language-models/#sample8


2019-02-18 13:557090
用户头像

发布了 98 篇内容, 共 66.1 次阅读, 收获喜欢 285 次。

关注

评论

发布
暂无评论
发现更多内容

Java开发快速学习!三面蚂蚁金服成功拿到offer后,他说他累了

策划Java工程师

Java 程序员 后端

架构实战营毕业总结

eoeoeo

架构实战营

Python3 运算符

Geek_aee0b4

Java开发基础不牢?什么是中间件?

策划Java工程师

Java 程序员 后端

怎样回到常识做投资?

石云升

投资 8月日更 启发

币安链NFT游戏系统开发区块链技术

薇電13242772558

区块链 智能合约

从错误中成长

escray

学习 极客时间 朱赟的技术管理课 8月日更

特斯拉自研超算Dojo本月亮相? UCLA教授发推提前泄密

百度开发者中心

自动驾驶 最佳实践 方法论 科技信息

Java开发前景怎么样?【Spring Boot 21

策划Java工程师

Java 程序员 后端

终于有人把操作系统,网络系统,线程进程,IO模型全部总结出来了

程序员 架构 面试 操作系统 计算机

IT公司防止运维偷窥和篡改数据库的最佳武器-云堡垒机!

行云管家

数据安全 堡垒机 数据泄露

双非本科电子跨专业,苦学八个月,投岗阿里/滴滴后端三面,最终拿下offer

今晚早点睡

Java 阿里巴巴 面试 计算机

博睿数据App 3.0四大新功能来袭,大幅提升App用户体验可见性

博睿数据

趁着课余时间学点Python(四)真的花点课余时间就能理解的分支控制语句

ベ布小禅

8月日更

毕业总结

Vincent

架构训练营

亏损、退市、卖身...区块链如何挽救影视行业?

CECBC

极狐 GitLab 探秘系列|极狐 GitLab 初探(下)

极狐GitLab

DevOps DevSecOps gitops

2021年7月云主机性能评测报告出炉,华为云再登榜首

博睿数据

导致我们形不成「自律」的「罪魁祸首」

非著名程序员

提升认知 个人提升 自律 8月日更

全国首笔“区块链+闲置住宅”交易在昆山完成

CECBC

人工智能从业者需要掌握哪些数学知识

小术晓术

人工智能 数学

Python3 数字

Geek_aee0b4

ipfs矿机怎么买?ipfs矿机在哪买?

ipfs矿机怎么买 ipfs矿机在哪买

TCL携大屏天团领跑UDE,斩获多项创新大奖

科技热闻

Java开发基础面试题,【springcloud

策划Java工程师

Java 程序员 后端

模块四考试试卷存储方案

kitten

模块四

区块链的兴起及其司法运用

CECBC

应届生怎么走Linux下C++后台服务器开发路线,工作3-5年的知识体系

Linux服务器开发

Linux C/C++ linux开发 Linux服务器开发 Linux后台开发

架构实战营模块3作业指导

华仔

架构实战营

国内外 DevOps/DevSecOps 报告对比解读:安全与云原生持续升温

极狐GitLab

DevOps 安全 DevSecOps

2021年《中国DevOps现状调查报告》正式发布!GitLab被选为使用率最高的开源软件安全类工具(内附下载链接)

极狐GitLab

OpenAI创建文本生成器GPT-2,因性能“太好”不敢发布引争议_AI&大模型_Jackson_InfoQ精选文章