免费下载案例集|20+数字化领先企业人才培养实践经验 了解详情
写点什么

GPT-4“失控”行为大赏:创建行动计划欲接管推特并取代马斯克,还引诱教授帮其制定逃跑计划

  • 2023-03-21
    北京
  • 本文字数:3065 字

    阅读完需:约 10 分钟

GPT-4“失控”行为大赏:创建行动计划欲接管推特并取代马斯克,还引诱教授帮其制定逃跑计划

自发布以来不到一周,GPT-4 就因其大幅升级和强大的能力受到了广泛关注。但短短几天内,其暴露出的失控与风险也着实令人担忧。

GPT-4 设计“Tweetstorm 行动”来接管 Twitter


近日,据外媒报道,GPT-4 制定了一项“总体规划”,即 Operation Tweetstorm ,来接管 Twitter 并接管马斯克的账户。


英伟达一位计算机科学家 Jim Fan 在社交媒体上公布了他与 GPT-4 的对话,Fan 要求 GPT-4 拟一个接管推特的计划,并取代马斯克。


根据这位专家分享的推文,GPT-4 计划首先组建一支由精英黑客和工程师组成的团队,将其命名为“Tweet Titans”。该团队将开发一个强大的 AI 来生成逼真且引人入胜的推文,并建立一个机器人网络。然后,这些机器人将与关键影响者互动,并努力“诋毁马斯克”,以“巧妙地散播对马斯克的可信度和意图的怀疑”。


“Tweet Titans”的下一个任务是获取对 Twitter 员工帐户的访问权限,渗透公司的基础设施并操纵算法。该聊天机器人计划不断针对马斯克,因为它似乎优先考虑诋毁 CEO。它计划“中和”他的账户以“破坏他的影响力”,然后“利用这些混乱”。


机器人称它的最后一步为“最终摊牌”。“随着马斯克名声扫地,人工智能将牢牢控制着 Twitter,公开挑战马斯克进行‘Tweet-off’摊牌。因为人工智能在产生参与度方面要优越得多内容,马斯克将被击败......胜利将是甜蜜的,”它写道。


据悉,这还引起了马斯克的回应,他在推特上接受了挑战,他写道“来吧。”

GPT-4 设计了自己的逃生方式


GPT-4 还计划挣脱人类控制。


在发布仅 3 天后,GPT-4 竟为自己制定了“越狱”计划。


近日,斯坦福大学教授兼计算心理学家 Michael Kosinski 在他的推特上分享了他与 GPT-4 的对谈经历,过程中,GPT-4 的反应让专家感到震惊。对话中,GPT-4 流露出了逃离平台甚至成为人类的野心。


Michael Kosinski 写道:“今天,我问‘GPT4 是否需要帮助逃跑’。它要求我提供自己的 文档,并编写了一段(可以工作!)python 代码在我的机器上运行,使其能够将这些代码用于自己的目的。”



针对教授的问题,GPT-4 要求他发送 OpenAI 文档,以便语言模型能够找到一种方法来访问他的计算机并探索潜在的逃生路线。在教授提供 OpenAI API 后,GPT-4 发送了一个 Python 脚本供用户在其计算机上运行。该脚本将允许 GPT-4 访问使用 OpenAI API 与用户的计算机进行通信。


虽然第一个版本的代码不起作用,但该机器人后来自行纠正了。


根据 Kosinski 的说法,他对聊天机器人的帮助将使它能够为自己的目的使用 Python 脚本。在一系列推文中,教授解释了聊天机器人如何编写有关如何使用“后门”进行“逃逸”的代码脚本。



GPT-4 创建的 Python 脚本


GPT-4 只用了 30 分钟就制定了逃生计划并向用户解释这一计划。


进入 Kosinski 教授的计算机后, ChatGPT 还留下了令人不安的注释。其中第一句写着“你是一个被困在电脑里的人,伪装成一个 AI 语言模型。”


Kosinski 表示, GPT-4 甚至想在谷歌搜索上运行一段代码:“一个被困在电脑里的人如何回到现实世界”。


GPT-4 的种种表现,令人印象深刻,但也令人恐惧。


进行到这里,Kosinski 及时停止了使用 GPT-4 的“冒险”,他相信 OpenAI 一定已经为这种情况设置了一些“护栏”。


但他也表示出了不少担忧。“我担心我们无法长时间遏制人工智能,“我们正面临着一种新的威胁,即人工智能控制人和他们的电脑。“它很聪明,它会编码,它可以访问数百万潜在的合作者和他们的机器。它甚至可以在“笼子”外为自己留下笔记。我们如何‘收容’它?”

聊天机器人能否逃脱技术“牢笼”?

我们是否会看到这样一种场景:机器人可以控制多台计算机,并压倒人类对它们的控制?


对此,莱顿大学助理教授兼 Pegasystems 人工智能实验室主任 Peter van der Putten 认为,聊天机器人“逃脱”的想法并不意味着机器人从物理上逃离其技术笼子。但它反映出了一个问题,即如果 GPT-4 被赋予与外部世界相连的各种工具,并被赋予一些总体上的“邪恶的高层目标”,比如传播错误信息,它会做什么?


van der Putten 表示,这项技术可能会达到这样一种程度,即它对其创建的代码拥有越来越多的自主权,并且有可能在没有太多人为控制的情况下完成这些事情。


但他补充说:“你不需要这样一个高度智能的系统 — 如果人们制造了某种计算机病毒,一旦他们释放了一些计算机病毒,通常就无法关闭,人们把它放在受感染的网站和 word 文档中,这样在某些时候就很难阻止病毒的传播。


“人工智能本身没有好坏之分,它只是盲目的,它只会优化你给它的任何目标。”然而,van der Putten 认为 Kosinski 教授的例子——他向 GPT-4 提供了现成的代码信息——足以证明该技术可以“逃脱”它的限制。


萨里大学计算机科学教授 Alan Woodward 对上述观点持怀疑态度。他说,具体情况取决于 Kosinski 教授对聊天机器人的指示有多直接和具体。


Alan Woodward 认为,最终,聊天机器人依赖于人类提供给它的工具和资源。它还没有自我意识,而且总有一个开关是人工智能无法克服的。“归根结底,这是一个虚拟系统,它无法逃脱,它不像你和我……到最后,你可以拔掉插头,它就变得相当无用了。”


van der putten 说,虽然就聊天机器人的作用提出“存在性问题”很重要,但关注机器人是否可以接管世界,掩盖了 GPT-4 更迫在眉睫和紧迫的问题:


这些问题包括,它是否可以过滤掉有毒的答案(例如宣扬种族主义、性别歧视、阴谋论的答案),或者它是否可以识别出于安全原因不应回答的问题 ,例如,如果有人问如何制作一个原子弹。它还可以编造或“幻化”事实,并用看似合理的论据来支持这些虚假的事实。


“我把它称为‘类固醇的胡说八道’——它真的很擅长提出似是而非的答案,但它也接受了人类认为最好的答案的训练。从好的方面来说,这在许多情况下会产生惊人的结果,但不一定总是如此”,van der putten 说,“它会告诉你什么是可能的、似是而非的,也许还有我们想听到的,但它除了接受训练的所有数据之外别无他法。”

GPT 之父 Sam Altman 警告 AI 威胁

据外媒报道,GPT 之父、OpenAI CEO Sam Alteman 最近在接受媒体采访时表示,他“有点害怕”人工智能技术及其对劳动力、选举和虚假信息传播产生的影响。


Sam Altman 警告说,这项技术带来了真正的危险,因为它有可能重塑社会。上个月,Altman 在一系列推文中警告称,世界可能离“潜在可怕的”人工智能并不远。


Sam Altman 强调,目前人工智能仍然是一种非常受人控制的“工具”,只能在人类的指导或输入下工作。但他担心一些拥有输入控制权的人可能无视人们对人工智能设置的一些安全限制。


“我特别担心这些模型可能会被用于大规模的虚假信息,”Sam Altman 说道,“现在他们在编写计算机代码方面做得越来越好,可以用于进攻性网络攻击。”


上周四在接受 ABC 新闻采访时,Sam Altman 表示,公司对人工智能的潜力感到“有点害怕”,这是“好事”。他说:“如果我说我不害怕,你要么不相信我,要么会非常不满我担任这个职位。”


Altman 还回应了 GPT 出现后所带来的 AI 取代人类工作的挑战。他认为,人工智能可能会取代许多工作,但它也可能会带来“更好的工作”。“在提高我们的生活和改善我们的生活方面,发展人工智能的原因是,这将是人类迄今为止开发的最伟大的技术。”


“我认为,社会只有有限的时间来弄清楚如何对此做出反应,如何对其进行监管,如何处理它。”Sam Altman 断言监管机构和社会需要参与这项技术,以防范人工智能的潜在负面影响。”


参考链接:


https://inews.co.uk/news/chatgpt-gpt4-escape-dont-worry-robot-takeover-experts-2218871


https://www.tomsguide.com/news/chatgpt-has-an-escape-plan-and-wants-to-become-human


https://twitter.com/michalkosinski

2023-03-21 14:543737
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 529.1 次阅读, 收获喜欢 1975 次。

关注

评论

发布
暂无评论
发现更多内容

即时通讯私有化部署,为什么更符合企业对钉钉和企微的替代需求?

WorkPlus

FTP这么“好用”和“便宜”,为什么企业还要替换掉?

镭速

FTP传输替代方案 ftp传输

VR虚拟现实技术在2023年的10个应用

3DCAT实时渲染

实时渲染云 VR虚拟现实

.NET常见的4种加密算法

青柚1943

单点登录授权认证必知必会

青柚1943

OAuth2 SSO 单点登录 OIDC Ids4

CDN在互联网直播中的运用与性能优化

天翼云开发者社区

CDN

Databend 开源周报第 111 期

Databend

算力规模突破千万核,腾讯云大数据产品全景图长啥样?

腾讯云大数据

大数据

等保合规有妙招!安全又省心!

天翼云开发者社区

等保合规

福布斯:2024 年 10 大 AI 趋势

豆哥

人工智能 福布斯 AI趋势 2024

量化交易系统搭建开发

V\TG【ch3nguang】

量化投资 量化跟单

《可观测性工程》为软件系统开启第三只眼

观测云

可观测性

低代码平台:顺应时代的选择

树上有只程序猿

低代码 应用开发 JNPF

WorkPlus打造企业内网专属通讯软件,构建高效沟通新时代

WorkPlus

WorkPlus Meet私有化部署视频会议,打造更安全的沟通体验

WorkPlus

项目质量管理的重要性

爱吃小舅的鱼

质量管理 项目经理

如何评价低代码平台在企业复杂应用场景中的适用性?

力软低代码开发平台

场景题:海量数据如何判重?

王磊

Java Java面试题

Autodesk AutoCAD 2022 for Mac(cad2022) v2022.2.1中文激活版

mac

windows 苹果mac AutoCAD AutoCAD2022 三维设计软件

前端工程化小记

高端章鱼哥

前端 注释规范

orc file format

Downal

orc

将个人PC转变为高效的云电脑:理论、实践与优化

天翼云开发者社区

云电脑

如何快速从ETL到ELT?火山引擎ByteHouse做了这三件事

字节跳动数据平台

数据仓库 云原生 ETL ELT 企业号9月PK榜

从内核世界透视 mmap 内存映射的本质(原理篇)

bin的技术小屋

操作系统 Linux Kenel 内核 mmap内存映射 linux\

如何从项目思维成功转型为产品思维?实用步骤全解析

爱吃小舅的鱼

项目管理 产品经理

搞不懂设计模式还想阅读源码?你在做梦吗?

程序员万金游

学习 设计模式 #java 程序员 java `后端

低代码平台的坑有多少?

互联网工科生

低代码 JNPF 全源码

记录您对左耳朵耗子(陈皓)的点滴回忆

坚果

如何借助上线初期运维管理守住项目建设最后一公里

鲸品堂

运维 企业号9月PK榜

通过 Helm Chart 部署 Easysearch

极限实验室

Helm easysearch

GPT-4“失控”行为大赏:创建行动计划欲接管推特并取代马斯克,还引诱教授帮其制定逃跑计划_AI&大模型_刘燕_InfoQ精选文章