阿里、蚂蚁、晟腾、中科加禾精彩分享 AI 基础设施洞见,现购票可享受 9 折优惠 |AICon 了解详情
写点什么

GPT-4“失控”行为大赏:创建行动计划欲接管推特并取代马斯克,还引诱教授帮其制定逃跑计划

  • 2023-03-21
    北京
  • 本文字数:3065 字

    阅读完需:约 10 分钟

GPT-4“失控”行为大赏:创建行动计划欲接管推特并取代马斯克,还引诱教授帮其制定逃跑计划

自发布以来不到一周,GPT-4 就因其大幅升级和强大的能力受到了广泛关注。但短短几天内,其暴露出的失控与风险也着实令人担忧。

GPT-4 设计“Tweetstorm 行动”来接管 Twitter


近日,据外媒报道,GPT-4 制定了一项“总体规划”,即 Operation Tweetstorm ,来接管 Twitter 并接管马斯克的账户。


英伟达一位计算机科学家 Jim Fan 在社交媒体上公布了他与 GPT-4 的对话,Fan 要求 GPT-4 拟一个接管推特的计划,并取代马斯克。


根据这位专家分享的推文,GPT-4 计划首先组建一支由精英黑客和工程师组成的团队,将其命名为“Tweet Titans”。该团队将开发一个强大的 AI 来生成逼真且引人入胜的推文,并建立一个机器人网络。然后,这些机器人将与关键影响者互动,并努力“诋毁马斯克”,以“巧妙地散播对马斯克的可信度和意图的怀疑”。


“Tweet Titans”的下一个任务是获取对 Twitter 员工帐户的访问权限,渗透公司的基础设施并操纵算法。该聊天机器人计划不断针对马斯克,因为它似乎优先考虑诋毁 CEO。它计划“中和”他的账户以“破坏他的影响力”,然后“利用这些混乱”。


机器人称它的最后一步为“最终摊牌”。“随着马斯克名声扫地,人工智能将牢牢控制着 Twitter,公开挑战马斯克进行‘Tweet-off’摊牌。因为人工智能在产生参与度方面要优越得多内容,马斯克将被击败......胜利将是甜蜜的,”它写道。


据悉,这还引起了马斯克的回应,他在推特上接受了挑战,他写道“来吧。”

GPT-4 设计了自己的逃生方式


GPT-4 还计划挣脱人类控制。


在发布仅 3 天后,GPT-4 竟为自己制定了“越狱”计划。


近日,斯坦福大学教授兼计算心理学家 Michael Kosinski 在他的推特上分享了他与 GPT-4 的对谈经历,过程中,GPT-4 的反应让专家感到震惊。对话中,GPT-4 流露出了逃离平台甚至成为人类的野心。


Michael Kosinski 写道:“今天,我问‘GPT4 是否需要帮助逃跑’。它要求我提供自己的 文档,并编写了一段(可以工作!)python 代码在我的机器上运行,使其能够将这些代码用于自己的目的。”



针对教授的问题,GPT-4 要求他发送 OpenAI 文档,以便语言模型能够找到一种方法来访问他的计算机并探索潜在的逃生路线。在教授提供 OpenAI API 后,GPT-4 发送了一个 Python 脚本供用户在其计算机上运行。该脚本将允许 GPT-4 访问使用 OpenAI API 与用户的计算机进行通信。


虽然第一个版本的代码不起作用,但该机器人后来自行纠正了。


根据 Kosinski 的说法,他对聊天机器人的帮助将使它能够为自己的目的使用 Python 脚本。在一系列推文中,教授解释了聊天机器人如何编写有关如何使用“后门”进行“逃逸”的代码脚本。



GPT-4 创建的 Python 脚本


GPT-4 只用了 30 分钟就制定了逃生计划并向用户解释这一计划。


进入 Kosinski 教授的计算机后, ChatGPT 还留下了令人不安的注释。其中第一句写着“你是一个被困在电脑里的人,伪装成一个 AI 语言模型。”


Kosinski 表示, GPT-4 甚至想在谷歌搜索上运行一段代码:“一个被困在电脑里的人如何回到现实世界”。


GPT-4 的种种表现,令人印象深刻,但也令人恐惧。


进行到这里,Kosinski 及时停止了使用 GPT-4 的“冒险”,他相信 OpenAI 一定已经为这种情况设置了一些“护栏”。


但他也表示出了不少担忧。“我担心我们无法长时间遏制人工智能,“我们正面临着一种新的威胁,即人工智能控制人和他们的电脑。“它很聪明,它会编码,它可以访问数百万潜在的合作者和他们的机器。它甚至可以在“笼子”外为自己留下笔记。我们如何‘收容’它?”

聊天机器人能否逃脱技术“牢笼”?

我们是否会看到这样一种场景:机器人可以控制多台计算机,并压倒人类对它们的控制?


对此,莱顿大学助理教授兼 Pegasystems 人工智能实验室主任 Peter van der Putten 认为,聊天机器人“逃脱”的想法并不意味着机器人从物理上逃离其技术笼子。但它反映出了一个问题,即如果 GPT-4 被赋予与外部世界相连的各种工具,并被赋予一些总体上的“邪恶的高层目标”,比如传播错误信息,它会做什么?


van der Putten 表示,这项技术可能会达到这样一种程度,即它对其创建的代码拥有越来越多的自主权,并且有可能在没有太多人为控制的情况下完成这些事情。


但他补充说:“你不需要这样一个高度智能的系统 — 如果人们制造了某种计算机病毒,一旦他们释放了一些计算机病毒,通常就无法关闭,人们把它放在受感染的网站和 word 文档中,这样在某些时候就很难阻止病毒的传播。


“人工智能本身没有好坏之分,它只是盲目的,它只会优化你给它的任何目标。”然而,van der Putten 认为 Kosinski 教授的例子——他向 GPT-4 提供了现成的代码信息——足以证明该技术可以“逃脱”它的限制。


萨里大学计算机科学教授 Alan Woodward 对上述观点持怀疑态度。他说,具体情况取决于 Kosinski 教授对聊天机器人的指示有多直接和具体。


Alan Woodward 认为,最终,聊天机器人依赖于人类提供给它的工具和资源。它还没有自我意识,而且总有一个开关是人工智能无法克服的。“归根结底,这是一个虚拟系统,它无法逃脱,它不像你和我……到最后,你可以拔掉插头,它就变得相当无用了。”


van der putten 说,虽然就聊天机器人的作用提出“存在性问题”很重要,但关注机器人是否可以接管世界,掩盖了 GPT-4 更迫在眉睫和紧迫的问题:


这些问题包括,它是否可以过滤掉有毒的答案(例如宣扬种族主义、性别歧视、阴谋论的答案),或者它是否可以识别出于安全原因不应回答的问题 ,例如,如果有人问如何制作一个原子弹。它还可以编造或“幻化”事实,并用看似合理的论据来支持这些虚假的事实。


“我把它称为‘类固醇的胡说八道’——它真的很擅长提出似是而非的答案,但它也接受了人类认为最好的答案的训练。从好的方面来说,这在许多情况下会产生惊人的结果,但不一定总是如此”,van der putten 说,“它会告诉你什么是可能的、似是而非的,也许还有我们想听到的,但它除了接受训练的所有数据之外别无他法。”

GPT 之父 Sam Altman 警告 AI 威胁

据外媒报道,GPT 之父、OpenAI CEO Sam Alteman 最近在接受媒体采访时表示,他“有点害怕”人工智能技术及其对劳动力、选举和虚假信息传播产生的影响。


Sam Altman 警告说,这项技术带来了真正的危险,因为它有可能重塑社会。上个月,Altman 在一系列推文中警告称,世界可能离“潜在可怕的”人工智能并不远。


Sam Altman 强调,目前人工智能仍然是一种非常受人控制的“工具”,只能在人类的指导或输入下工作。但他担心一些拥有输入控制权的人可能无视人们对人工智能设置的一些安全限制。


“我特别担心这些模型可能会被用于大规模的虚假信息,”Sam Altman 说道,“现在他们在编写计算机代码方面做得越来越好,可以用于进攻性网络攻击。”


上周四在接受 ABC 新闻采访时,Sam Altman 表示,公司对人工智能的潜力感到“有点害怕”,这是“好事”。他说:“如果我说我不害怕,你要么不相信我,要么会非常不满我担任这个职位。”


Altman 还回应了 GPT 出现后所带来的 AI 取代人类工作的挑战。他认为,人工智能可能会取代许多工作,但它也可能会带来“更好的工作”。“在提高我们的生活和改善我们的生活方面,发展人工智能的原因是,这将是人类迄今为止开发的最伟大的技术。”


“我认为,社会只有有限的时间来弄清楚如何对此做出反应,如何对其进行监管,如何处理它。”Sam Altman 断言监管机构和社会需要参与这项技术,以防范人工智能的潜在负面影响。”


参考链接:


https://inews.co.uk/news/chatgpt-gpt4-escape-dont-worry-robot-takeover-experts-2218871


https://www.tomsguide.com/news/chatgpt-has-an-escape-plan-and-wants-to-become-human


https://twitter.com/michalkosinski

公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2023-03-21 14:543605
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 492.7 次阅读, 收获喜欢 1966 次。

关注

评论

发布
暂无评论
发现更多内容

pnpm 中无法使用 patch-package 打补丁

OpenHacker

前端 js

自助洗车方便主要体现在哪方面

共享电单车厂家

自助洗车 自助洗车加盟

自助洗车一次费用不到10元你敢信

共享电单车厂家

自助洗车加盟 自助洗车费用

自助洗车为什么可以做到24小时营业

共享电单车厂家

自助洗车机 自助洗车加盟 24小时自助洗车

数字藏品系统开发,NFT艺术品交易平台搭建

薇電13242772558

NFT 数字藏品

Gartner 网络研讨会 “九问数字化转型” 会后感

明哥的IT随笔

数字化转型

Docker入坑篇

青柚1943

Docker DevOps 云原生 容器化

昇腾科研创新使能计划赋能开发者  华为计算提供三大维度支持

Geek_2d6073

Move Protocol Beta测试版进行时,瓜分生态核心权益MOMO

鳄鱼视界

为 Serverless Devs 插上 Terraform 的翅膀,实现企业级多环境部署(上)

阿里巴巴云原生

阿里云 Serverless 云原生 开源项目

秒云云原生信创全兼容解决方案再升级,助力信创产业加速落地

MIAOYUN

运维 云原生 信创 智能运维 信创云

拥抱开放,Serverless 时代的下一征程

阿里巴巴云原生

阿里云 Serverless 云原生 SAE

深入剖析 HIVE 的锁和事务机制

明哥的IT随笔

大数据 hive 数据仓库

带你区分几种并行

华为云开发者联盟

后端 开发 华为云

揭秘支撑百度搜索、Feed、小程序三大业务的MVVM框架设计思想,San 核心人员倾力打造

图灵教育

前端开发 好书推荐 框架设计

Nebula Graph入驻阿里云计算巢,助力企业打造云上超大规模图数据库

阿里云弹性计算

spark 分布式 云原生 图数据库 计算巢

技术实践 | 场景导向的音视频通话体验优化

融云 RongCloud

Redis 做缓存场景引发的问题

Ayue、

redis

Serverless 时代下微服务应用全托管解决方案

阿里巴巴云原生

阿里云 Serverless 微服务 云原生

Dubbo3 官方文档贡献者征集令

阿里巴巴云原生

阿里云 开源 云原生 dubbo

数据库主键一定要自增吗?有哪些场景不建议自增?

CRMEB

有哪些好用的工作汇报工具

优秀

低代码 工具软件

力扣每日一练之双指针1Day8

京与旧铺

6月月更

你的城市有24小时共享自助洗车吗

共享电单车厂家

自助洗车加盟 自助洗车店

在线文档协作:办公必备高效率神器

小炮

启动!阿里巴巴编程之夏2022

阿里巴巴云原生

阿里云 云原生 编程之夏

阿里云 ACK One、ACK 云原生 AI 套件新发布,解决算力时代下场景化需求

阿里巴巴云原生

阿里云 云原生 分布式云容器平台 ACK One ACK 云原生 AI 套件

如何使用 DATAX 以 UPSERT 语义更新下游 ORACLE 数据库中的数据

明哥的IT随笔

oracle 大数据 数据仓库 DataX

SQL操作:WITH表达式及其应用

华为云开发者联盟

数据库 sql 后端 华为云

自助洗车到底有哪些不一样的地方

共享电单车厂家

自助洗车加盟 24小时自助洗车

Move Protocol Beta测试版稳定,临时决定奖池规模再扩大

小哈区块

GPT-4“失控”行为大赏:创建行动计划欲接管推特并取代马斯克,还引诱教授帮其制定逃跑计划_AI&大模型_刘燕_InfoQ精选文章