Data+AI时代,如何打造下一代数智平台? 了解详情
写点什么

《黑神话:悟空》的第二个受害者出现了,竟是 AI 搜索惹的祸!

  • 2024-08-23
    北京
  • 本文字数:3684 字

    阅读完需:约 12 分钟

大小:1.76M时长:10:14
《黑神话:悟空》的第二个受害者出现了,竟是AI搜索惹的祸!

整理 | 华卫、核子可乐


近日,国产 3A 游戏大作《黑神话:悟空》火爆全网,上线不久便引发全球关注。据国游畅销榜统计的数据,仅仅一日,该游戏在多个平台的总销量已超过 450 万份,总销售额更是超过 15 亿元。与此同时,也出现了一些被其游戏热度所牵连的“受害者”。


《黑神话:悟空》在 Steam 解锁当天,某知名游戏主播在直播玩该游戏时,遭遇晕 3D 的情况,并因此上了微博热搜榜首,被一众网友笑称为《黑神话:悟空》“全球首个受害者”。而在 8 月 21 日,又一位该游戏的“受害者”出现了,其相关遭遇竟与微软有关。


在微软必应搜索中输入“黑神话悟空客服”,错误地显示了某机锋网员工的个人手机号,并非官方客服电话。此外,还有两个错误的电话号码被标记为客服,其中包括第一财经版权部的联系电话及其邮箱。



被泄露电话的当事人表示,他在 5 小时里,接了差不多小 20 个电话。据悉,这一事件发生的主要原因是微软必应 AI 助手错误抓取信息导致其个人信息泄露,之后尽管被抓取的相关文章已删除,受害人已提交申诉等反馈,但错误的“黑神话悟空客服”信息仍一度出现在必应搜索首页。目前,从搜索情况来看,必应团队已对错误信息进行更正。



作为全球第二大搜索引擎,微软必应覆盖 36 个国家和地区,用户超 6 亿。2023 年 2 月 7 日,微软宣布将 ChatGPT 集成进新版必应 (New Bing),集成后的新版必应采用 OpenAI 的 AI 模型 GPT 3.5 的升级版 GPT-4。此次事件,或表明暴露了 AI 搜索引擎在信息抓取和处理上存在一定不足。


必应悄然改版后,


AI 搜索结果将优先显示


上个月,微软宣布对必应做出重大更新,搜索引擎将迎来全面改造,开始将 AI 生成的答案优先显示。也就是说,当用户输入搜索查询时,结果页面中将弹出一条由 AI 生成的主答案,详细说明在获取结果时所使用的全部精选信息来源。当然,大家仍然会在必应搜索页面中看到传统搜索结果,只是它们将被显示在 AI 生成素材的旁边(右侧的较小窗格内)。


对于这一变革,微软在官方博文中做出解释:“这种新体验将必应搜索结果的固有基础,同大 / 小语言模型(LLM 与 SLM)的强大功能加以结合。它能够理解搜索查询、检索数百万个信息来源、动态匹配内容,并以新的 AI 生成布局显示搜索结果,从而更有效地满足用户的查询意图。”


微软也在关于必应生成式搜索的博文列举了部分示例,除了概述摘要功能之外,微软还将提供大语言模型及小语言模型的主要来源链接,用户看到的答案正是由它们创作而成。而在 AI 生成结果之后,则是常规的结果条目列表。


例如当查询“大象能活多久”时,回答发的摘要主体后面还列出了影响大象寿命因素的视频;如果用户搜索“什么是意式西部片?”,必应生成式搜索就会显示关于这一电影子类型的历史、起源以及经典作品信息,同时给出指向这些信息的链接与信源。



当时,微软介绍,这项调整仅向少数必应用户推出,但不久之后应该会逐步扩大开放。微软还在其博文中表示,他们将继续评估 AI 搜索对于网站和读者的影响。有业内人士担心,如果人工智能机器人抓取的内容以直接在聊天窗口或搜索页面中呈现,那么免费创建内容的网站最终将倒闭。


对此,微软表示,这种新的 AI 搜索体验是从头开始构建的,也考虑到了这个问题,因而保持了与传统搜索相同的网站点击次数,时间会证明这是否属实。此外,据了解,必应可以选择在结果页面中关闭 AI 生成功能、只显示传统搜索摘要。


AI 搜索闹出的笑话


现在,微软并不是唯一一家将 AI 生成的结果添加到搜索页面的浏览器公司。随着微软为必应推出更多工具,将更多 AI 功能引入搜索的竞争态势也在逐步升级。


然而,无数真实案例正在证明,AI 搜索并不像我们想象中的那般可靠和准确——它可能会出错,某些情况下生成的结果中甚至会显示错误的信息和建议。


今年早些时候,谷歌也曾推出过一款类似的工具,名为 AI Overview,旨在留住那些想要直接向 AI 聊天机器人寻求问题答案的用户。但该工具在推出后也闹出过一些笑话,比如建议添加胶水以使奶酪粘在披萨上、回答“地质学家建议每天至少吃一块小石头”等。



Arc Search 浏览器在 AI 模式下,信誓旦旦地给出不恰当的医疗建议,“被切断的脚趾最终还会长回来”。



人工智能搜索引擎 Genspark 向用户推荐一些可能用于害人性命的武器,Perplexity 则剽窃了一些媒体撰写的新闻文章,但并未注明来源或版权归属。


此外,AI 生成的摘要信息还可能蚕食其信息来源网站的流量。一项研究发现,由于不再强调文章链接,AI 摘要功能可能将内容发布方的流量拉低 25% 左右。


专家警告,AI“幻觉”


问题无法真正解决


这些新兴 AI 搜索引擎能够凭借其快速生成大量文本,并以令人信服的效果模仿人类文字的能力而广受欢迎,但在其背后,AI“幻觉”也成为影响这些聊天机器人更上一层楼的关键阻力。而遗憾的是,有专家警告称这种情况很可能永远无法解决。


美联社发表的一份最新报告强调,大语言模型(LLM)“胡说八道”的问题可能并不像许多技术创始人和 AI 支持者宣称的那样容易解决。华盛顿大学计算语言学实验室语言学教授 Emily Bender 对此表示悲观,“幻觉问题根本无法解决,这是由技术与拟议用例之间不匹配所必然引发的结果。”


根据 Jasper AI 公司总裁 Shane Orlick 的说法,某些情况下适当的“胡说八道”反而并不是坏事。Orlick 解释称,“幻觉实际能带来额外的好处,一直有客户在感谢我们带来的启发,而根源就是 AI 可能在种种机缘巧合之下输出客户自己从未想到过的故事或者角度。”


同样的,AI 幻觉对于 AI 图像生成也有着巨大的助益,Dall-E 和 Midjourney 等模型正是凭借这份想象力生成了引人注目的精彩图像。也就是说,只有在文本生成领域,幻觉才是个真正困扰用户的问题,特别是在新闻报道等高度强调准确性的场景之下。


Bender 指出,“大语言模型的基本原理就是‘编造’内容,这也是其一切功能的根本。但由于能力源自编造,所以当它们输出的文本恰好可以正确匹配我们的提示词时,这种情况反而是种偶然。哪怕经过微调的模型能够在大多数情况下都保持正确,它们也仍无法彻底摆脱故障。而且,未来的幻觉很可能以文本阅读者更难以注意到的模糊状态存在。”


结    语


大语言模型是种能够实现非凡功能的强大工具,但企业乃至整个科技行业必须意识到一点——不能单纯因为某种事物很强大,就认定它是一种好用的工具。就像冲击钻也很好用,能够轻松破开人行道和沥青路面,但没人敢把它带到考古挖掘现场。


正如 Bender 所指出,大语言模型在最初开始训练的那一瞬间,就是在尝试根据我们给出的提示词预测序列中的下一个单词。训练数据中的每个单词都被赋予了权重或者百分比,以便在给定的上下文中追踪之前既有的给定单词。可这些起先的单词本身并没有充分切实的含义或者重要的上下文来保证输出准确。


换言之,这些大语言模型只是出色的模仿者,它们实际并不清楚自己到底在说些什么,所以过度信任它们只会令用户陷入困境。这个弱点是大语言模型所固有的,尽管“幻觉”可能在未来的迭代中逐渐减少,但问题本身却可能永远无法被真正修复。


参考链接:


https://www.engadget.com/microsoft-is-adding-ai-powered-summaries-to- 必应 -search-results-203053790.html?src=rss


https://www.techradar.com/computing/artificial-intelligence/ 必应 -has-been-revamped-to-prioritize-ai-search-results-whether-you-like-it-or-not


https://www.techradar.com/computing/artificial-intelligence/chatgpt-and-other-ai-chatbots-will-never-stop-making-stuff-up-experts-warn


https://techcrunch.com/2024/07/24/bing-previews-its-answer-to-googles-ai-overviews/


内容推荐


在这个智能时代,AI 技术如潮水般涌入千行百业,深度重塑生产与生活方式。大模型技术引领创新,精准提升行业效率,从教育个性化教学到零售精准营销,从通信稳定高效到金融智能风控,AI 无处不在。它不仅是技术革新的先锋,更是社会经济发展的强大驱动力。在 AI 的赋能下,我们正迈向一个更加智能、便捷、高效的新未来,体验前所未有的生活变革与行业飞跃。关注「AI 前线」公众号,回复「千行百业」获取免费案例资料。



会议推荐


InfoQ 将于 10 月 18-19 日在上海举办 QCon 全球软件开发大会 ,覆盖前后端 / 算法工程师、技术管理者、创业者、投资人等泛开发者群体,内容涵盖当下热点(AI Agent、AI Infra、RAG 等)和传统经典(架构、稳定性、云原生等),侧重实操性和可借鉴性。现在大会已开始正式报名,可以享受 8 折优惠,单张门票立省 960 元(原价 4800 元),详情可联系票务经理  17310043226 咨询。



今日荐文


《黑神话:悟空》太狠了!Steam 瘫痪、多家公司放假,英伟达老黄又要躺在新的印钞机上数钱了


“印度马斯克”要发印度第一款 AI 芯片,号称超越英伟达!CEO 要“狼性”,但把数十亿美元打水漂


朱啸虎押注的AI公司被围攻:领导多次让员工“去死”;小红书激励不再与职级挂钩;谷歌前CEO:AI创业可先“偷”后处理|AI周报


要求员工点赞拉踩贴、抢到对方客户给奖金!40 多位知情人曝这两家 AI 数据商业巨头“生死大战”,如今“开撕”微软


成本直降90%、延迟缩短80%!Anthropic将API玩出了新花样,网友:应该成为行业标配



******你也「在看」吗?******👇


2024-08-23 17:009140

评论

发布
暂无评论
发现更多内容

Qualcomm QCN9074 4x4 MIMO 802.11ax MX6974 F5 WIFI6 Module

MAXON

QCN9074

使用 Metabase 连接 Databend Cloud 实现大屏展示

Databend

阿里是如何使用分布式架构的?阿里内部学习手册分享

Java你猿哥

分布式 ssm 分布式架构 分布式实战

TLS、SSL、CA 证书、公钥、私钥。。。今天捋一捋!

江南一点雨

gRPC TLS CA ssl

源码中常见的 where 1=1 是一种高级优化技巧?

Java你猿哥

Java 源码 ssm

我有一篇Java Stream使用手册,学了就是你的了!

软件测试/测试开发丨app自动化测试之Appium WebView 技术原理

测试人

软件测试 自动化测试 测试开发 appium

微信小程序管理软件有哪些特点?

没有用户名丶

微信小程序

视频动态壁纸:Dynamic Wallpaper 激活版

真大的脸盆

Mac Mac 软件 动态壁纸 高清动态壁纸

RabbitMQ 延迟消息实战

Java 消息队列 消息中间件 Rabbit MQ

人工智能打造充满创造力的新世界,华为云开发者日无锡站成功举办

华为云开发者联盟

人工智能 华为云 元宇宙 华为云开发者联盟 企业号 3 月 PK 榜

狂刷《Java权威面试指南(阿里版)》,冲击“金三银四”有望了

Java java面试 Java八股文 Java面试题 Java面试八股文

视频编辑场景下的文字模版技术方案

百度Geek说

企业号 3 月 PK 榜 视频编辑 端渲染 富文本素材

天天预约 | 预约小程序分销功能,最全的操作指南来啦!

天天预约

小程序 SaaS 系统 预约工具 分销

全新升级|ECS成熟度评估与洞察,助你精准定位运维风险

云布道师

ECS

春招升级打怪拿offer,10w+字总结的Java面试题(附答案)够你刷

Java java面试 Java八股文 Java面试题 Java面试八股文

机器学习算法(三):基于horse-colic数据的KNN近邻(k-nearest neighbors)预测分类

汀丶人工智能

数据挖掘 机器学习

这一次,NineData新功能上线,真的是拼了

NineData

人工智能 sql 开发规范 数据复制服务 企业开发系统

流批一体在 AI 核心电商领域的探索与实践

Apache Flink

大数据 flink 实时计算

熬了一个月肝完这份阿里P8的Java面试手册,我从20K变成了30K

Java你猿哥

Java 面经 校招 春招 八股文

即时通讯技术文集(第10期):IM通信协议该选TCP还是UDP [共12篇]

JackJiang

人工智能打造充满创造力的新世界,华为云开发者日无锡站成功举办

极客天地

卷起来了!阿里最新出品“微服务全阶笔记”,涵盖微服务全部操作

程序员小毕

Java 程序员 微服务 SpringCloud springcloudAlibaba

JVM级别的本地缓存框架Guava Cache:探寻实现细节与核心机制

Java你猿哥

Java JVM ssm Guava Cache

Github点击破百万!这部《从零开始学架构》神书就此霸榜

Java你猿哥

Java 架构 ssm 面经 架构实战

集成Health Kit时因证书问题出现错误码50063的解决方案

HarmonyOS SDK

HMS Core

美团二面:细数 Redis 阻塞的9种情况

Java redis 面试

太全了!马士兵内部共享—1658页《Java面试突击核心讲》

Java java面试 Java八股文 Java面试题 Java面试八股文

机器学习算法(二): 基于鸢尾花数据集的朴素贝叶斯(Naive Bayes)预测分类

汀丶人工智能

数据挖掘 机器学习

《黑神话:悟空》的第二个受害者出现了,竟是AI搜索惹的祸!_生成式 AI_华卫_InfoQ精选文章