NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

搜索引擎技术大战,始于今日

  • 2023-02-08
    北京
  • 本文字数:3398 字

    阅读完需:约 11 分钟

搜索引擎技术大战,始于今日

IT 届很久没有像这几天这样因为某个技术热闹了,ChatGPT 则是那条将水搅浑的“鲶鱼”。

 

几乎在同一天,谷歌 CEO Sundar Pichai 先在官方博客上宣布推出谷歌下一代 AI 对话系统 Bard,以此应对 ChatGPT;百度紧接着宣布将推出类似 ChatGPT 的产品——文心一言(英文名 ERNIE Bot)将在三月份完成内测,面向公众开放;不久后,微软公布了自家搜索引擎 Bing 最新版本,其采用的底层 AI 技术正是 ChatGPT,同时微软还为 Edge 浏览器添加了新的 AI 增强功能,承诺带来前所未有的网络浏览与在线信息查找体验。

 

“搜索引擎的技术大战,始于今日。我们会继续前进并加快步伐。更重要的是,我们希望能在搜索领域持续创新,如今时机已到。”微软 CEO Satya Nadella 说道,“这代表着搜索领域进入了全新的篇章。”

 

传统搜索引擎+ChatGPT

 

那么,“传统搜索引擎+ChatGPT”会发生什么化学反应呢?根据微软介绍,这种新类型搜索与传统搜索的区别在于:

 

  • 除了生成相关链接列表之外,新 Bing 还跨 Web 合并可靠的源,为用户提供一个汇总的答案。

  • 搜索用户说话、发短信和思考的方式。新 Bing 将复杂的搜索和共享返回到详细响应。

  • 在聊天体验中,用户可以自然地聊天,并询问初始搜索的后续问题,以获得个性化的答复。

  • 新 Bing 可用作创意工具。它可以帮助用户编写文章、故事,甚至分享项目创意。



 新的 Bing 搜索引擎将在网络搜索结果之外,向用户提供评论和见解

 

微软展示了所谓“新 Bing”在不同配置下的运行效果。其中一种模式能够将传统搜索结果同 AI 评论并排显示(如上图),另一种模式则允许用户直接与 Bing 聊天机器人对话,在 ChatGPT 等聊天界面中直接提问(如下图)。

 


由 Bing 帮助规划的旅游线路示例

 

在一段演示中,演示人员要求 Bing“安排一次为期五天的墨西哥城旅游计划,每天安排一段不同的行程。”聊天机器人给出了答案,包括一段简略的行程计划和指向更多信息的网址链接。

 

与 ChatGPT 不同,新 Bing 还能检索出关于最近事件的新闻。在演示中,搜索引擎甚至能够回答关于自己的版本发布问题,引用官方网站过去一小时内刚刚披露的消息。

 

微软表示,这些功能均由 GPT 3.5 的升级版本提供。GPT 3.5 是为 ChatGPT 提供支持的 OpenAI 语言模型,微软将这个升级版本称为“Prometheus 模型”,称其不仅比 GPT 3.5 更强大,也能更好地利用最新信息和注释答案对搜索查询做出回应。

 

新的 Bing 已经上线“桌面受限预览”,用户似乎只能在预设的查询范围之内提问,而且每次都会收到相同的结果。另外还有一份候选名单,未来在开放完全访问权限后将可注册体验。

 

除了新 Bing 之外,微软在 Edge 浏览器上也推出了两项新的 AI 增强功能:聊天和撰写,二者将被直接嵌入 Edge 侧边栏内。其中,“聊天”允许用户总结目前正在浏览的网页或文档,并就内容提出问题;“撰写”则是充当写作助手,根据起始提示生成电子邮件、社交媒体帖子等常用文本。

 


Edge 中的“聊天”功能允许用户就目前正在查看的文档,向 AI 机器人提出问题

 


 “撰写”则将在 Edge 中提供写作辅助

 

AI 聊天机器人,到底颠覆了什么

 

ChatGPT 带来的冲击无疑是巨大的。清华大学计算机科学与技术系长聘副教授、博导兼聆心智能创始人黄民烈认为 ChatGPT 的出现对 AI 界来说,有着十分重要的意义:它宣示着无缝人机交互时代的来临。

 

而在搜索和信息检索领域,ChatGPT 也取得了很大突破。达摩院基础视觉负责人赵德丽两个多月前在接受 InfoQ 采访时表示,短期来看,ChatGPT 有望成为或者辅助像谷歌这种传统信息检索的强有力的工具;长期来看,它有望发展成为 AI 系统级的服务。

 

MRS.ai 联合创始人兼 CEO Mingke 向 InfoQ 具体解释了这场 AI 聊天机器人给搜索带来的颠覆到底是什么。

 

“谷歌当前遇到的颠覆,就像它当年颠覆了 Yahoo——不是因为谷歌的 listing 做的比 Yahoo 更好(它甚至根本就没有 listing)而是它给出了搜索引擎这个在当时全新的产品形态;现在谷歌面临的被颠覆,也不是因为谁做出了更好的搜索引擎,而是出现了一个全新的产品形态,即以自然语言作为输入和输出的 AI。”Mingke 说道。

 

Mingke 表示,用户去搜索引擎是为了找信息,而不是为了找网站本身。在用户获取信息(静态数据)的需求和价值上,新的产品形态有机会颠覆旧的范式:用户不再需要打开推荐页上的网站链接自己再去读来找信息,而是通过对话直接获得自己想要的信息——甚至是基于这些信息的基础判断。在静态信息层面,一旦产品完成这个体验,谷歌的产品形态就直接“过时”,就像当年 Yahoo 一样。

 

现在,“传统搜索+AI 聊天机器人”就已经在搜索领域势不可挡,并且微软已经率先实现。谷歌也在发布 Bard 的同时也表示很快就会将其集成到谷歌的搜索引擎中。

 

传统搜索市场基本稳定,如今搜索巨头的竞争重点放在了 AI 聊天机器人上。谷歌的 Bard 目前还没有向公众开放,我们只能从 Pichai 的介绍中初步了解 Bard 与 ChatGPT 的差异。

 

Pichai 指出,Bard“利用网络信息提供新鲜、高质量的回复”,这表明它可能能够回答有关最近事件的问题——这是 ChatGPT 难以解决的问题。比如,Bard 可以帮你向 9 岁的孩子解释 NASA 的詹姆斯·韦伯太空望远镜的新发现,或者为你提供关于当前足球界最佳前锋的信息。

 

Bard 看起来可以与 ChatGPT 的对话能力相媲美,但似乎更侧重于搜索和可解释性,而不是成为能够写诗或散文的通用语言模型。Bard 的预览片段显示模型以要点形式生成响应。

 

谷歌表示,语言模型可以更有效地从互联网中提取信息,让人们更容易直接找到他们正在寻找的东西,而无需自己去浏览多个网站。

 

“当人们想到谷歌时,他们通常会想到向我们寻求快速的事实性答案,比如‘一架钢琴有多少键?’ 但是,越来越多的人转向谷歌寻求更深入的见解和理解——比如,‘钢琴还是吉他更容易学习?每个乐器需要多少练习?’了解这样的话题可能需要花费很多精力来弄清楚你真正需要知道的东西,人们往往希望探索各种不同的意见或观点。”Pichai 解释道。 

 

Bard 最初由 LaMDA 提供支持,随后会有一系列更多的模型。谷歌还表示,它计划创建一套让开发人员和企业可以使用的工具和 API,该 API 将包含一系列基于其 LaMDA 系统的语言模型,如 OpenAI 基于 GPT-3 的模型。 

 

当然,搜索的尽头并不是 AI 聊天机器人。“用户去找服务(动态数据)的这个需求和价值,依然还留空。谷歌没做到,现在新产品形态的 AI 也做不到。”Mingke 表示。

 

新产品形态的产生,也伴随着问题

 

除了相互竞争之外,微软和谷歌无疑需要想清楚另一个更核心的问题:AI 聊天机器人,真能替代传统搜索吗?它要怎么实现以往网络搜索的效果,一旦出错又会引起怎样的问题?

 

后面一点尤其重要,因为像 ChatGPT 这样的 AI 语言系统具有一种强烈的倾向,即把虚假信息当作事实来呈现。尽管多年以来研究人员一直就此事发出警告,但自从 ChatGPT 亮相互联网以来,AI 产生错误的例子才真正迎来大爆发——从编造真实人物的虚构传记内容,到伪造学术论文甚至是提供危险的医疗建议,聊天机器人似乎什么都敢说、什么都敢杜撰。

 

AI 的种种愚蠢行为以往就一直是个大问题,聊天机器人的普及只是给这个问题带来了新的关注,也请大家对于 AI 的网页内容归纳保持批判性态度。比如当我们搜索“病人癫痫发作时该怎么办?”,谷歌给出的搜索结果是“按住对方或努力制止他的动作”,但正确答案其实完全相反。

 

微软在演示文稿中也提到了这方面问题,称其一直在努力防范偏见和“越狱”(即以诱导方式令 AI 聊天机器人绕过防止生成危险/仇恨内容的过滤器)风险。Azure 部门 AI 负责人 Sarah Bird 表示,“有了这款产品,我们在建立风险缓解衡量方法上已经比以往任何时候都走得更远。”

 

然而,微软也显然在为自家系统出错做好准备。新 Bing 界面包含一条写给用户的提醒,“让我们一起学习。Bing 由 AI 提供支持,因此可能出现意外和错误。请确保核查事实真相并分享反馈,以便我们学习和改进!”

 

但还有很多问题并未得到解决,比如 AI 辅助搜索可能对网络生态平衡造成的破坏。如果像新 Bing 这样的 AI 工具开始主动从网络上抓取信息、不再向用户展示目标链接,那么相当一部分网站的基本收入来源就会被掐断。从这个角度看,这种新的搜索模式要想取得成功,必须保留一部分旧有协议。

 

参考链接:

https://www.theverge.com/2023/2/7/23587454/microsoft-bing-edge-chatgpt-ai

https://blogs.microsoft.com/blog/2023/02/07/reinventing-search-with-a-new-ai-powered-microsoft-bing-and-edge-your-copilot-for-the-web/

https://www.infoq.cn/article/z30mE0bxrvItO9Mm52Nw

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2023-02-08 12:075165

评论 2 条评论

发布
用户头像
没啥用,问题与知识有尽头,那样就没有哲学家了
2023-02-08 23:08 · 江苏
回复
用户头像
人》虚假信息》互联网》ChatGPT 当成事实》【后果】

因为像 ChatGPT 这样的 AI 语言系统具有一种强烈的倾向,即把虚假信息当作事实来呈现。

2023-02-08 13:16 · 四川
回复
没有更多了
发现更多内容

新兴技术的影响与展望:生成式AI及更多思考|社区征文

小诚信驿站

年中技术盘点

UINO优锘科技受邀在2023全球数字经济大会数字孪生赋能城市数字化转型论坛发表演讲

ThingJS数字孪生引擎

数字化转型 智慧城市 数字孪生 #web3D ThingJS

Hybrid Embedding:蚂蚁集团万亿参数稀疏 CTR 模型解决方案

AI Infra

AI 开发者 海量存储 AI大模型 降本增效

Docker学习路线3:安装设置

小万哥

Docker 容器 后端 开发 开发程序员

极光笔记 | 解锁Web推送的潜力:提升网站收入

极光JIGUANG

网站 营销 消息推送 推送

入选中国数据智能领域 IDC 创新者,柏睿数据创新实力再获肯定

新消费日报

初识滴滴交易策略之一:交易市场

滴滴技术

算法 滴滴技术

如果小程序越来越多,是不是会直接代替App?

Onegun

小程序 小程序容器

华为云Astro低代码平台关键能力技术浅析

华为云PaaS服务小智

云计算 软件开发 低代码 华为云

智能制造:低代码开发平台推动数智时代的巨变

EquatorCoco

人工智能 低代码 智能制造 数智化

和鲸数据科学专家平台正式成立,凝聚专家资源推进产业数字化升级

ModelWhale

人工智能 数据科学 专家平台 专家资源

你需要知道的Symbols

不在线第一只蜗牛

前端 symbol

生成式AI的发展、应用及影响 | 社区征文

Dec

年中技术盘点

没收入是表象,UMU CEO李东朔的出海经验:第一年破100国家

B Impact

软件测试丨Docker环境安装配置(Mac、Windows、Ubuntu)

测试人

Docker ubuntu 软件测试 Mac windows

云原生技术分享篇丨浅析Istio流量管理

inBuilder低代码平台

云原生

2023世界人工智能大会,和鲸科技入选中国信通院《2023大模型和AIGC产业图谱》

ModelWhale

人工智能 数据科学 大模型 AIGC 世界人工智能大会

IT行业都在用哪些进度跟踪工具

PingCode

IT 项目管理软件 项目进度管理

浅析华为云Astro的5大关键能力技术

华为云开发者联盟

云计算 后端 华为云 华为云开发者联盟 企业号 7 月 PK 榜

低代码在边缘计算工业软件中的应用

力软低代码开发平台

基于Go语言的滴滴DevOps重塑之路

滴滴技术

DevOps 滴滴技术 #go

小度全屋智能携大模型应用惊艳亮相中国建博会,智慧体验演绎未来家居新标准

新消费日报

苹果APP安装包ipa如何安装在手机上

ios

华为云命令行工具服务KooCLI助力一键管理云资源

华为云PaaS服务小智

云计算 软件开发 华为云

什么是HTML5?HTML5的含义、元素和好处

互联网工科生

html html5

专业开发者也需要低代码开发?

这我可不懂

开发者 低代码 低代码开发

晴数智慧张晴晴博士当选开放群岛开源社区「首席数据科学家」

Geek_2d6073

企业是如何做到持续规划的?

智达方通

全面预算管理 持续规划 年度计划流程

图加速数据湖分析-GeaFlow和Hudi集成

TuGraphAnalytics

数据湖 图计算 Hudi 数据湖分析 GeaFlow

TDengine 3.0 性能如何?教你一键复现 IoT 场景 TSBS 测试结果

爱倒腾的程序员

搜索引擎技术大战,始于今日_语言 & 开发_褚杏娟_InfoQ精选文章