写点什么

搜索引擎技术大战,始于今日

  • 2023-02-08
    北京
  • 本文字数:3398 字

    阅读完需:约 11 分钟

搜索引擎技术大战,始于今日

IT 届很久没有像这几天这样因为某个技术热闹了,ChatGPT 则是那条将水搅浑的“鲶鱼”。

 

几乎在同一天,谷歌 CEO Sundar Pichai 先在官方博客上宣布推出谷歌下一代 AI 对话系统 Bard,以此应对 ChatGPT;百度紧接着宣布将推出类似 ChatGPT 的产品——文心一言(英文名 ERNIE Bot)将在三月份完成内测,面向公众开放;不久后,微软公布了自家搜索引擎 Bing 最新版本,其采用的底层 AI 技术正是 ChatGPT,同时微软还为 Edge 浏览器添加了新的 AI 增强功能,承诺带来前所未有的网络浏览与在线信息查找体验。

 

“搜索引擎的技术大战,始于今日。我们会继续前进并加快步伐。更重要的是,我们希望能在搜索领域持续创新,如今时机已到。”微软 CEO Satya Nadella 说道,“这代表着搜索领域进入了全新的篇章。”

 

传统搜索引擎+ChatGPT

 

那么,“传统搜索引擎+ChatGPT”会发生什么化学反应呢?根据微软介绍,这种新类型搜索与传统搜索的区别在于:

 

  • 除了生成相关链接列表之外,新 Bing 还跨 Web 合并可靠的源,为用户提供一个汇总的答案。

  • 搜索用户说话、发短信和思考的方式。新 Bing 将复杂的搜索和共享返回到详细响应。

  • 在聊天体验中,用户可以自然地聊天,并询问初始搜索的后续问题,以获得个性化的答复。

  • 新 Bing 可用作创意工具。它可以帮助用户编写文章、故事,甚至分享项目创意。



 新的 Bing 搜索引擎将在网络搜索结果之外,向用户提供评论和见解

 

微软展示了所谓“新 Bing”在不同配置下的运行效果。其中一种模式能够将传统搜索结果同 AI 评论并排显示(如上图),另一种模式则允许用户直接与 Bing 聊天机器人对话,在 ChatGPT 等聊天界面中直接提问(如下图)。

 


由 Bing 帮助规划的旅游线路示例

 

在一段演示中,演示人员要求 Bing“安排一次为期五天的墨西哥城旅游计划,每天安排一段不同的行程。”聊天机器人给出了答案,包括一段简略的行程计划和指向更多信息的网址链接。

 

与 ChatGPT 不同,新 Bing 还能检索出关于最近事件的新闻。在演示中,搜索引擎甚至能够回答关于自己的版本发布问题,引用官方网站过去一小时内刚刚披露的消息。

 

微软表示,这些功能均由 GPT 3.5 的升级版本提供。GPT 3.5 是为 ChatGPT 提供支持的 OpenAI 语言模型,微软将这个升级版本称为“Prometheus 模型”,称其不仅比 GPT 3.5 更强大,也能更好地利用最新信息和注释答案对搜索查询做出回应。

 

新的 Bing 已经上线“桌面受限预览”,用户似乎只能在预设的查询范围之内提问,而且每次都会收到相同的结果。另外还有一份候选名单,未来在开放完全访问权限后将可注册体验。

 

除了新 Bing 之外,微软在 Edge 浏览器上也推出了两项新的 AI 增强功能:聊天和撰写,二者将被直接嵌入 Edge 侧边栏内。其中,“聊天”允许用户总结目前正在浏览的网页或文档,并就内容提出问题;“撰写”则是充当写作助手,根据起始提示生成电子邮件、社交媒体帖子等常用文本。

 


Edge 中的“聊天”功能允许用户就目前正在查看的文档,向 AI 机器人提出问题

 


 “撰写”则将在 Edge 中提供写作辅助

 

AI 聊天机器人,到底颠覆了什么

 

ChatGPT 带来的冲击无疑是巨大的。清华大学计算机科学与技术系长聘副教授、博导兼聆心智能创始人黄民烈认为 ChatGPT 的出现对 AI 界来说,有着十分重要的意义:它宣示着无缝人机交互时代的来临。

 

而在搜索和信息检索领域,ChatGPT 也取得了很大突破。达摩院基础视觉负责人赵德丽两个多月前在接受 InfoQ 采访时表示,短期来看,ChatGPT 有望成为或者辅助像谷歌这种传统信息检索的强有力的工具;长期来看,它有望发展成为 AI 系统级的服务。

 

MRS.ai 联合创始人兼 CEO Mingke 向 InfoQ 具体解释了这场 AI 聊天机器人给搜索带来的颠覆到底是什么。

 

“谷歌当前遇到的颠覆,就像它当年颠覆了 Yahoo——不是因为谷歌的 listing 做的比 Yahoo 更好(它甚至根本就没有 listing)而是它给出了搜索引擎这个在当时全新的产品形态;现在谷歌面临的被颠覆,也不是因为谁做出了更好的搜索引擎,而是出现了一个全新的产品形态,即以自然语言作为输入和输出的 AI。”Mingke 说道。

 

Mingke 表示,用户去搜索引擎是为了找信息,而不是为了找网站本身。在用户获取信息(静态数据)的需求和价值上,新的产品形态有机会颠覆旧的范式:用户不再需要打开推荐页上的网站链接自己再去读来找信息,而是通过对话直接获得自己想要的信息——甚至是基于这些信息的基础判断。在静态信息层面,一旦产品完成这个体验,谷歌的产品形态就直接“过时”,就像当年 Yahoo 一样。

 

现在,“传统搜索+AI 聊天机器人”就已经在搜索领域势不可挡,并且微软已经率先实现。谷歌也在发布 Bard 的同时也表示很快就会将其集成到谷歌的搜索引擎中。

 

传统搜索市场基本稳定,如今搜索巨头的竞争重点放在了 AI 聊天机器人上。谷歌的 Bard 目前还没有向公众开放,我们只能从 Pichai 的介绍中初步了解 Bard 与 ChatGPT 的差异。

 

Pichai 指出,Bard“利用网络信息提供新鲜、高质量的回复”,这表明它可能能够回答有关最近事件的问题——这是 ChatGPT 难以解决的问题。比如,Bard 可以帮你向 9 岁的孩子解释 NASA 的詹姆斯·韦伯太空望远镜的新发现,或者为你提供关于当前足球界最佳前锋的信息。

 

Bard 看起来可以与 ChatGPT 的对话能力相媲美,但似乎更侧重于搜索和可解释性,而不是成为能够写诗或散文的通用语言模型。Bard 的预览片段显示模型以要点形式生成响应。

 

谷歌表示,语言模型可以更有效地从互联网中提取信息,让人们更容易直接找到他们正在寻找的东西,而无需自己去浏览多个网站。

 

“当人们想到谷歌时,他们通常会想到向我们寻求快速的事实性答案,比如‘一架钢琴有多少键?’ 但是,越来越多的人转向谷歌寻求更深入的见解和理解——比如,‘钢琴还是吉他更容易学习?每个乐器需要多少练习?’了解这样的话题可能需要花费很多精力来弄清楚你真正需要知道的东西,人们往往希望探索各种不同的意见或观点。”Pichai 解释道。 

 

Bard 最初由 LaMDA 提供支持,随后会有一系列更多的模型。谷歌还表示,它计划创建一套让开发人员和企业可以使用的工具和 API,该 API 将包含一系列基于其 LaMDA 系统的语言模型,如 OpenAI 基于 GPT-3 的模型。 

 

当然,搜索的尽头并不是 AI 聊天机器人。“用户去找服务(动态数据)的这个需求和价值,依然还留空。谷歌没做到,现在新产品形态的 AI 也做不到。”Mingke 表示。

 

新产品形态的产生,也伴随着问题

 

除了相互竞争之外,微软和谷歌无疑需要想清楚另一个更核心的问题:AI 聊天机器人,真能替代传统搜索吗?它要怎么实现以往网络搜索的效果,一旦出错又会引起怎样的问题?

 

后面一点尤其重要,因为像 ChatGPT 这样的 AI 语言系统具有一种强烈的倾向,即把虚假信息当作事实来呈现。尽管多年以来研究人员一直就此事发出警告,但自从 ChatGPT 亮相互联网以来,AI 产生错误的例子才真正迎来大爆发——从编造真实人物的虚构传记内容,到伪造学术论文甚至是提供危险的医疗建议,聊天机器人似乎什么都敢说、什么都敢杜撰。

 

AI 的种种愚蠢行为以往就一直是个大问题,聊天机器人的普及只是给这个问题带来了新的关注,也请大家对于 AI 的网页内容归纳保持批判性态度。比如当我们搜索“病人癫痫发作时该怎么办?”,谷歌给出的搜索结果是“按住对方或努力制止他的动作”,但正确答案其实完全相反。

 

微软在演示文稿中也提到了这方面问题,称其一直在努力防范偏见和“越狱”(即以诱导方式令 AI 聊天机器人绕过防止生成危险/仇恨内容的过滤器)风险。Azure 部门 AI 负责人 Sarah Bird 表示,“有了这款产品,我们在建立风险缓解衡量方法上已经比以往任何时候都走得更远。”

 

然而,微软也显然在为自家系统出错做好准备。新 Bing 界面包含一条写给用户的提醒,“让我们一起学习。Bing 由 AI 提供支持,因此可能出现意外和错误。请确保核查事实真相并分享反馈,以便我们学习和改进!”

 

但还有很多问题并未得到解决,比如 AI 辅助搜索可能对网络生态平衡造成的破坏。如果像新 Bing 这样的 AI 工具开始主动从网络上抓取信息、不再向用户展示目标链接,那么相当一部分网站的基本收入来源就会被掐断。从这个角度看,这种新的搜索模式要想取得成功,必须保留一部分旧有协议。

 

参考链接:

https://www.theverge.com/2023/2/7/23587454/microsoft-bing-edge-chatgpt-ai

https://blogs.microsoft.com/blog/2023/02/07/reinventing-search-with-a-new-ai-powered-microsoft-bing-and-edge-your-copilot-for-the-web/

https://www.infoq.cn/article/z30mE0bxrvItO9Mm52Nw

2023-02-08 12:075505

评论 2 条评论

发布
用户头像
没啥用,问题与知识有尽头,那样就没有哲学家了
2023-02-08 23:08 · 江苏
回复
用户头像
人》虚假信息》互联网》ChatGPT 当成事实》【后果】

因为像 ChatGPT 这样的 AI 语言系统具有一种强烈的倾向,即把虚假信息当作事实来呈现。

2023-02-08 13:16 · 四川
回复
没有更多了
发现更多内容

带您了解昇腾模型压缩工具

华为云开发者联盟

人工智能 后端 企业号九月金秋榜

网络安全周是什么意思?为什么要开展网络安全周?

行云管家

网络安全 网络安全周

虚实交互,重磅开启|共建多元、互联的元宇宙产业生态圈,赋能上海打造产业高地

极客天地

前端二面面试题(附答案)

helloworld1024fd

JavaScript 前端

WorkPlus移动应用管理平台 | 政企数字化的超级“连接器”

BeeWorks

MobLink for Flutter

MobTech袤博科技

flutter ios android

高频面试题:谈谈你对 Spring Boot 自动装配机制的理解

Java快了!

Spring Boot

私有化的即时通讯工具能为企业带来哪些帮助?

BeeWorks

Databend 特性系列(1)|Databend 数据生命周期

Databend

大数据 大数据 开源 数据生命周期

SpringBoot 源码 | applicationContext.refresh() 方法解析

六月的雨在InfoQ

springboot 源码阅读 Refresh 9月月更 SpringBoot启动流程

Paper Time|开放式时空大数据助力智能公交路线规划

OceanBase 数据库

一文看懂:什么是CRM系统?有什么用?哪些公司在用?

优秀

CRM系统

MobLink Android 快速集成文档

MobTech袤博科技

sdk Android;

[Spring boot] Spring boot 整合RabbitMQ实现通过RabbitMQ进行项目的连接

Java快了!

Spring Boot

一文带你体验MRS HetuEngine如何实现跨源跨域分析

华为云开发者联盟

大数据 后端 企业号九月金秋榜

重磅!阿里首推内部“SpringCloudAlibaba项目文档”这细节讲解,封神!

收到请回复

Java 云计算 开源 架构 编程语言

了解布隆过滤器

自然

Java core 9月月更

新一代开源时序数据库TDengine有哪些优势?

TDengine

数据库 tdengine 开源 企业号九月金秋榜

FreeRTOS记录(八、用软件定时器?还是硬件定时器?)

矜辰所致

软件定时器 FreeRTOS 9月月更

【云原生】Kubernetes操作精讲

陈橘又青

9月月更

开源云管平台有哪些?有哪些优势?

行云管家

云计算 云平台 云管平台 云管理

[SpringBoot系列]基础过渡与夯实(基础配置)

十八岁讨厌编程

Java 后端开发 9月月更

SpringBoot源码 | refreshContext方法解析

六月的雨在InfoQ

源码 springboot 源码阅读 9月月更 refreshContext

京东金融客户端用户触达方式的探索与实践

京东科技开发者

京东 用户 用户触达 widget 推送

阿里云EMAS移动测试|快速掌握移动端兼容性测试技巧

移动研发平台EMAS

阿里云 应用开发 兼容性测试 移动测试

led显示屏有污垢时该怎么清洗?

Dylan

LED显示屏 led显示屏厂家

[MyBatisPlus]DQL编程控制①(条件查询)

十八岁讨厌编程

Java 后端开发 9月月更

百度App Android启动性能优化-工具篇

百度Geek说

android 性能优化 企业号九月金秋榜

7.07亿TPC-C背后的技术突破,OceanBase研究成果入选VLDB

OceanBase 数据库

新零售数智化转型,需要怎样的数据底座?

OceanBase 数据库

你必须知道的Java泛型

自然

Java core 9月月更

搜索引擎技术大战,始于今日_语言 & 开发_褚杏娟_InfoQ精选文章