50万奖金+官方证书,深圳国际金融科技大赛正式启动,点击报名 了解详情
写点什么

谷歌搜索反击,发布最有“谷歌风格”的 AI 应用!网友:为 Perplexity 付费已没有意义

  • 2024-12-30
    北京
  • 本文字数:2979 字

    阅读完需:约 10 分钟

大小:1.31M时长:07:39
谷歌搜索反击,发布最有“谷歌风格”的AI应用!网友:为 Perplexity 付费已没有意义

“随着 Gemini 家族的日趋完善、阵容的发展壮大,谷歌大模型将可代表用户完成更多现实工作。”近期,谷歌又朝着打造世界上最实用个人 AI 助手这一目标迈出了重要一步:低调发布了 Deep Research 功能。


Deep Research 能够接收研究提示词、制定研究计划并为用户提供微调选项,之后执行全自动研究。它会扫描数十到数百个信息来源以获取关于查询的信息内容,而后生成关于结果的详尽报告。整个过程需要几分钟,大家可以在 Gemini 运行的过程中先去忙别的。在执行完成之后,生成的报告则可导出为 Google Docs 文档。


这也是 Gemini 强大推理能力的重要首秀,反映出谷歌打造 AI 智能体解决方案的决心与探索。

随时待命的个人 AI 研究助手


传统的在线研究工作往往困难重重。设想一下,身为一名研究生,您可能正在为即将到来的机器人演示做准备。您希望了解自动驾驶汽车传感器的发展趋势、检索不同技术的对接方式以及未来的发展方向。像这样的项目往往要耗费数小时进行研究,打开大量页面选项卡并交叉引用其中内容……很多人在过程当中往往会彻底迷失,绝望地翻找刚刚才看到过的链接或者段落。


Deep Research 的作用就是在用户监督之下替人完成这些令人头痛的工作。


在输入问题之后,它会创建一个多步骤的研究计划以供修改或者批准。在批准之后,Deep Research 就会代表用户深入分析来自网络的相关信息。


只需要几分钟的时间,Gemini 就能不断完善其分析结果,以用户熟悉的方式浏览网页:搜索、查找有趣信息,而后根据看到的内容再进行后续搜索。Deep Research 会多轮重复整个过程,并在最终完成后生成一份综合性的发现报告,可供用户导出为 Google Docs 文档格式。


成果文件的内容包含原始来源链接,以供用户后续随时返回相关网站 / 企业 / 组织进行查验。更重要的是,如果还有其他扩展性问题想要了解或者希望进一步完善报告,用户可以直接向 Gemini 提问。“总之,短短几分钟内我们就能完成以往至少耗费数个小时的研究过程。”谷歌表示。


今年早些时候,谷歌分享了将更多智能体功能融入产品的发展愿景,而 Deep Research 正是 Gemini 中首个将这一愿景变为现实的功能。


谷歌打造出一套新的智能体系统,该系统运用谷歌在网络搜索方面的专业知识指导 Gemini 大模型进行浏览与研究。新功能与 Gemini 模型的高级推理能力以及高达 1M 的 token 上下文窗口相结合,最终形成了快速创作实用性强、可读性好的综述性报告的强大能力。


Deep Research 目前已经在桌面及移动 Web 端的 Gemini Advanced(初始只支持英语版本)中推出,且计划在 2025 年初登录移动端应用。目前,谷歌正在更多区域推出这一功能。


根据谷歌在越南和泰国发布的官方博文,Gemini 2.0 Flash Experimental、Gemini 2.0 Experimental Advanced 以及带有 Deep Research 的 Gemini 1.5 现已在区域内推出,允许更多用户访问到 Gemini 家族的这几款最新产品。


Gemini 2.0 Flash Experimental 与 2.0 Experimental Advanced 属于当前生产级版本 1.5 Pro 与 1.5 Flash 的更新版本。根据谷歌的描述,这两款产品分别面向“复杂任务”与“日常协助”场景——从本质上讲,Flash 属于运行速度更快的轻量级模型,而 Pro 在提示词执行方面则表现得更为彻底。


带有 Deep Research 的 Gemini 1.5 则是目前唯一能够执行 AI 深度研究功能的 Gemini 版本。Gemini 1.5 与 Deep Research 现已在包括美国在内的多个区域面向 Gemini Advanced 用户推出,但用户只能在 Gemini Web 应用中访问 Deep Research——iOS 与 Android 版应用程序尚不支持此项功能。如果大家需要在手机端使用 Deep Research,则可以通过 Gemini 的移动 Web 应用进行访问。


选择谷歌、Perplexity 还是 OpenAI?


Deep Research 发布后,一时间好评如潮。


沃顿商学院生成人工智能实验室联席主任 Ethan Mollick 称赞道,“谷歌新推出的 Deep Research 功能感觉是迄今为止最符合‘谷歌风格’的人工智能应用之一,而且令人印象深刻。我已经使用了一段时间,它几乎可以针对任何主题都提供非常好的初步报告。不过,学术资源的付费墙带来了一些限制。”



其他用户也表示新功能让其印象深刻。“在发布 Gemini 2.0 和 Deep Research 后,为 Perplexity 付费已经没有意义了。”


不过,Deep Research 功能并没有彻底打败谷歌竞争对手的产品。


网友 Thomas Burgess 直观地对比了 Perplexity 与 Gemini Deep Research 后表示,“它真的真的真的很慢。如果不是为了录制这个视频,我可能已经放弃了。而且,Gemini 也不知道我是在问最近新闻中出现的无人机事件。”不过,Thomas Burgess 还表示,虽然 Perplexity 声称引用了 24 个来源,但他猜测其实只引用了几个,Gemini 声称引用了 19 个。


对比输出结果,Gemini 更像是研究论文、报告,Perplexity 则是信息收集整理。


更详细的结果对比可以查看:


Gemini (https://docs.google.com/document/d/175RRX4kc3HRQp8SjnTVYWHxlJrSuX1LVBNJ1ViSrwsc/edit?pli=1&tab=t.0)


Perplexity (https://www.perplexity.ai/search/new-jersey-d__rones-4ruvBHNlSxCKgH_vOnyDBw?login-source=oneT__apThread_)_


对于速度问题,也有用户在 Thomas Burgess 帖子下表示,“你用错了。刚刚尝试在 AI Studio 中打开 grounding 进行同样的搜索,结果和 Perplexity 一样快速和彻底。”


“我用过几次。它实际上只对公众人物和大型活动有用,对任何小事都没什么用。而且它是深度研究,而不是深度搜索。”有用户说道。


“shrimpyn1”在尝试了几次后,也指出了 Deep Research 的几个问题:


  1. 它不允许研究政治话题;

  2. 它对使用最新文章的搜索使用非常糟糕,本希望它能够智能地识别研究主题是最近发生的事件还是一般的学术主题,并像 GPT 搜索那样自动仅使用当前事件的最新链接;

  3. 尽管它提供了最深入、最全面的见解,但它不如 Perplexity 和 GPT Search 那样聪明,能够通过推理提供最“有用”和最准确的答案。


“如果你仔细思考,会发现现阶段人工智能搜索工具的“准确性”和“深度”之间实际上存在着一种权衡。目前,只有人类研究人员才能生成非常全面、深入同时又准确且最新的报告。我认为谷歌 Deep Research 可能非常适合不依赖实时信息检索的学术研究,但这并不意味着你不能向该工具询问最新的体育比赛结果、天气或最近事件的详细信息。如果你这样做,它仍然会尝试给你一个答案,但我发现它不太准确,也不太令人满意。”shrimpyn1 说道。


“GPT Search 显然是目前可以取代谷歌搜索的最佳且唯一可靠的工具,因为它有意仅检索最新链接并做出明智的查找决定。在我看来,Perplexity 试图站到 GPT Search 和 Deep Research 之间的位置,因此它在‘谷歌搜索’简单查询方面不如 GPT Search 那么好,在一般学术主题上当然也不如 Deep Research 那么好。”shrimpyn1 分析称。


“也就是说,如果你只想订阅一项 AI 服务而不订阅其他服务,那么 Perplexity 显然是最好的选择。它可以是一个纯粹的 LLM(或多个模型)、一个搜索引擎、一个相对深入的研究合作伙伴、一个图像生成器、一个可定制的 AI 代理(Spaces),甚至是一个新闻网站。但我想说,它可能不是在任何一个领域都是‘最好的’——几乎在每一个领域都有比它更好的东西。”


参考链接:


https://blog.google/products/gemini/google-gemini-deep-research/#footnote-1


https://www.androidpolice.com/gemini-deep-research-more-regions/


https://x.com/JThomasBurgess/status/1866935993380602323


2024-12-30 15:148106

评论

发布
暂无评论

软件测试 | 测试开发 | 分布式自增ID算法Snowflake简介

测吧(北京)科技有限公司

测试

软件测试 | 测试开发 | 相似图像的检测方法

测吧(北京)科技有限公司

测试

软件测试 | 测试开发 | Tornado 异步性能分析

测吧(北京)科技有限公司

测试

探究MYSQL之索引

C++后台开发

MySQL 中间件 后端开发 C++开发 数据库索引

软件测试 | 测试开发 | code2vec 代码的连续分布式矢量表示

测吧(北京)科技有限公司

测试

软件测试 | 测试开发 | TorchServe搭建codeBERT分类模型服务

测吧(北京)科技有限公司

测试

IDC发布《中国边缘云市场解读(2022)》:阿里云蝉联中国公有云市场第一

阿里云CloudImagine

边缘计算 公有云 边缘云

字节跳动基于Doris的湖仓分析探索实践

字节跳动数据平台

数据仓库 数据湖 Doris Hudi 湖仓一体

8万字208道Java经典面试题总结(附答案)

Geek_0c76c3

Java 数据库 开源 程序员 开发

软件测试 | 测试开发 | 基于NSQ搭建高可用分布式消息队列

测吧(北京)科技有限公司

测试

软件测试 | 测试开发 | Pandas数据分析及可视化应用实践

测吧(北京)科技有限公司

测试

软件测试 | 测试开发 | Android App 保活服务的配置与禁用

测吧(北京)科技有限公司

测试

软件测试 | 测试开发 | GraphQl:让你的接口所得即所要

测吧(北京)科技有限公司

测试

软件测试 | 测试开发 | UI遍历中页面定义和动作事件筛选方法

测吧(北京)科技有限公司

测试

软件测试 | 测试开发 | ThinkPHP 接口开发过程

测吧(北京)科技有限公司

测试

软件测试 | 测试开发 | 一种基于视频帧差异视频卡顿检测方案

测吧(北京)科技有限公司

测试

禅道的工时管理

禅道项目管理

项目管理 工时 禅道

软件测试 | 测试开发 | Golang协程池的使用

测吧(北京)科技有限公司

测试

hystrix熔断器的工作流程与它的舱壁模式

想要飞的猪

Hystrix hystrix名词概念

软件测试 | 测试开发 | Aiomysql 与 Sqlalchemy 的使用

测吧(北京)科技有限公司

测试

软件测试 | 测试开发 | Lambda表达式介绍和底层实现分析

测吧(北京)科技有限公司

测试

软件测试 | 测试开发 | 提高Android云真机稳定性的方法

测吧(北京)科技有限公司

测试

Ribbon都有哪些负载均衡的策略?

想要飞的猪

Ribbon

阿里面试官内部题库!阿里发布2022年Java社招岗(正式版)面试题

Geek_0c76c3

Java 数据库 开源 程序员 架构

喜迎华诞!10月月更伴随着国之盛庆向你走来!

InfoQ写作社区官方

热门活动 10月月更

软件测试 | 测试开发 | Thinkphp5 集成 Swoole

测吧(北京)科技有限公司

测试

软件测试 | 测试开发 | 用模拟器实现视频流的音画分离

测吧(北京)科技有限公司

测试

史上最全499道Java面试题:JVM+分布式+算法+锁+MQ+微服务+数据库

Geek_0c76c3

Java 数据库 开源 架构 面试

软件测试 | 测试开发 | 堆排序原理及实现

测吧(北京)科技有限公司

测试

软件测试 | 测试开发 | 分布式锁的实现方案

测吧(北京)科技有限公司

测试

我与CI流水线的羁绊,任谁也无法斩断!

极狐GitLab

DevOps 持续集成 jenkins CI/CD 极狐GitLab

谷歌搜索反击,发布最有“谷歌风格”的AI应用!网友:为 Perplexity 付费已没有意义_AI&大模型_褚杏娟_InfoQ精选文章