写点什么

大规模网络浏览:Orca 探索由人类引导的 AI 代理未来

作者:Matt Foster

  • 2025-06-16
    北京
  • 本文字数:1088 字

    阅读完需:约 4 分钟

大小:544.47K时长:03:05
大规模网络浏览:Orca 探索由人类引导的 AI 代理未来

加州大学圣地亚哥分校的研究团队发布了开源系统 Orca,其核心创新在于:大型语言模型(LLMs)并非接管网页操作,而是通过智能引导辅助用户。这份经过同行评议的白皮书显示,在评估测试中,该系统显著提升了任务速度与准确性,为现实工作流程中“真人参与”智能体的潜力提供了早期实证。Orca 被设计为网页信息处理的决策“副驾驶”,其功能定位并非全自动浏览代理,而是为用户从网页中提取有用信息。

 

该系统提供一系列功能,包括从冗长网页生成摘要、非结构化内容中提取规整数据、跨会话浏览追踪变更,以及多源信息交叉验证。该系统能根据指令执行搜索、滚动、点击等网站交互动作,使用户在保持流程控制权的同时,可将重复性高或上下文复杂的任务委托处理。



在一项八人参与的实验研究中,研究者发现 Orca 能显著加速网络信息探索、拓宽信息检索范围并增强用户对结果的信任度。

 

参与者尤其肯定以下功能:可视化页面重组、选择性任务委派,以及对信息源的持续掌控。例如,有测试者借助 Orca 并排对比 Yelp 商户选项,另一用户则通过过滤 Reddit 帖子进行产品调研。系统的空间布局设计和批量交互功能因降低上下文切换成本、简化复杂工作流而获得特别好评。

 

研究团队特别强调"共享控制权"这一核心设计原则:用户始终作为操作发起者和决策者,这种设计显著提升了信任度和使用意愿。这种对控制权共享的坚持,有效保障了流程透明度与可信度,研究者认为这两大特质对建立用户信心、确保 AI 辅助工作流中的主体能动性具有关键作用。

 

Orca 系统采用 Electron 框架实现,前端基于 React 构建。每个网页都被加载到独立的 webview 中,而用于组织和交互多页面的“Web Canvas”界面则是基于开源 tldraw 库开发的。

 

所有基于语言的功能(如摘要生成、信息提取和自动化操作)均由 Claude 3.7 Sonnet 模型驱动。在后台,Orca 采用定制的 HTML 蒸馏和智能体管道架构,将原始网页内容转换为可供大语言模型使用的结构化表示。这些管道在各功能间共享,并设计为允许用户在执行过程中进行干预。

 

该开源版本的定位为研究原型而非生产就绪工具,是为帮助开发者探索未来的协作式智能体工作流。尽管前景看好,但研究人员指出该原型在增加工作负载时表现出性能限制:“配备 36GB 统一内存的 M4 Max MacBook Pro 在加载约 80 个网页后会卡死。"

 

Orca 在“真人参与”系统优势方面取得的积极成果,让我们得以一窥未来用户与智能体协作交互的可能形态:在高语境、强决策的工作流程中,AI 智能体是辅助而非取代用户。

 

截至本文撰稿时,Orca 并非唯一秉持这一理念的工具,它与其它新兴工具共享这一领域。更多案例可见于 OpenAI 的 Operator 和重新设计的 Opera Neon 浏览器

2025-06-16 14:003470

评论

发布
暂无评论

Apache Doris 2.1.3 版本正式发布

SelectDB

数据库 大数据 数据湖 数据分析 物化视图

高并发UE4/UE5像素流送云推流解决方案

点量实时云渲染

ue 像素流送 像素流 像素流送技术 UE4

Koupleless 内核系列|模块化隔离与共享带来的收益与挑战

SOFAStack

开源 模块 架构治理 蚂蚁集团 单体应用架构

华为云新一代柔性算力服务器,加速企业轻松上云数智化转型

平平无奇爱好科技

湖南省气象信息中心:部署运行省人工智能气象应用支撑平台

ModelWhale

大数据 气象

和鲸科技联合中软国际教育,发布 AI 数智科研联合解决方案

ModelWhale

人工智能 科学数据

博思白板可以画思维导图吗?boardmix常见问题解答!

彭宏豪95

效率工具 在线白板 办公软件 在线协同 在线协作

加速企业上云数智化创新,云耀X实例有妙招

平平无奇爱好科技

什么是网络钓鱼攻击

德迅云安全杨德俊

云手机和模拟器的区别:云手机优势大更防封

Ogcloud

本地手机模拟器 云手机 海外云手机 云手机群控

MySQL进阶必须掌握的知识点有这些,我没说错吧。

王中阳Go

golang 数据库 算法 面试题 大厂面经

软件测试学习笔记丨App性能测试方案-霍格沃兹

测试人

软件测试 性能测试 测试开发

和鲸携手中国石油大学,助力首届青岛市公共数据创新应用大赛璀璨启程

ModelWhale

公共数据

丰富企业 AI 存储选择丨焱融科技与安擎完成兼容性互认证

焱融科技

焱融科技 高性能存储 存力 AI存储 安擎

欧特克工程建设峰会在京召开

E科讯

6倍性能一直加速一直快,云耀X实例值得中小企业拥有

轶天下事

OPPO举办OTalk 开发者交流专场,提供Android 15多元化适配服务

科技热闻

加速一键智能上云,云耀X实例显真功夫

平平无奇爱好科技

继Bakkt之后的又一全新力作,ICE推出AI高频交易平台

科技热闻

继Bakkt之后的又一全新力作,ICE推出AI高频交易平台

科技汇

柔性算力随心配,企业一键上云更智能

平平无奇爱好科技

京东商家智能助手:Multi-Agents 在电商垂域的探索与创新

京东零售技术

人工智能 agent LLM 企业号 5 月 PK 榜

Koupleless 单进程多应用如何解决兼容问题

SOFAStack

开源 应用架构 蚂蚁集团 兼容

2024IT市场权威榜单发布!腾讯云TBDS斩获两大奖项!

腾讯云大数据

TBDS

大规模网络浏览:Orca 探索由人类引导的 AI 代理未来_AI&大模型_InfoQ精选文章