写点什么

大规模网络浏览:Orca 探索由人类引导的 AI 代理未来

作者:Matt Foster

  • 2025-06-16
    北京
  • 本文字数:1088 字

    阅读完需:约 4 分钟

大小:544.47K时长:03:05
大规模网络浏览:Orca 探索由人类引导的 AI 代理未来

加州大学圣地亚哥分校的研究团队发布了开源系统 Orca,其核心创新在于:大型语言模型(LLMs)并非接管网页操作,而是通过智能引导辅助用户。这份经过同行评议的白皮书显示,在评估测试中,该系统显著提升了任务速度与准确性,为现实工作流程中“真人参与”智能体的潜力提供了早期实证。Orca 被设计为网页信息处理的决策“副驾驶”,其功能定位并非全自动浏览代理,而是为用户从网页中提取有用信息。

 

该系统提供一系列功能,包括从冗长网页生成摘要、非结构化内容中提取规整数据、跨会话浏览追踪变更,以及多源信息交叉验证。该系统能根据指令执行搜索、滚动、点击等网站交互动作,使用户在保持流程控制权的同时,可将重复性高或上下文复杂的任务委托处理。



在一项八人参与的实验研究中,研究者发现 Orca 能显著加速网络信息探索、拓宽信息检索范围并增强用户对结果的信任度。

 

参与者尤其肯定以下功能:可视化页面重组、选择性任务委派,以及对信息源的持续掌控。例如,有测试者借助 Orca 并排对比 Yelp 商户选项,另一用户则通过过滤 Reddit 帖子进行产品调研。系统的空间布局设计和批量交互功能因降低上下文切换成本、简化复杂工作流而获得特别好评。

 

研究团队特别强调"共享控制权"这一核心设计原则:用户始终作为操作发起者和决策者,这种设计显著提升了信任度和使用意愿。这种对控制权共享的坚持,有效保障了流程透明度与可信度,研究者认为这两大特质对建立用户信心、确保 AI 辅助工作流中的主体能动性具有关键作用。

 

Orca 系统采用 Electron 框架实现,前端基于 React 构建。每个网页都被加载到独立的 webview 中,而用于组织和交互多页面的“Web Canvas”界面则是基于开源 tldraw 库开发的。

 

所有基于语言的功能(如摘要生成、信息提取和自动化操作)均由 Claude 3.7 Sonnet 模型驱动。在后台,Orca 采用定制的 HTML 蒸馏和智能体管道架构,将原始网页内容转换为可供大语言模型使用的结构化表示。这些管道在各功能间共享,并设计为允许用户在执行过程中进行干预。

 

该开源版本的定位为研究原型而非生产就绪工具,是为帮助开发者探索未来的协作式智能体工作流。尽管前景看好,但研究人员指出该原型在增加工作负载时表现出性能限制:“配备 36GB 统一内存的 M4 Max MacBook Pro 在加载约 80 个网页后会卡死。"

 

Orca 在“真人参与”系统优势方面取得的积极成果,让我们得以一窥未来用户与智能体协作交互的可能形态:在高语境、强决策的工作流程中,AI 智能体是辅助而非取代用户。

 

截至本文撰稿时,Orca 并非唯一秉持这一理念的工具,它与其它新兴工具共享这一领域。更多案例可见于 OpenAI 的 Operator 和重新设计的 Opera Neon 浏览器

2025-06-16 14:003556

评论

发布
暂无评论

数据库连接池 -Druid 源码学习(七)

wjchenge

Druid 数据库连接池

☕️从 Java8 到 Java17 的新特性(十):Java17 的新特性

看山

Java java17

四、容器安全风险分析

穿过生命散发芬芳

云原生安全 5月月更

加入MOVE,一起体验Move2Earn的运动乐趣

股市老人

Flutter StatefulBuilder 示例

坚果

5月月更

☕️从 Java8 到 Java17 的新特性(六):Java13 的新特性

看山

Java Java13

二分查找树

工程师日月

二叉树 5月月更

架构实战营-第一周

Asura

记一次简单易上手的内网渗透实战

网络安全学海

黑客 网络安全 信息安全 渗透测试 WEB安全

☕️从 Java8 到 Java17 的新特性(二):Java9 的新特性

看山

Java Java9

☕️从 Java8 到 Java17 的新特性(三):Java10 的新特性

看山

Java Java10

☕️从 Java8 到 Java17 的新特性(九):Java16 的新特性

看山

Java java16

贝叶斯简介

5月月更

万字长文!一文搞懂InheritedWidget 局部刷新机制

岛上码农

flutter ios 前端 安卓 5月月更

☕️从 Java8 到 Java17 的新特性(五):Java12 的新特性

看山

Java Java12

druid 源码阅读 7——keepAlive实现方式

张大彪

【愚公系列】2022年05月 二十三种设计模式(十六)-迭代器模式(Iterator Pattern)

愚公搬代码

5月月更

【刷题第 11 天】26. 删除有序数组中的重复项

白日梦

5月月更

ArrayList源码分析-迭代器

zarmnosaj

5月月更

Java 8 开始新增的 Optional 类 - 检查 Optional 的值

HoneyMoose

零基础学Java第二节(运算符、输入、选择流程控制)

编程攻略

Java学习 5月月更

C++中字符三兄弟(WCHAR、CHAR、TCHAR)

liuzhen007

c c++ 5月月更

☕️从 Java8 到 Java17 的新特性(四):Java11 的新特性

看山

Java Java11 LTS

☕️从 Java8 到 Java17 的新特性(八):Java15 的新特性

看山

Java java15

linux之sudo使用技巧汇总

入门小站

Linux

在线TSV某一列提取下载

入门小站

工具

Java 8 开始新增的 Optional 类 - Optional 中的方法

HoneyMoose

Java 8 开始新增的 Optional 类 - Optional 对象中的异常

HoneyMoose

JavaWeb JDBC

Emperor_LawD

javaWeb JDBC 5月月更

在线文本列表交集计算工具

入门小站

工具

☕️从 Java8 到 Java17 的新特性(七):Java14 的新特性

看山

Java java14

大规模网络浏览:Orca 探索由人类引导的 AI 代理未来_AI&大模型_InfoQ精选文章