写点什么

Fellou 发布业界首个 Agentic 浏览器:侧重端到端自主行动,融合 Browser、Agent、Workflow Automation

  • 2025-04-22
    北京
  • 本文字数:6321 字

    阅读完需:约 21 分钟

大小:3.33M时长:19:22
Fellou 发布业界首个 Agentic 浏览器:侧重端到端自主行动,融合 Browser、Agent、Workflow Automation

得益于自由开放的 Web,浏览器成为我们探索数字世界的核心入口,社交、娱乐、信息获取、生产力,它几乎可以承载我们全部的数字生活。

 

然而,在办公室中,键盘的敲击声此起彼伏,鼠标的点击声不绝于耳。每天,我们平均要打开 40 个网站、切换 26 个标签页、填写 20 张表单。浏览器本该是我们的助手,却让我们成了数字世界的劳工。那些本该探索世界的指尖,被困在重复操作的循环中;那些本该用于创造的时间,被浏览器分割成信息碎片。

 

当 AI 已经开始深刻改变我们的工作与思考方式,浏览器这个「入口」本身,似乎还停留在上个时代。

 

时代需要一个既能提升传统浏览效率与体验,又能智能执行复杂任务的新浏览器。他理解你的意图,将繁琐的点击化为一句简单的指令,将多个网站整合成智能工作流,在你需要时提供恰到好处的帮助,比如表单自动填充、标签页自动管理;同时,它也拥有强大的「自主行动力」,在你授权下,作为一个可靠的助理,为你处理那些跨越多个网站的繁琐事务。

 

这不仅是浏览器的升级,更是一场让工具更好服务于人的变革:使人类挣脱「工具的工具」的枷锁,让产品回归生产力服务本质,让每个人重获时间的主权。


00:00 / 00:00
    1.0x
    • 3.0x
    • 2.5x
    • 2.0x
    • 1.5x
    • 1.25x
    • 1.0x
    • 0.75x
    • 0.5x
    网页全屏
    全屏
    00:00


    Fellou 发布业界首个 Agentic 浏览器


    浏览器在全球有 30 亿用户,几乎是所有用户最常用、最熟悉的应用。无论是查看信息、观看流媒体,还是使用 SaaS 应用,浏览器都承担了「总入口」的角色。在全球 SaaS 生态下,浏览器已发展为类似操作系统的地位。例如,Chromebook 的 ChromeOS 直接将浏览器作为主要用户界面,强调云端存储和多重安全防护,体现了浏览器在操作系统层面的重要性。

     

    浏览器的形态已经多年未变,但在大模型和 Agentic AI 的推动下,浏览器正从「信息浏览工具」升级为「行动与工作流聚合智能体」。这为新玩家带来了类似于 iPhone 颠覆诺基亚的机遇:只要抓住「浏览器+ AI +工作流」这三个关键要素的融合,并为用户提供颠覆性的交互与自动化体验,就有可能在这个看似饱和的市场中实现弯道超车。

     

    以往,浏览器分为三种:


    • 传统普通浏览器:侧重信息浏览,目前浏览器的最常见形态;

    • 对话式浏览器(Conversational Browsers):侧重信息交互与内容生成,侧重于通过 AI 辅助实现信息交互与内容生成。例如 Microsoft Edge(Copilot)、Opera One + Aria、360 AI 浏览器、豆包和部分 Arc 版本,均以自然语言交互、问答和内容摘要为主,但整体操作仍由用户主导;

    • 搜索优化型 AI 浏览器(Search-Optimized AI Browsers):侧重深度信息检索和摘要,通过 AI 技术对网页内容进行整合和生成精准答案。例如 Perplexity Comet 和新夸克均以深度检索和内容整合为主要卖点,提供精准信息查询服务;

     

    而 Fellou 尝试开创第四种浏览器:Agentic Browser 行动型浏览器,侧重端到端自主行动,一种集成了具备思考和行动能力的智能代理的浏览器,其不仅展示信息,更能根据用户高层目标自主拆解任务、跨界操作并完成端到端任务交付。专为忙碌的上班族、知识工作者、创业者以及高效工作者打造,让你不再为重复性网络操作浪费宝贵时间。只需一句话指令,Fellou 就能将繁琐的在线任务自动化、调研的自动化——无论是查找资料、提交申请、在线下单还是研究新领域,调研产品或者行业,都将变得轻松快捷,真正让你体验到人工智能时代的高效服务。

     

    换句话说,Agentic Browser 不仅是一个信息展示和交互的浏览器,更是一个能够主动替用户执行复杂任务的数字助手。用户只需要提出一个意图或目标,浏览器内嵌的智能代理便能自主进行信息检索、数据整合、操作执行等多步骤流程,从而大幅提升用户的生产力。

    融合 Browser、Agent 和 Workflow Automation


    Fellou 将 Browser、Agent、Workflow Automation 三者整合成 Agentic Browser:


    1. Browser(浏览器):负责最广泛的 Web 内容访问与渲染,以及对操作系统、文件系统、命令行与本地应用的直接控制;

    2. Agent(智能体):负责「思考」和「决策」,基于 LLM 或其他算法来理解上下文、规划行动;

    3. Workflow Automation(工作流自动化):负责「执行」和「工具化」,能调用不同的 API、插件、脚本,实现跨网站、跨应用的自动化操作,并能与 A2A、MCP 等协议集成。



    这三者的结合能够创造出「可思考、可操作、可执行」的闭环,让浏览器不再仅仅是信息载体,而是一个具备行动力与自动化能力的「多功能工作平台」。此外,Fellou 还在传统浏览器的基础之上增加了对本地电脑的控制能力,使其成为互联网与本地空间的桥梁,在处理用户任务时同时可以拥有 Web 应用与本地的 Context,在数字世界内拥有无限的行动空间和跨平台任务处理能力

     

    这种全新架构使得 Fellou 从传统的信息展示工具转变为真正「帮你工作」的智能生产力平台,完全解放用户双手,让复杂任务在毫无干预下自动完成,实现从意图到结果的一站式交付。

     

    Fellou 主要由四大核心能力组成:


    1. 深度行动(Deep Action):这是使 LLM 从「问什么都会」,到「干什么都行」的关键能力;

    2. 主动智能(Proactive Intelligence):这是使 Agent 从「被动响应需求」到「主动为用户提供行动推荐和结果建议」的关键能力,换句话说,这项能力使得用户不需要写出非常明确的需求,Fellou 仅通过用户的行为就可预测用户想要完成的事情,最终将结果交付给用户;这种主动智能还会为用户形成个人知识库(Personal Knowledge Base),从而强化用户个性化体验,增强知识自动化整合

    3. 混合影子空间(Hybird Shadow Workspace):这是不抢占用户电脑,且能根据不同任务类型获取用户上下文、了解用户、增强用户体验和与 Agent 协作体验的关键技术;

    4. 智能体网络(Agent Store):这是使用户能享受到更多垂直 Agent 能力的关键生态网络,他连接了垂直与通用,使有垂直 Know-how 的 Agent 创作者可以向全网用户开发、共享自己的经验、知识和工作流

    深度行动(Deep Action):从「信息获取」到「行动聚合」


    Fellou 不同于市面上任何传统浏览器和 AI 浏览器。传统浏览器主要用于展示内容,用户需要手动点击、复制、填写表单等一系列重复性操作,而这些操作往往分散在多个标签页和不同平台之间,无法实现高效的跨界整合。


    Fellou 推出了独特的 Deep Action 功能。用户只需要一句话,Fellou 就能自动解析指令、智能拆解任务,并跨多个网页和系统调度操作,从数据采集、表单填写到最终报告生成,整个复杂工作流均能实现一站式无缝交付,让您彻底摆脱繁琐操作,释放双手,专注更高价值的决策与创新。

     

    实际上,用户在浏览器上的行为可以大致分为两类:


    1. Search ——用户通过浏览海量网页来收集信息、分析数据,获取所需知识,Fellou 可以批量并行化一次性辅助用户阅读大量网页信息;

    2. Workflow ——用户需要依靠一系列序列化操作完成具体任务,如在线购物、预订会议、填写报告、交互提交等,Fellou 可根据用户需求自行规划任务并自主行动;

     

    为验证生成的报告效果,Fellou 团队找了 60 个用户测评,分为五大维度(准确性、描述清晰性、思考深度和广度、可读性),和 Deep Research、Manus、Perplexity 做了打分比较,Fellou 综合评分为最高,其中可读性>表述清晰性>准确性>思考深度和广度



    同时,从执行速度层面来看,Fellou 也优于其他相似产品,在 49 个任务中,Fellou 的平均耗时仅为 3.7 分钟,相比较 Manus 的 18.6 分钟和 OpenAI DeepResearch 的 11.5 分钟皆有显著的速度优势:



    Fellou 的自动化 Workflow 依托于 Fellou 团队自研的浏览器使用框架 Eko,其以生产级可干预特性、更快的执行速度、更低的执行成本(Fellou 单次任务的执行费用在 3 毛人民币到 3 元人民币)显著优于同类产品:


    Eko 框架在执行网页任务时平均速度比 Browseruse 框架快 2.83 倍



    在生产过程中,Hook 系统允许实时监控任务执行,并可以通过人工或 AI 干预来调整行为

    更多用例可访问 fellou.ai/use-cases 查看。


    相比起传统的对话式浏览器 (Conversational Browsers),Fellou 核心优势包括:


    • 深层私有访问:像 Perplexity 这类 AI 答疑搜索工具只能回答问题,无法登录并浏览私密内容。而 Fellou 的深度搜索可安全地访问需登录的网站(如论坛、职业社交网等)并进行搜索,发掘其他 AI 浏览器错失的信息。

    • 标签页作为上下文记忆:Fellou 允许与用户共享本地工作空间,能够准确捕捉并用户操作的标签页作为任务处理的上下文,实现跨网站信息连续性处理;

    • 影子空间:Fellou 通过独立的沙箱虚拟化环境同时操作多个网页,确保任务执行之间、智能体和用户之间不互相干扰,安全高效,增强用户体验;

    • 并行化、自动化任务编排:内置 Agent 模块不仅解析用户指令,还能自动拆解任务、规划操作路径,优化多步骤工作流,并行化执行;

    • 可视化调研呈现:集成智能分析报告功能,可以将多网页信息整合并以直观图表和摘要形式呈现,方便一键共享和决策;

    主动智能(Proactive Intelligence):浏览器预判你的需求,从「交付信息」到「交付结果」


    Fellou 正在重塑人工智能代理与人类之间的生产关系,不再满足于被动应答,而是以一种充前瞻性的方式主动为用户服务,为用户提出需求,由用户来原则。不同于传统产品只能被动响应用户指令,Fellou 利用先进的深度语义理解和上下文记忆技术,实时捕捉用户在各个网页上的操作轨迹,并不断积累用户的行为数据和操作习惯——从常访问的网站到重复执行的任务,都成为它记忆的一部分。这种「数字记忆」不仅仅是数据的堆叠,而是一种对用户工作模式和习惯的深刻洞察。


    正因为具备这样的能力,Fellou 能够超前识别用户潜在的任务需求:当它察觉到用户即将进行某项重复性操作,或发出一个隐晦的需求信号时,Fellou 会主动发出询问,提醒用户是否需要提前介入或直接接管任务。用户无需再花费精力详细描述需求,而能感受到 Fellou 似乎早已预知下一步,并用温暖而精准的方式将服务送到用户手边。


    这种主动服务不仅显现了人工智能技术的演进,更是一种全新的数字劳动体验:在 Fellou 的陪伴下,用户仿佛拥有了一位善解人意的数字伙伴,它不仅能完成任务,更懂得关怀用户的日常压力与高效需求。正如哲学家所探讨的「技术即关怀」,Fellou 以超越传统工具的智能和敏感,赋予了数字工作一种温度和情感,让生产力的提升不再冰冷,而是充满人性化的温情与智慧。

    混合影子空间(Hybird Shadow Workspace):从「AI 抢占人类电脑」到「人与 AI 和谐相处」


    Fellou 非常重视 Agent 在终端用户实际生产环境中的表现,Fellou 认为 Agent 的执行环境需要划分为本地、本地虚拟化和云桌面的方式,用以处理不同的任务。比如,用户对 Fellou 说「打开我的日历,新建一个周六早上 9 点的健身日历」,这种单步骤 20s 以内就可以执行完成的任务,可以放在本地执行,用户能容忍短暂的对用户电脑的抢占;而像比如「整理我过去一周的日历和邮件,整理成 Todo」这种既依赖本地上下文,又是长程的任务,适合放到本地的虚拟化环境中执行,这种环境即被称作「影子空间」,他可以做到在 Agent 执行任务时不干扰用户使用电脑,同时用户还可以看到 Agent 的执行进程并在适当时刻加以干预;而对于那些不依赖本地上下文,又是长程的任务,如「在 Github 上找 Transformers 的 Issue 列表,分析其目前存在的 Bug」,则适合放在云桌面中运行,这样就能做到用户关掉电脑外出后还可以在手机上与 Fellou 交互。


    影子空间的核心技术基于操作系统虚拟化,通过构建精密的虚拟容器实现环境高效隔离。在此虚拟环境中,Fellou 得以安全运行,同时共享 Session 会话信息,从而实现网站的无缝免登录访问。AI Agent 在虚拟环境中模拟人类的鼠标与键盘操作,驱动 Fellou 执行各类复杂任务,大幅提升工作效率与用户体验。

    智能体网络(Agent Store):从「人和人之间的 Connection」到「人和 Agent 之间的 Connection」


    在 Fellou 的世界里,智能不仅仅是技术产物,而是一种全新的互动方式,就像人与人之间的连接。正如创始人谢扬所言,人与智能的关系应当建立在相互选择、深度互动与彼此支持之上。Fellou 致力于打造一个自然且开放的平台,让每个用户都能将自身的经验和能力沉淀为一个独立的垂直 Agent,这些 Agent 不仅可以帮助自己,更能在社区中共享、相互学习,为他人提供智慧服务。


    在这个平台上,每位用户不仅能发布自己独特的经验,打造个性化的对话智能体;同时,也可以将自己在执行某项任务过程中形成的操作序列封装为一个完整的工作流,供其他用户直接调用,实现真正意义上的行动智能体。这里,每一个 Agent 都是智慧与经验的结晶,是人类对自身能力的一种数字化沉淀和再造。


    对于高代码开发者,Fellou 提供了 Eko Framework——一套通过自然语言设计和部署高效 Agentic Workflow 的开发框架,同时是开源框架 Browser use 的生产级进阶版本。Eko 允许开发者以自然语句编写、调试和优化工作流程,将创意迅速转化为智能化操作模型。在 Eko 的支持下,开发者不仅可以自定义工具,实现全新的行为模式,还能通过 Hook 机制在 Agent 执行过程中动态干预和调整,从而保证每一个工作流都足够灵活、精准并符合实际生产需求。


    这一智能体生态体系不仅打破了传统浏览器只是被动信息展示的局限,更将智能与人类的交互提升到了「共生」层面。Fellou 让每个人都能成为智能生态的一部分:你可以将自己的经验沉淀为 Agent,既为自身赋能,也为社区贡献智慧;你可以通过开放平台不断发现和学习他人的智能方案,共同推动整个生态的进化。正如人与人之间通过交流建立起彼此的信任和合作,Fellou 正在构建一个以「智能体」为媒介的全新数字生态,让技术与情感、经验与创新在这个平台上自由流动,携手赋能每一个用户。

    混合反馈的经验学习(Hybird Feedback Experience Learning)


    生产级的智能体一个关键挑战在于:如何让智能体不仅依赖环境交互来持续优化行为,还能从结构化的失败反馈中获得改进。我们提出了一种混合反馈经验学习(Hybird Feedback Experience Learning)框架:当基于浏览器的智能体在执行任务过程中失败——无论是由于查询模糊、工具使用错误,还是规划错误——都会触发一个次级分析机制。在这一阶段,人类监督者或大型语言模型(LLM)将对失败的执行轨迹进行回顾性分析,从中提取出可操作的经验洞察,例如误解、次优决策点或被忽视的交互机会。


    混合反馈的经验学习架构


    这些提炼出的经验随后被注入至结构化的经验库中,形成一个不断扩展的「失败感知型示范语料库」。当智能体未来再次遇到类似查询或情境时,基于检索的泛化机制使其能够主动调用此前的纠正策略,从而降低重复失败的概率,加速任务掌握过程。这一混合机制整合了检索增强生成(RAG)与人类参与监督的优势,使智能体的经验库不仅是自我生成的,更是经过反思性丰富的。它标志着迈向具备自我纠错能力的智能体的关键一步,这种能力建立在真实世界交互与元认知分析的双重基础之上。

    Fellou 的背后: 95 后创业者、25 岁融资过亿,脚踏实地,仰望星空的新时代 AI 航海人


    Fellou 是由 Authing 身份云创始人谢扬创建的 Agent 产品,他在 2019 年创办了 Authing 身份云,为企业和开发者提供事件驱动的身份认证云服务。截止 2024 年,Authing 已服务 700+ 客户和数亿用户,平台拥有数万开发者,每月有千万级认证次数,获得过多家基金数千万美元投资。


    同时值得注意的是,Authing 在美国最大的竞争对手 Okta 在 2024 年投资了一家名为 Browserbase 的云浏览器 Infra 公司,这也表明了浏览器相关技术和产品在全球的关注度之高。

    Fellou Benchmark: Agentic Browser 的新标准


    据悉,Fellou 即将开源 Agentic Browser 的评估 Benchmark,以用户的实际生产场景和用户体验为中心,构建跨环境、跨应用、跨设备的 Agent 任务集,用以评估 Agentic Browser 提高用户在真实生产环境下生产力的表现。



    目前,Fellou 已开启全球内测,提供 PC Mac(Apple 芯片和 Intel 芯片)版供下载使用(fellou.ai/download),预计在今年下半年会开放 Windows 版和移动版。


    2025-04-22 17:575930

    评论

    发布
    暂无评论

    2023 重学 Angular

    PingCode研发中心

    前端框架

    三年后端开发:拿下阿里/腾讯/美团等四个大厂的Offer后,总结如下

    钟奕礼

    Java Java 面试 程序员‘ java 编程

    SpringMVC常用注解

    @下一站

    软件开发 程序 Java‘’ 11月月更

    10月&11月书单

    图灵社区

    书单推荐

    企业想要高效运营,还需要选择瓴羊Quick BI软件

    流量猫猫头

    大数据

    精彩回顾 | 云原生系统软件的产业应用

    BoCloud博云

    云原生

    springboot整合canal

    @下一站

    Java 程序开发 spring-boot 11月月更

    Lattice - 面向高可扩展的业务框架

    原力在线

    架构 中台 插件 lattice 业务平台分离

    图数据技术护航网络安全

    Neo4j 图无处不在

    网络安全 neo4j 图数据库 知识图谱 图算法

    互联网企业面试必问Spring源码?搞定Spring源码,看完这篇就够了

    钟奕礼

    Java java面试 java编程 程序员‘

    新时代冠军企业成功硬道理:人效管理与可组装式HCM SaaS

    ToB行业头条

    阿里云洛神云网络集中式网关丨技术解读与产品实践

    云布道师

    云网络

    对话Neo4j首席科学家Jim Webber:图数据库江湖5年后将尘埃落定

    Neo4j 图无处不在

    neo4j 图数据库 知识图谱 非关系型数据库 图技术

    关于不法分子冒用我司名义虚假招聘的严正声明

    嘉为蓝鲸

    火爆全球的“饺子皮”3D手办原来是这样做的!关键时刻少不了远程控制软件!

    RayLink远程工具

    远程控制软件 远程办公软件 远控软件 远程桌面连接 RayLink

    ModelWhale 教学实训模块,更流畅的作业编写及提交体验|ModelWhale 版本更新

    ModelWhale

    人工智能 机器学习 数据分析 编程建模 教学实训

    在结构效率不变情况下的降本增效

    PMO实践

    数字化转型 数字化 数智化 11月月更

    跟误告警说再见,Smart Metrics 帮你用算法配告警

    阿里巴巴云原生

    阿里云 云原生 Grafana

    aPaaS是什么(aPaaS与iPaaS的区别)

    优秀

    aPaaS ipaas

    SAP MM 使用两个STO实现免关税跨国公司间转储

    SAP虾客

    构建基于 Ingress 的全链路灰度能力

    阿里巴巴云原生

    阿里云 微服务 云原生w

    瓴羊Quick BI在商业智能BI发展趋势方面如何?

    对不起该用户已成仙‖

    蓝鲸研运体系在腾讯内是如何应用实践的?

    嘉为蓝鲸

    运维 智能运维AIOps

    基于云原生技术的融合通信是如何实现的?

    阿里云CloudImagine

    阿里云 云通信

    嘉为科技宋蕴真:观测不止于监控,让运维不开盲盒

    嘉为蓝鲸

    运维 智能运维AIOps

    腾讯云原生容器服务发布三大新能力,创新自研技术助力企业降本增效

    科技热闻

    MegEngine Inference 卷积优化之 Im2col 和 winograd 优化

    MegEngineBot

    深度学习框架 卷积 MegEngine

    数字产业化的颠覆创新和生态打法

    PMO实践

    产业数字化 11月月更

    8年程序员年初被迫毕业,前后面试30家公司,如今终于上岸

    Java永远的神

    程序人生 后端 java程序员 java面试 面经分享

    MyBatis resultMap元素的用途是什么呢?

    @下一站

    技术 mybatis java; 11月月更

    图计算的黄金时代 知识图谱背后的数据价值

    Neo4j 图无处不在

    neo4j 图数据库 知识图谱 图计算 图技术

    Fellou 发布业界首个 Agentic 浏览器:侧重端到端自主行动,融合 Browser、Agent、Workflow Automation_生成式 AI_Fellou AI_InfoQ精选文章