写点什么

击败 Manus?前百度 AI 高管创业 1 年多,放弃 500 万用户搜索产品,研发 9 个月转向“最强 Agent”

  • 2025-04-07
    北京
  • 本文字数:4051 字

    阅读完需:约 13 分钟

大小:1.88M时长:10:57
击败Manus?前百度AI高管创业1年多,放弃500万用户搜索产品,研发9个月转向“最强Agent”

前两天,总部位于美国加州帕洛阿尔托的初创公司 MainFunc 发布了所谓的 Genspark Super Agent,这是一个能快速反应的自主系统,可自主思考、计划、行动并使用工具来帮助用户处理所有日常任务。

 

那么,这款 AI Agent 什么来头,又具体能做什么?

 

Genspark Super Agent 背后的公司 MainFunc 成立于 2023 年年底,创始人为景鲲(Eric Jing)和朱凯华(Kay Zhu)。景鲲曾担任百度旗下小度科技 CEO、百度集团副总裁、百度智能生活事业群组(SLG)总经理,百度人工智能产品委员会主席。 加入百度之前担任微软首席研发总监,负责微软必应搜索亚洲市场的研发工作,也是微软小冰的创造者。朱凯华曾任小度科技 CTO,加入百度之前担任谷歌主任架构师,是 Google Panda 等一系列核心算法的创造者

 

该团队由来自微软、谷歌和百度的资深人士组成,约有 20 名成员,总部位于加州帕洛阿尔托和新加坡,并计划在西雅图开设新办事处。

 

这次他们发布的 GenSpark Super Agent 是一种新型通用 AI Agent,旨在自主处理跨领域的复杂任务。与简单的聊天机器人或脚本不同,GenSpark Super Agent 可以像人类助手一样“思考、计划、行动和使用工具”。它不仅可以生成文本,还可以代表用户采取行动。当用户向 Super Agent 提供高级指令(类似于项目简介或 SOP),它将在内部分解问题、制定计划并在最少的监督下逐步执行该计划。这意味着它可以执行多步骤任务,例如研究信息、转换数据,甚至执行现实世界的操作(例如打电话),而无需持续指导。

 

在架构上,Super Agent 的独特架构采用“混合代理”设计,集成了八种不同的大型语言模型 (LLM)、80 多种内部工具和十多个精选数据集。根据复杂性、速度和准确性需求,每个任务都会智能地路由到最佳模型,确保高效、精确地执行。

Genspark 背后的故事

 

2024 年,MainFunc 发布了其首款产品,Genspark,即“AI Agentic Engine”,定位为专注于提供搜索服务的 AI Agent 引擎。凭借创新理念,Genspark 迅速跃升至 Product Hunt 每日新品榜单第四位。

 


2024 年 6 月,MainFunc 完成了由新加坡 BlueRun Ventures 领投的 6000 万美元种子轮融资,使该公司的估值达到 2.6 亿美元。这笔资金将加速 Genspark 的发展和市场扩张。

 

今年 2 月,MainFunc 又被爆已在 A 轮融资中筹集了 1 亿美元,估值达到 5.3 亿美元。

 

Genspark 之所以受到如此多的关注,是因为它不仅仅是一个搜索引擎,还是一个 AI 代理引擎,旨在利用 AI 提供高质量的搜索体验。它的特点是能解决传统搜索引擎的诸多缺点,例如无休止的广告、有偏见的信息以及大量不相关的结果。

 

Genspark 背后的创新在于其独特的“Sparkpages”概念。Sparkpages 是由专业 AI 代理生成的定制页面,提供公正、可靠的信息,不受 SEO 驱动的内容干扰。这些页面通过提供更有意义和更有价值的搜索结果,为用户节省了宝贵的时间。

积累 500 万用户后,转战 Super Agent

 

目前,Genspark 主要面向美国市场,免费提供,未来计划推出付费订阅模式。

 

近日,MainFunc 公司 CTO 朱凯华在 Product Hunt 上发布的一封信中表示:“我们做出了一个违反直觉的决定——尽管旗下 AI 搜索产品已覆盖超过 500 万用户,但我们还是要将其放弃。至于理由,是因为我们认为传统 AI 搜索已经过时。”

 

朱凯华分享了公司过去 9 个月构建这款 Super Agent 的经历。

 

00:00 / 00:00
    1.0x
    • 3.0x
    • 2.5x
    • 2.0x
    • 1.5x
    • 1.25x
    • 1.0x
    • 0.75x
    • 0.5x
    网页全屏
    全屏
    00:00


    在景鲲所做的演示中,Genspark 的 Super Agent 规划了为期五天的圣地亚哥之旅,计算了景点之间的步行距离,绘制了公共交通选项,然后使用语音呼叫代理预订餐厅,包括处理食物过敏和座位偏好。另一个演示展示了代理通过生成食谱步骤、视频场景和音频叠加来制作烹饪视频卷轴。

     

    这些可能听起来以消费者为中心,但它们展示了技术的发展方向——多模式、多步骤的任务自动化,模糊了创意生成和执行之间的界限。

     

    “解决这些现实问题比我们想象的要困难得多,”景鲲在视频中说道,“但我们对所取得的进展感到非常兴奋。”

     

    一个引人注目的功能:Super Agent 清晰地可视化了其思维过程,追踪其如何推理每个步骤、调用哪些工具以及原因。实时观察逻辑的执行,让系统感觉不像黑匣子,而更像合作伙伴。它还可以激励企业开发人员在自己的 AI 系统中构建类似的可追踪推理路径,使应用程序更加透明和可信。

    预定义的工作流程无法扩展

     

    当 Perplexity 于 2022 年底亮相时,曾经激发人们对于 AI 颠覆搜索这一潜力的关注和期待。这是因为此前的搜索查询遵循严格的工作流程:


    • 分析查询并扩展关键字;

    • 检索排名最靠前的 Web 结果;

    • 将其重新排序/总结为最终响应。

     

    虽然这套框架足以解决基本问题,但对于更复杂的需求,例如比较技术解决方案、规划多因素采购决策或者处理深度研究,这样的框架显然力有不逮。

     

    在 Genspark,团队起步阶段也以同样的流程构建起自己的 AI 搜索引擎,之后做出逐步改进:

     

    • 使用专门的数据源(学术、金融、旅游、产品等)以丰富信息内容。

    • 通过并行搜索自动触发对复杂查询的深入调查。

    • 交叉检查异步智能体以验证那些过于复杂而无法快速即时处理的语句,随后进一步扩展为数据搜索与深度研究智能体。

    • 采取混合智能体方法以对抗幻觉,由多个智能体相互验证彼此输出。

     

    朱凯华表示,虽然这些创新方法显著提高了搜索质量并扩大了用户群体,但他们意识到整套设计仍受到传统思路的束缚,即依然遵循固定且预先定义的工作流程。为了真正建立起拥有强大适应性且丰富上下文的解决方案,团队必须全面摆脱束缚。这一认识促使他们打造出超级智能体——一种整合所有过往改进,且不受静态步骤序列约束的全新范式。

    Super Agent 中的工程适应性设计

     

    Genspark Super Agent 不再强制每条查询经过固定的工作流程,而是根据手头问题进行灵活调整。它会规划各个步骤,使用最佳工具或子智能体、观察结果并实时调整策略,且时常表现出令我们惊讶的卓越创造力。如果一种方法失败,超级智能体会丝滑过渡至另一种方法,规模化模拟人类的问题解决方法。

     

    这样的灵活性既体现在广度层面(即从哪些数据源或 API 中提取数据),也体现在深度当中(即进行了多少轮迭代改进)。对于较为简单的任务,它不会在非必要步骤上浪费时间;而对于较复杂的任务,它可以继续挖掘,直到找出令人满意的答案。它还可以根据每位用户的需求定制其输出结果——包括直接回答、Sparkpage(文章)、演示文稿、生成图像、交互式 HTML 页面,甚至是语音通话。

    大模型、工具与精选数据三位一体

     

    动态编排与模型引导

    Genspark Super Agent 通过混合智能体框架协调八大专用大模型。其中每套模型均经过预告引导,确保在所分配的角色当中表现出色,具体涵盖快速响应、深入分析等领域。这样的层次结构既保障了稳定性,同时也最大限度发挥了每种模型的独特优势。

    专用工具与子智能体

    技术团队预先设计的子智能体库涵盖从演示生成器及 Python 代码执行器,到呼叫模块的多种组件。每个子智能体都针对可靠性和效率进行了优化,确保超级智能体可以处理图表创建、交互式页面开发等任务,且确保用户不会被限制在僵化的工作流程当中。

    值得信赖的精选数据

    超级智能体会访问经过认真验证的数据集,这些数据内容来自高质量 Web 来源、值得信赖的合作伙伴以及专家审查过的存储库。离线验证智能体则不断审核并完美这些数据。通过优先考虑准确性而非数量,最大限度减少了错误信息并确保输出的可靠性。

    经验教训:减少控制、增加工具

    随着从僵化 AI 搜索引擎过渡至更加顺畅且具备自适应能力的超级智能体,Genspark 团队也发现了一项基本原则:减少控制、增加工具。过于结构化的工作流程会限制创造力与功能深度,而引入多个专业智能体以解决问题的不同方面、并赋予其选择及切换多种工具的自由度,则有望释放出更大的能力。

     

    • 减少控制:规定性流程往往会限制探索范畴,导致体系更难适应新的挑战。采取更开放的策略则有助于促进创新与韧性。

    • 增加工具:为智能体配备专门的灵气检索、分析、呈现与通信模块,使其能够实时制定端到端解决方案。这不仅有助于支持高级用例,同时也能保证任务的轻量化与执行效率。

     

    这种将自适应、多样化工具支持与经过审查的数据相融合的探索,使得 Genspark 超级智能体比任何传统 AI 搜索产品都更加灵活且可靠。面对如此显著的优势,Genspark 团队才会毅然决定放弃已经蓬勃发展的 AI 搜索方案,专注于超级智能体所代表的新方向。

     

    在基准测试中击败 Manus

     

    那么,与其他 AI Agent 比较,GenSpark 表现如何?

     

    通过广泛的模型集成和直接使用 API 来与 Manus AI 和 OpenAI Operator 等竞争对手区分开来。虽然 Manus AI 主要依赖较少的模型并提供较少的集成工具,但 GenSpark 更广泛的工具集和现实世界的交互功能(包括语音呼叫)提供了额外的实际优势。与仅限于基于浏览器的操作的 OpenAI Operator 相比,GenSpark 以 API 为中心的方法可以实现更快、更结构化的数据检索和更丰富的任务执行功能。

     


    业内专家指出,Super Agent 的多智能体设计代表了 AI Agent 技术的一个重要趋势。相较于传统的单模型系统,这种混合架构不仅提升了任务处理的灵活性,还显著降低了错误率和“幻读”(产生不准确内容)的概率。例如,在 GAIA 基准测试中,Super Agent 的表现优于部分 OpenAI 模型和 Manus,证明了其在自动化任务执行中的高可靠性。这一优势在对准确性和可控性要求较高的场景中尤为突出。

     

    不过,Super Agent 的推出也带来了一些悬而未决的问题。有评论指出,其多代理系统的具体实现细节尚未完全披露,在极其复杂的任务或资源受限的环境中的表现仍需进一步验证。此外,随着人工智能代理技术的普及,确保数据隐私和系统透明性也将是 Genspark 未来需要解决的挑战。

     

    Genspark Super Agent 允许用户在无需个人凭证的情况下开始测试。

     

    参考链接:

    https://www.marktechpost.com/2025/04/05/meet-genspark-super-agent-the-all-in-one-ai-agent-that-autonomously-think-plan-act-and-use-tools-to-handle-all-your-everyday-tasks/

    https://venturebeat.com/ai/gensparks-super-agent-ups-the-ante-in-the-general-ai-agent-race/

    https://mainfunc.ai/blog/genspark_kill_aisearch

    https://mainfunc.ai/blog/genspark_moa_powered_search

    https://www.producthunt.com/posts/genspark-super-agent

    2025-04-07 17:416745
    用户头像
    李冬梅 加V:busulishang4668

    发布了 1061 篇内容, 共 678.6 次阅读, 收获喜欢 1223 次。

    关注

    评论

    发布
    暂无评论

    惊险的B站Java后端岗面试之旅,复盘面试经历及面试真题

    Java架构之路

    Java 程序员 面试 编程语言

    实现一个简单的 MobX

    局外人

    大前端 js React

    spring-boot-route(十五)整合RocketMQ

    Java旅途

    Java RocketMQ Spring Boot

    生态共赢-anyRTC创业扶持计划

    anyRTC开发者

    ios 音视频 WebRTC RTC 安卓

    手把手带你玩转 openEuler | 初识 openEuler

    openEuler

    Linux 开源 操作系统

    蚁架构师首推SpringBoot套餐(原理+实战+面试)

    小Q

    Java 学习 架构 微服务 SpringBoot 2

    java安全编码指南之:锁的双重检测

    程序那些事

    java安全编码 java安全编码指南 java代码规范 java代码安全

    英特尔聚焦全栈量子研究:发布多项重磅量子计算研究成果

    E科讯

    只要十步,你就可以应用表达式树来优化动态调用

    newbe36524

    C# netcore ASP.NET Core

    LAXCUS大数据集群操作系统:一个分布式分时共享E级系统软件(一)

    陈泽云

    人工智能 云计算 大数据 基础设施 国产操作系统

    WebSocket从入门到精通,半小时就够!

    JackJiang

    html5 网络编程 websocket 即时通讯

    架构师训练营第四周作业

    四夕晖

    技术解析 | 云游戏在未来如何实现?

    腾讯云音视频

    开发 游戏 视频

    搞开发,写SQL就够了

    棒锤🐮

    sql mybatis springboot Web框架 Rocket API

    [Go并发编程实战课]01.Mutex学习笔记

    Quincy

    Go 语言

    Java零基础到进阶宝典!从小白到大神,金九银十面试这届斩获23K月薪

    Java架构追梦

    Java 学习 架构 面试 核心知识点

    视频会议的应用

    anyRTC开发者

    ios 音视频 WebRTC 直播 安卓

    【全球案例】ESL 游戏公司如何通过 Jira 定制化解决方案连接全球团队

    Atlassian

    项目管理 敏捷 Atlassian Jira

    手把手带你玩转 openEuler | 如何安装 openEuler

    openEuler

    Linux 开源 操作系统 openEuler

    详细分析定制企业应用的价格

    Philips

    敏捷开发 快速开发

    为什么学Go(一)

    soolaugust

    Go 语言

    TensorFlow 篇 | TensorFlow Serving API

    Alex

    tensorflow keras model serving tensorflow serving api

    LeetCode题解:145. 二叉树的后序遍历,栈,JavaScript,详细注释

    Lee Chen

    大前端 LeetCode

    月薪60k的Java开发在阿里是什么级别?对技术能力有哪些要求?

    Java架构之路

    Java 阿里巴巴 程序员 面试 编程语言

    教育场景方案升级| 打通业务前后端,少量开发快速上线(一):互动小班

    ZEGO即构

    在线教育 低代码

    TNFE-Weekly[第七十五周已更新]

    莹姐🙈

    小程序 大前端 周报

    [Go 并发编程实战课]02.Mutex 源代码

    Quincy

    Go 语言

    2020年第三季度《全国移动App 风险监测评估报告》

    InfoQ_11eaedef67e9

    App 移动安全 个人隐私安全

    vidyo在数字化办公中提供了什么便利?

    dwqcmo

    音视频 集成架构 解决方案 智能硬件

    1分钟将vscode撸成小霸王

    gamedilong

    vscode 大前端

    4年Java经验,备战两月成功拿到美团、京东、字节offer

    Java架构之路

    Java 程序员 面试 编程语言

    击败Manus?前百度AI高管创业1年多,放弃500万用户搜索产品,研发9个月转向“最强Agent”_生成式 AI_李冬梅_InfoQ精选文章