大厂Data+Agent 秘籍:腾讯/阿里/字节解析如何提升数据分析智能。 了解详情
写点什么

击败 Manus?前百度 AI 高管创业 1 年多,放弃 500 万用户搜索产品,研发 9 个月转向“最强 Agent”

  • 2025-04-07
    北京
  • 本文字数:4051 字

    阅读完需:约 13 分钟

大小:1.88M时长:10:57
击败Manus?前百度AI高管创业1年多,放弃500万用户搜索产品,研发9个月转向“最强Agent”

前两天,总部位于美国加州帕洛阿尔托的初创公司 MainFunc 发布了所谓的 Genspark Super Agent,这是一个能快速反应的自主系统,可自主思考、计划、行动并使用工具来帮助用户处理所有日常任务。

 

那么,这款 AI Agent 什么来头,又具体能做什么?

 

Genspark Super Agent 背后的公司 MainFunc 成立于 2023 年年底,创始人为景鲲(Eric Jing)和朱凯华(Kay Zhu)。景鲲曾担任百度旗下小度科技 CEO、百度集团副总裁、百度智能生活事业群组(SLG)总经理,百度人工智能产品委员会主席。 加入百度之前担任微软首席研发总监,负责微软必应搜索亚洲市场的研发工作,也是微软小冰的创造者。朱凯华曾任小度科技 CTO,加入百度之前担任谷歌主任架构师,是 Google Panda 等一系列核心算法的创造者

 

该团队由来自微软、谷歌和百度的资深人士组成,约有 20 名成员,总部位于加州帕洛阿尔托和新加坡,并计划在西雅图开设新办事处。

 

这次他们发布的 GenSpark Super Agent 是一种新型通用 AI Agent,旨在自主处理跨领域的复杂任务。与简单的聊天机器人或脚本不同,GenSpark Super Agent 可以像人类助手一样“思考、计划、行动和使用工具”。它不仅可以生成文本,还可以代表用户采取行动。当用户向 Super Agent 提供高级指令(类似于项目简介或 SOP),它将在内部分解问题、制定计划并在最少的监督下逐步执行该计划。这意味着它可以执行多步骤任务,例如研究信息、转换数据,甚至执行现实世界的操作(例如打电话),而无需持续指导。

 

在架构上,Super Agent 的独特架构采用“混合代理”设计,集成了八种不同的大型语言模型 (LLM)、80 多种内部工具和十多个精选数据集。根据复杂性、速度和准确性需求,每个任务都会智能地路由到最佳模型,确保高效、精确地执行。

Genspark 背后的故事

 

2024 年,MainFunc 发布了其首款产品,Genspark,即“AI Agentic Engine”,定位为专注于提供搜索服务的 AI Agent 引擎。凭借创新理念,Genspark 迅速跃升至 Product Hunt 每日新品榜单第四位。

 


2024 年 6 月,MainFunc 完成了由新加坡 BlueRun Ventures 领投的 6000 万美元种子轮融资,使该公司的估值达到 2.6 亿美元。这笔资金将加速 Genspark 的发展和市场扩张。

 

今年 2 月,MainFunc 又被爆已在 A 轮融资中筹集了 1 亿美元,估值达到 5.3 亿美元。

 

Genspark 之所以受到如此多的关注,是因为它不仅仅是一个搜索引擎,还是一个 AI 代理引擎,旨在利用 AI 提供高质量的搜索体验。它的特点是能解决传统搜索引擎的诸多缺点,例如无休止的广告、有偏见的信息以及大量不相关的结果。

 

Genspark 背后的创新在于其独特的“Sparkpages”概念。Sparkpages 是由专业 AI 代理生成的定制页面,提供公正、可靠的信息,不受 SEO 驱动的内容干扰。这些页面通过提供更有意义和更有价值的搜索结果,为用户节省了宝贵的时间。

积累 500 万用户后,转战 Super Agent

 

目前,Genspark 主要面向美国市场,免费提供,未来计划推出付费订阅模式。

 

近日,MainFunc 公司 CTO 朱凯华在 Product Hunt 上发布的一封信中表示:“我们做出了一个违反直觉的决定——尽管旗下 AI 搜索产品已覆盖超过 500 万用户,但我们还是要将其放弃。至于理由,是因为我们认为传统 AI 搜索已经过时。”

 

朱凯华分享了公司过去 9 个月构建这款 Super Agent 的经历。

 

00:00 / 00:00
    1.0x
    • 3.0x
    • 2.5x
    • 2.0x
    • 1.5x
    • 1.25x
    • 1.0x
    • 0.75x
    • 0.5x
    网页全屏
    全屏
    00:00


    在景鲲所做的演示中,Genspark 的 Super Agent 规划了为期五天的圣地亚哥之旅,计算了景点之间的步行距离,绘制了公共交通选项,然后使用语音呼叫代理预订餐厅,包括处理食物过敏和座位偏好。另一个演示展示了代理通过生成食谱步骤、视频场景和音频叠加来制作烹饪视频卷轴。

     

    这些可能听起来以消费者为中心,但它们展示了技术的发展方向——多模式、多步骤的任务自动化,模糊了创意生成和执行之间的界限。

     

    “解决这些现实问题比我们想象的要困难得多,”景鲲在视频中说道,“但我们对所取得的进展感到非常兴奋。”

     

    一个引人注目的功能:Super Agent 清晰地可视化了其思维过程,追踪其如何推理每个步骤、调用哪些工具以及原因。实时观察逻辑的执行,让系统感觉不像黑匣子,而更像合作伙伴。它还可以激励企业开发人员在自己的 AI 系统中构建类似的可追踪推理路径,使应用程序更加透明和可信。

    预定义的工作流程无法扩展

     

    当 Perplexity 于 2022 年底亮相时,曾经激发人们对于 AI 颠覆搜索这一潜力的关注和期待。这是因为此前的搜索查询遵循严格的工作流程:


    • 分析查询并扩展关键字;

    • 检索排名最靠前的 Web 结果;

    • 将其重新排序/总结为最终响应。

     

    虽然这套框架足以解决基本问题,但对于更复杂的需求,例如比较技术解决方案、规划多因素采购决策或者处理深度研究,这样的框架显然力有不逮。

     

    在 Genspark,团队起步阶段也以同样的流程构建起自己的 AI 搜索引擎,之后做出逐步改进:

     

    • 使用专门的数据源(学术、金融、旅游、产品等)以丰富信息内容。

    • 通过并行搜索自动触发对复杂查询的深入调查。

    • 交叉检查异步智能体以验证那些过于复杂而无法快速即时处理的语句,随后进一步扩展为数据搜索与深度研究智能体。

    • 采取混合智能体方法以对抗幻觉,由多个智能体相互验证彼此输出。

     

    朱凯华表示,虽然这些创新方法显著提高了搜索质量并扩大了用户群体,但他们意识到整套设计仍受到传统思路的束缚,即依然遵循固定且预先定义的工作流程。为了真正建立起拥有强大适应性且丰富上下文的解决方案,团队必须全面摆脱束缚。这一认识促使他们打造出超级智能体——一种整合所有过往改进,且不受静态步骤序列约束的全新范式。

    Super Agent 中的工程适应性设计

     

    Genspark Super Agent 不再强制每条查询经过固定的工作流程,而是根据手头问题进行灵活调整。它会规划各个步骤,使用最佳工具或子智能体、观察结果并实时调整策略,且时常表现出令我们惊讶的卓越创造力。如果一种方法失败,超级智能体会丝滑过渡至另一种方法,规模化模拟人类的问题解决方法。

     

    这样的灵活性既体现在广度层面(即从哪些数据源或 API 中提取数据),也体现在深度当中(即进行了多少轮迭代改进)。对于较为简单的任务,它不会在非必要步骤上浪费时间;而对于较复杂的任务,它可以继续挖掘,直到找出令人满意的答案。它还可以根据每位用户的需求定制其输出结果——包括直接回答、Sparkpage(文章)、演示文稿、生成图像、交互式 HTML 页面,甚至是语音通话。

    大模型、工具与精选数据三位一体

     

    动态编排与模型引导

    Genspark Super Agent 通过混合智能体框架协调八大专用大模型。其中每套模型均经过预告引导,确保在所分配的角色当中表现出色,具体涵盖快速响应、深入分析等领域。这样的层次结构既保障了稳定性,同时也最大限度发挥了每种模型的独特优势。

    专用工具与子智能体

    技术团队预先设计的子智能体库涵盖从演示生成器及 Python 代码执行器,到呼叫模块的多种组件。每个子智能体都针对可靠性和效率进行了优化,确保超级智能体可以处理图表创建、交互式页面开发等任务,且确保用户不会被限制在僵化的工作流程当中。

    值得信赖的精选数据

    超级智能体会访问经过认真验证的数据集,这些数据内容来自高质量 Web 来源、值得信赖的合作伙伴以及专家审查过的存储库。离线验证智能体则不断审核并完美这些数据。通过优先考虑准确性而非数量,最大限度减少了错误信息并确保输出的可靠性。

    经验教训:减少控制、增加工具

    随着从僵化 AI 搜索引擎过渡至更加顺畅且具备自适应能力的超级智能体,Genspark 团队也发现了一项基本原则:减少控制、增加工具。过于结构化的工作流程会限制创造力与功能深度,而引入多个专业智能体以解决问题的不同方面、并赋予其选择及切换多种工具的自由度,则有望释放出更大的能力。

     

    • 减少控制:规定性流程往往会限制探索范畴,导致体系更难适应新的挑战。采取更开放的策略则有助于促进创新与韧性。

    • 增加工具:为智能体配备专门的灵气检索、分析、呈现与通信模块,使其能够实时制定端到端解决方案。这不仅有助于支持高级用例,同时也能保证任务的轻量化与执行效率。

     

    这种将自适应、多样化工具支持与经过审查的数据相融合的探索,使得 Genspark 超级智能体比任何传统 AI 搜索产品都更加灵活且可靠。面对如此显著的优势,Genspark 团队才会毅然决定放弃已经蓬勃发展的 AI 搜索方案,专注于超级智能体所代表的新方向。

     

    在基准测试中击败 Manus

     

    那么,与其他 AI Agent 比较,GenSpark 表现如何?

     

    通过广泛的模型集成和直接使用 API 来与 Manus AI 和 OpenAI Operator 等竞争对手区分开来。虽然 Manus AI 主要依赖较少的模型并提供较少的集成工具,但 GenSpark 更广泛的工具集和现实世界的交互功能(包括语音呼叫)提供了额外的实际优势。与仅限于基于浏览器的操作的 OpenAI Operator 相比,GenSpark 以 API 为中心的方法可以实现更快、更结构化的数据检索和更丰富的任务执行功能。

     


    业内专家指出,Super Agent 的多智能体设计代表了 AI Agent 技术的一个重要趋势。相较于传统的单模型系统,这种混合架构不仅提升了任务处理的灵活性,还显著降低了错误率和“幻读”(产生不准确内容)的概率。例如,在 GAIA 基准测试中,Super Agent 的表现优于部分 OpenAI 模型和 Manus,证明了其在自动化任务执行中的高可靠性。这一优势在对准确性和可控性要求较高的场景中尤为突出。

     

    不过,Super Agent 的推出也带来了一些悬而未决的问题。有评论指出,其多代理系统的具体实现细节尚未完全披露,在极其复杂的任务或资源受限的环境中的表现仍需进一步验证。此外,随着人工智能代理技术的普及,确保数据隐私和系统透明性也将是 Genspark 未来需要解决的挑战。

     

    Genspark Super Agent 允许用户在无需个人凭证的情况下开始测试。

     

    参考链接:

    https://www.marktechpost.com/2025/04/05/meet-genspark-super-agent-the-all-in-one-ai-agent-that-autonomously-think-plan-act-and-use-tools-to-handle-all-your-everyday-tasks/

    https://venturebeat.com/ai/gensparks-super-agent-ups-the-ante-in-the-general-ai-agent-race/

    https://mainfunc.ai/blog/genspark_kill_aisearch

    https://mainfunc.ai/blog/genspark_moa_powered_search

    https://www.producthunt.com/posts/genspark-super-agent

    2025-04-07 17:417211
    用户头像
    李冬梅 加V:busulishang4668

    发布了 1122 篇内容, 共 739.9 次阅读, 收获喜欢 1268 次。

    关注

    评论

    发布
    暂无评论

    技术三板斧:关于技术规划、管理、架构的思考

    阿里技术

    技术管理 技术人生 内容合集

    让“美”势不可挡,DataPipeline助力全球知名化妆品企业数字化营销再提速

    DataPipeline数见科技

    大数据 中间件 数据融合 数据迁移 数据管理

    恒源云(GPUSHARE)_文本数据扩增时,哪些单词 (不) 应该被选择?

    恒源云

    深度学习 语音识别 语义

    三年磨一剑,高德体验优化总结

    阿里巴巴终端技术

    ios android 性能优化 移动开发 客户端

    联想企业科技集团与京东耀弘签订战略合作协议 实现合作发展新跨越

    科技大数据

    Flutter 应用程序中使用 GridTile 小部件

    坚果

    28天写作 12月日更

    国家质量基础设施(NQI)一站式服务平台,NQI云服务平台建设

    a13823115807

    质量基础设施一站式服务 一站式服务平台开发

    2021年SASE融合战略路线图(一)

    devpoint

    SD-WAN sase 12月日更

    热门招聘丨 XTransfer史上最全产品技术岗位公开招聘

    XTransfer技术

    产品 技术 招聘 XTransfer

    架构实战 - 模块七

    唐敏

    架构实战营

    阿里技术 技术人成长| 内容合集

    阿里技术

    技术管理 技术人生 技术专题合集

    计算机网络体系结构

    淡泊明志、宁静致远

    TCP 网络结构

    如何写好代码?

    阿里技术

    技术管理 技术人生 内容合集

    【12月日更】浅谈Golang两种线程安全的map

    小梁编程汇

    golang 缓存 高性能 并发 多线程安全

    王者荣耀商城异地多活架构设计

    张靖

    #架构实战营

    百度翻译十周年:核心技术持续领先,日翻译量超千亿字符

    科技热闻

    高质量的缺陷分析:让自己少写 bug

    阿里技术

    技术管理 技术人生 内容合集

    一种播放远程TS格式媒体文件的新方案

    Changing Lin

    12月日更

    PMI 的野望

    Franklin 许峰

    DevOps 敏捷 Lean 规范敏捷 PMI

    EMQ X 企业版 v4.4.0 发布:新增三项集成支持、增强异常诊断能力

    EMQ映云科技

    云原生 物联网 IoT mqtt 规则引擎

    区块链数字版权,区块链数字藏品交易系统开发

    a13823115807

    #区块链# 区块链技术应用 区块链数字藏品

    百度API接口智能化测试探索与实践

    百度开发者中心

    自动化测试 API测试 智能化测试

    Python爬虫实战,pymysql模块,Python实现抓取音乐评论

    Java全栈架构师

    Python MySQL 数据库 程序员 面试

    揭开神秘面纱,如何组织一次分布式压测

    博睿数据

    第七模块总结

    张靖

    #架构实战营

    技术人如何自我成长?

    阿里技术

    技术管理 技术人生 内容合集

    飞桨中国行——生产制造专场

    百度大脑

    人工智能

    多行内容超出...显示的终极解决方案

    CRMEB

    如何优雅的关闭 Java 线程池

    淡泊明志、宁静致远

    线程池

    安装TortoiseGit教程 手把手教学

    Z.

    git 工具 安装 Tortoisegit

    Flutter 高性能、多功能的全场景滚动容器原理与实践

    阿里巴巴终端技术

    flutter 移动开发 客户端

    击败Manus?前百度AI高管创业1年多,放弃500万用户搜索产品,研发9个月转向“最强Agent”_生成式 AI_李冬梅_InfoQ精选文章