写点什么

别被 MCP 的包装骗了!重构系统、向智能体转型,CEO 亲述:关键时刻还是 RPA 兜底?

  • 2025-06-09
    北京
  • 本文字数:10572 字

    阅读完需:约 35 分钟

大小:5.20M时长:30:18
别被MCP的包装骗了!重构系统、向智能体转型,CEO亲述:关键时刻还是RPA兜底?

我们持续关注智能体的前沿技术、产品发展、落地实践等,期待通过系列报道,呈现前沿的实践样本与真实故事。如果您的团队正在做一些有意思的想法和探索,或者已有不错的成果,都欢迎来找我们聊聊!V:T_demo(请注明来意),让更多人看到你们在智能体时代的独特尝试~


当下,智能体的热度已经无需再多赘述。这场智能体竞赛中,除了那些从新开始的“AI 原生”智能体应用外,还有一些应用在逐渐将智能体纳入产品构建中,实在智能便是其中之一。

 

实在智能成立于 2018 年 8 月,以 RPA 为起点,融合 AI 技术,提供超自动化解决方案。随着技术发展,实在智能对其“数字员工”产品不断升级:对 RPA 的底层能力做了大量的改造和增强,结合计算机视觉对底层架构进行了重构,并推出了国内首款通用智能体产品。当前,实在智能已为超 4000 家企业客户部署了“数字员工”。

 

实在智能成立于 2018 年 7 月,以 RPA 为起点,融合 AI 技术,致力于通过人工智能技术助力人机协同,提供超自动化解决方案。随着技术发展,实在智能对其“数字员工”产品不断升级:对 RPA 的底层能力做了大量的改造和增强,结合计算机视觉对底层架构进行了重构,并推出了国内首款通用智能体产品。当前,实在智能已为超 4000 家企业客户部署了“数字员工”。

 

对于业内讨论的一些问题,实在智能通过自身实践也给出了自己的答案。比如自研模型或垂直模型对于具体业务场景中的 Agent 研发是必要的,但大模型自身并不能作为一种产品。又如,在支持 MCP 后,实在智能也发现不能过度依赖 MCP 服务,MCP 只是将一些问题进行了封装,但问题本质并没有得到解决。

 

近日,InfoQ 对实在智能创始人兼 CEO 孙林君进行了一次采访,期间他详细回答了智能体技术路径选择、产品如何转型、智能体产品收费逻辑等问题。

 

智能体的实现路径

 

InfoQ:2018 年那会儿,为什么会想做“数字员工”这件事?

 

孙林君:我们想成为数字员工领域的开拓者,这一征程始于 RPA 技术。当时,我们察觉到 RPA 的商业模式极具潜力,其原理是在客户电脑中安装一款软件,该软件能够操控其他各类软件。RPA 在电脑中可视为类似机械臂的存在,用于操作其他软件。

 

随后,我们很快发现,提供给软件机器人的自动化脚本存在升级空间。我们可以处理更加复杂和高级的任务,集成 OCR(光学字符识别)技术与自然语言处理技术,使其具备识别图片、文字以及处理合同的能力,从而实现一定程度的智能化。

 

尽管机器人的形态未发生改变,但其任务的复杂度和高级程度却在不断提升。由此,我们联想到可以进一步升级机器人的任务,使其承担更具智能化的工作,比如与大模型相结合,进而使其能够像人类一样开展工作。2019 年,我们洞察到这一发展方向后,便提出了“数字员工”这一概念。我们从 RPA 入手,但目标是将机器人当作人类来培养,期望有一天机器人能够像人类一样自主思考、自主工作。

 

2023 年,随着 ChatGPT 的爆火,我们看到了新的里程碑,原本设想的愿景大幅提前。大模型具备思考能力,结合视觉技术与 RPA 后,真正能够以人类的形态开展工作。从人工智能的角度来看,这一阶段的成果被称为“智能体”,能够代我们完成某些事务。

 

InfoQ:你们要取代的是哪部分工作?

 

孙林君: “数字员工”是一个业务概念。从 2019 年至今,数字员工的发展历程呈现出清晰的阶段性特征:初级阶段可视为 RPA,主要承担简单、重复、规则化的低价值工作;而高级阶段则是智能体,能够独立思考、自主规划任务并自主完成任务。

 

InfoQ: 实在智能的“数字员工”与 Devin 等类别的 AI 员工有什么不同?

 

孙林君:不完全是一回事,大家技术路线选择上存在差异。智能体目前存在着不同的技术路线选择,其中一种完全依赖大模型的能力,认为仅凭大模型自身就能完成操作系统内部软件的自动识别与操作。

 

然而,从现实情况来看,让一个端到端的大模型独立完成复杂任务仍面临诸多挑战。众所周知,大模型存在幻觉问题,只是幻觉出现的概率有高有低。在这种情况下,若完全依靠大模型自主完成任务,效率可能会相对较低,甚至可能陷入无限循环的困境,且一旦出错,我们难以进行有效干预。这些缺点在实际应用中较为明显,尤其是在用户生产环境中,用户的接受度会受到一定影响,尤其对于面向企业的产品而言更是如此。

 

另一种技术路线则是将大模型的能力与外部工具相结合。例如,我们采用大模型结合 RPA 和计算机视觉等多模态技术的方式。此外,还有像 Manus 这样采用大模型结合特定工具的方式,还有大模型结合 API 的方式。其中,采用大模型结合外部工具的方式,有以下几点需要关注:

 

首先,由于大模型存在幻觉问题,我们有必要增强其任务分解、逻辑推理和代码生成等方面的能力。许多数据若脱离了用户的具体场景或用户所使用的软件层面,仅靠大模型的联想能力,难以实现完美的任务分解。因此,在这种情况下,需要利用特定的数据来训练大模型,即通过垂直领域的大模型来增强基础大模型的能力,从而使智能体减少幻觉,更加实用。

 

其次,由大模型驱动的工具集,无论是 Manus 的 29 种工具,还是 RPA,或是接口,都必须具备对操作系统内部操作的完备性。实际上,RPA 的构建理念是将操作系统底层的几乎所有操作文字化,再重新拼装成能力。从 RPA 技术的出现到逐步成熟,本质上都是围绕这一目标展开的。例如,运算本质上由 0 到 9 的数字和加减乘除的运算符构成,RPA 所做的也是将操作系统内的基础操作提炼出来,并将其封装成基础组件,以应对复杂的任务。如果采用其他工具来驱动工具集,同样需要检验其对操作系统内各项操作的完备性。

 

此外,效率问题也不容忽视。如果采用大模型结合接口的方式,接口的开发效率必须足够高。因为大模型大约每 3-4 个月就会更新一次人类的知识体系,而有些企业花费数年时间都未能完成接口的完全对接,由此可见接口对接效率之低。很多时候,我们无法预先知晓用户会以何种方式使用接口,往往是在实际使用中才发现其不匹配。这种单模型结合接口方式的开发效率相对较低。不同的智能体参与者对行业的理解存在差异,因此所采用的技术方案也各不相同。

 

如何实现从 RPA 到智能体的产品转型

 

InfoQ:从最初的 RPA 产品开始到 2023 年推出了第三代 “大模型 + RPA” 的 Agent 产品,实在智能对产品的底层架构进行了重构。为了转型,实在智能在产品架构上做了哪些调整?

 

孙林君:在 RPA 领域,我们经历了诸多重构与调整。很多人对 RPA 存在误解,认为只要能编写脚本、使用代码编辑器,就等同于掌握了 RPA。然而,在实际为客户服务的过程中,我们发现诸多限制。例如,面对客户所使用的各种未曾见过的软件,许多 RPA 公司不得不派遣工程师亲赴客户现场,解决这些软件的适配问题。这无疑带来了巨大的成本。当客户数量增多时,工程师甚至难以兼顾 RPA 产品的开发工作。

 

我们意识到,这种状况限制了 RPA 行业的发展。于是,我们思考整个 RPA 行业需要一种通用能力。过去,RPA 的不通用性导致一些公司只能在特定行业深耕,比如专注于电商、财务或物流供应链等领域,因为这些行业内的软件种类相对有限。但一旦跨出这些行业,实现通用就变得异常困难。

 

为了解决这一问题,我们推出了“融合拾取”技术。我们将计算机视觉与底层识别技术整合在一起,让用户在视觉方面无需感知差异,每个软件被打开时,都自动具备视觉识别能力和底层识别能力。这一过程中,我们攻克了诸多技术难点,拥有 15 项专利,解决了速度、精度、跨分辨率等诸多极具挑战性的基础问题,并最终得到了良好的验证。

 

我们在日本拥有一家子公司,并已积累了众多日本客户。在整个过程中,我们的工程师从未前往日本,但我们的软件依然能够很好地适配日本的各种未曾见过的软件,并在其上构建各种自动化流程。这充分验证了通用能力的有效性,也证明了 RPA 行业需要不断被改造,这是我们对 RPA 进行改造的第一个方面。

 

第二个改造方面源于 RPA 的应用性问题。

 

许多厂商声称 RPA 易于使用,但实际上当业务人员真正接触后,他们发现很难掌握。原因在于,他们需要学习各种教程,甚至要先把自己变成程序员,才能使用该软件。这显然违背了“第一性原理”,我们不应非得把业务人员变成程序员,才能让他们使用这种产品。因此,我们借鉴了类似于 Excel 中宏录制的方法,在操作系统内使我们的操作能够被记录下来。也就是说,通过算法引导用户识别操作对象,并知晓需要使用哪些组件,从而自动生成代码。

 

我们推出了全新的 AI-RPA 模式,对 RPA 进行改造并引入了智能化特点,并对底层通信架构进行了大量重构。这样一来,任何一款软件在我们这里都能被默认识别,且效率极高。这并非简单地将 RPA 与大模型结合,而是要解决底层的两个非常困难的问题。解决了这些问题后,我们又接入了自己的垂直大模型。如此一来,我们的技术方案能够很好地适配当前智能体的工作需求。



InfoQ:构建一个智能体原型很容易,但要打造能支撑关键业务应用的可靠系统很难。你们如何解决这个难题?

 

孙林君:许多人在理解智能体这一概念时,往往停留在较为浅显的层面。搭建一个初步的框架或许相对容易,但要构建一个真正可靠、稳定的系统,却并非易事。一个可靠的系统,首先必须具备可控性,其次要确保稳定性,即无论运行多少次,都能以相同的方式得出一致的结果。然而,如果仅仅依赖端到端的解决方案,情况就大不相同了,即使是相同的实验,也可能因采用不同的方法而得出多个截然不同的结果,甚至可能出现八次成功、两次失败的情况。这显然无法满足可靠性和稳定性的要求。

 

前面我们还提到了效率问题。如果一个系统无法同时满足可控、稳定和高效这三个关键特点,那么对于众多企业客户而言,这样的智能体几乎是不可用的。倘若在技术路线的选择上出现偏差,那么构建可靠系统的难度无疑将大幅增加。

 

我们引入大模型时,其生成结果本身就存在不确定性,而且大模型还可能产生幻觉,这对系统的稳定性构成了潜在威胁。因此,我们不得不对大模型进行一系列的优化和调整。具体来说,我们为大模型配备外挂知识库,并采用垂直领域的大模型,利用特定的数据来增强其性能。同时,我们还需要精心编写提示词,以对大模型的输出结果进行有效控制。通过综合运用多种手段,我们可以在最大程度上降低幻觉现象的发生概率,从而使大模型的输出结果更加可控。

 

如今,智能体的概念已经得到了广泛的认可。智能体的大方向无疑是让机器以人类的形态去替代人类完成工作,这已经成为业界的共识。当然,在实现这一目标的过程中,技术路线的选择必然会呈现出多样化的特点。我们可以看到,目前存在多种不同的技术路线,包括端到端的解决方案、大模型结合工具、大模型结合 API,以及 MCP、A2A 等能力整合方式。而我们所采用的技术路线则是将大模型与多模态技术以及 RPA 相结合。这些不同的技术路线,实际上都是基于对行业理解和需求的深入分析而做出的选择。

 

InfoQ:如何理解智能屏幕语义理解与多模态技术关系?构建 Agent 产品,自研大模型是必要的吗?

 

孙林君:智能屏幕语义理解可以被视为多模态技术的一个分支。它主要关注软件界面元素的识别,例如操作类任务的范围。而多模态技术的范围更为广泛,包括但不限于给一张图讲故事、评论语义理解等。目前,我们已经在多模态领域进行了相关工作,例如网页数据提取涉及排序、数据过滤以及基于数据的问答等问题,都可以通过多模态技术获得结果。

 

InfoQ:之前你提到 Agent 研发中最难的“让大模型对任务理解到位”,具体怎么解决的?

 

孙林君:针对这一研发难点,我们的解决方案是训练垂直的大模型。我们拥有近 4000 家客户和数十万个用户付费的真实流程,这些丰富的行业数据构成了我们训练垂直大模型的基础。对于一款完全未见过的软件,通用大模型可能只能靠想象去生成任务拆解步骤,出错概率较高。而我们的垂直大模型则能够结合具体行业知识,更准确地完成任务。

 

从实际效果来看,我们的垂直大模型在一些开放数据集上已经达到了较高的水平,这验证了自研模型或垂直模型在 Agent 产品研发中的必要性和有效性

 

InfoQ:你们在智能体产品中加入了规划、推理能力吗?

 

孙林君:在即将推出的新版本中,我们增加了深度思考的功能。这不仅是基础模型必须具备的能力,也是人工智能发展的一个重要标志,更是智能体基础能力的重要组成部分。

 

我们的大模型是在一些开源模型的基础上进行微调而来的。我们会将深度思考的特性与我们的数据相结合,构建长思维链的数据,并引入反思机制,以此来训练我们自己的垂直大模型。我们之前使用 DeepSeek,而现在也开始使用千问。

 

InfoQ:是否需要打通大企业里的不同软件?具体有什么技术挑战吗?

 

孙林君:在处理不同软件时,我们的策略是优先使用接口,因为接口能够提供高效且稳定的交互方式。然而,并非所有软件都提供接口。在这种情况下,如果软件支持 MCP,我们会选择使用 MCP 来进行操作。但当软件既没有接口也不支持 MCP 时,我们会采用 RPA 技术。RPA 的优势在于它不需要依赖接口,也能够完成特定的操作,并且在许多情况下能够满足稳定性的要求。不过,RPA 必须具备我之前提到的多种能力,如任务分解、逻辑推理和数据处理等,才能确保其在实际应用中的有效性和可靠性。

 

InfoQ:MCP 最近火起来了。

 

孙林君:人工智能行业目前存在一个问题,那就是很多人只是空谈理论,而真正能够将理论转化为实际成果的人却寥寥无几。像一些人过于夸大新技术的作用,认为有了 MCP 就能解决所有问题,这种观点是不切实际的。实际上,MCP 只是将一些问题进行了封装,问题的本质并没有得到解决。例如,如果没有相应的接口或能力,仍然需要进行开发工作,然后才能将这些能力对接到 MCP 上,供他人调用。而且,如果过度依赖 MCP 服务,尤其是对于特别简单的任务,可能会导致效率低下。而对于特别复杂的任务,MCP 后面的部分可能会变成一个黑盒,这在调试过程中会带来很大的困难。

 

我们应该正确看待新技术,承认它的价值和意义,但同时不能过分夸大它的作用。我们应该根据实际情况,灵活选择最适合的技术方案,而不是盲目追求某一种技术。只有这样,我们才能在人工智能领域取得真正的进步和突破。

 

“大模型不是一个产品”

 

InfoQ:通用 Agent 和垂类 Agent 的技术实现有什么差异?

 

孙林君:按照我的理解,这两类智能体在技术实现上存在差异。对于通用智能体来说,我们需要解决 RPA 底层的通用性问题,而不是针对某个特定行业。例如,如果我专注于垂直的财务智能体,那我可能只需要关注财务领域主流软件的控制即可。通用智能体相对更难实现,但市场空间更大。我们需要克服的问题包括识别的通用性和使用的易用性,这需要很多技术创新来解决。对于垂直类智能体来说,它们需要更深入的行业知识以及其复杂的业务逻辑。

 

InfoQ:对于 Agent 产品,技术能力和工程、产品设计能力,哪个更重要一些?

 

孙林君:产品和工程只是表面现象,真正的核心在于技术能力。正是技术能力的不断提升,才能将一个玩具转变为真正有用的工具。技术能力的持续改进,能够使工具的幻觉率降低到某个阈值以下,从而让用户觉得它真正可用。例如,对于垂直领域的基模能力,需要进行增强,使其在特定领域内具备出色的任务完成能力。

 

此外,工具的使用完备性也至关重要。我们可以通过各种测试,对同一任务进行细微调整,如采集数据时按页采集、按行采集或全部采集,以及采集哪些列等,这些细粒度的要求能够在测试集中明显体现不同智能体的能力差异。在这方面,我们的技术方案具有显著优势,我们并不是简单地向用户展示几个流程,而是注重技术的深度和实用性。

 

对于人工智能的落地而言,不应仅仅关注成功的案例,而更应关注那些无法完成的任务,因为这些失败的任务才能真正体现技术的能力边界、决定技术是否能够真正落地。这归根结底还是技术能力的体现。至于产品设计和工程方面,这些是比较容易达成共识的,因为很多产品在外观上可能看起来相似,但底层的技术实现却大相径庭。

 

InfoQ:智能体产品有没有被过度炒作?

 

孙林君:技术行业应该保持本色,避免混淆视听或夸大宣传,不应将一些浅薄的认识误导大众。真正从事技术工作的人应该沉下心来,深入思考行业发展方向和用户真正的需求,这样才能推动技术的进步。过度喧嚣的氛围并不好,对行业发展也未必有利,因为它可能会引发质疑和负面评价。我们应该脚踏实地地前进,为用户提供真实且有价值的产品,这样才能实现长久的发展。

 

比如,Manus 火了之后,很多人来找我们。他们需要的不是端到端的解决方案,而是满足可控、稳定和高效特点的智能体。不久之后,大量用户被吸引到我们的社区,下载和使用我们的产品,并给出了很好的评价。原因是他们发现原本搭建智能体时,由于没有接口,需要反复调试 RPA,效率极低。而在我们的平台上,一个工具就能搞定他们原来的工作流,效率提升了 N 倍。这显然对他们更有价值。虽然也可以使用端到端的大模型进行尝试,但很少有人会将其应用到真正的生产环境中。

 

在我们的设计理念中,大模型生成代码后,用户可以编辑生成的代码,运行代码时效率很高。这些因素促使我们宣称自己是产品级别的智能体。

 

尽管大家对智能体的认识程度有所不同,但有一个共识是智能体的落地已成为当务之急。前段时间我参加了浙江经济百人会,与会的十几家企业都在讨论智能体,覆盖率达到了 100%。这表明大家已经意识到,在以大模型为核心的基础上,人工智能的落地需要以智能体为载体,解决人工智能落地的最后一公里问题。

 

从这个角度看,智能体的落地是当前迫切的需求。如果犹豫不决,可能会错失参与的机会。因此,我们既要关注科幻小说般的未来愿景,也要脚踏实地地投入生产。立足当下,放眼长远,应该立即行动起来,但行动方式必须是可靠的。

 

InfoQ:在你看来,大模型是否取代部分智能体能力?

 

孙林君:早在 2023 年,我们就已经意识到大模型不是一个产品,但很多人却声称大模型可以解决一切问题。现在看来,许多企业也纷纷表示大模型不是一个产品,因为大模型本身存在幻觉问题。

 

之前展示的大多是成功案例,而非失败案例。如果将大模型作为产品销售,用户关注的是它是否能达到验收标准。从验收标准来看,许多大模型在某些领域无法达标。因此,将大模型作为产品实际上是一个伪命题。随后,RAG 检索增强等辅助性技术开始涌现。片面强调大模型包打天下、一招制敌等观点,都是违背客观规律和现实的。无论是技术、产品、设计还是工程,它们都在不断演进,这是正常的,但最根本的核心仍然是底层技术。

 

从社区转化客户,价格不由竞争决定

 

InfoQ:Agent 产品的商业机会具体体现在哪里?

 

孙林君:Agent 商业机会潜力是巨大的,它并非仅仅是帮助我们完成某一项任务,而是能够引发整个社会的深刻变革。设想在未来的工作场景中,每个人都能拥有众多智能助理,这些智能助理将承担我们工作中需要思考的部分,以及原本需要付出的体力劳动。

 

对于企业而言,未来大部分工作可能会由智能体来完成,企业规模可能会缩小到一人公司或几人公司,但同时会有大量的数字员工和智能体在背后支持工作。这将导致生产关系因人工智能的加入而发生改变,组织形式也将随之变化,转变为围绕 AI 展开工作。这是一场跨越时代的变革,不应被狭隘地理解为仅解决某一具体问题。

 

InfoQ:那在成本优化、实现路径上是怎样的?

 

孙林君:成本降低方面,主要体现在减少了人力需求,此外减少加班以及避免加工资等,也可以视为降本的措施。实际上,在我们追求增效的过程中,已经在不知不觉中实现了降本。

 

然而,现在我们很多时候需要计算的经济效益,已经不仅仅局限于降本和增效了。我们更应该看到的是它所带来的市场地位变化,以及由此带来的价值提升。举个例子,博尔特在百米赛跑中领先第二名仅仅零点零几秒,但他的身价可能是第二名到第八名的人加起来的总和。同样地,如果将这种情况放在企业行业地位上,情况也是一样的。排名第一的企业与排名第二、第三、第四的企业,在竞争中所处的优势是完全不同的。

 

InfoQ:你们的产品定价模式是什么样的?

 

孙林君:从大的框架上讲,我们的收费模式是按照人头数来计算的。具体来说,我们会根据为客户输出的机器人数量来收取年租费用。这种模式不仅使得费用相对较低,而且能够持续为客户提供升级服务。在这个过程中,我们实际上构建了一种可延续性的收入模式。

 

打价格战往往是企业陷入同质化竞争的一种表现。价格战本身确实不利于行业的健康发展。如果产品具有足够的差异化,那么就可以避免陷入价格战。

 

InfoQ:市面上,哪些算是你们的竞争对手?

 

孙林君:我不认为我们有很多竞争对手,因为许多表面上看起来的竞争对手,在底层能力上并不具备足够的竞争力。由于实在智能这几年的技术演进,我们已经解决了许多核心痛点。如果这些痛点没有得到解决,那么我并不认为他们是我们的竞争对手。

 

在商业化方面,价格和价值必须相匹配。对于用户来说,他们也有自己的承受能力。因此,价格不仅由竞争决定,还与客户的预算和他们愿意付出的成本密切相关。

 

 InfoQ:是否会做一些定制化服务?

 

孙林君:我们通常不直接进行定制化服务,但我们有许多合作伙伴可以帮助客户完成相应的定制化工作。实际上,由于我们产品的成熟度和易用性,许多客户会选择自行定制,因为他们更了解自己的业务需求。这样可以减少沟通和交流的成本,提高定制的效率。我们为客户提供的平台和产品,使他们能够基于我们的技术构建自己的智能体。

 

我们有免费的社区版,其实是面向个人的。其中,一些个人用户使用比较多,之后会建议自己的公司来购买这个产品,我们现在的大量客户就是这么转化来的。

 

InfoQ:当前 Agent 产品的 B 端主流收费模式是怎样的?哪种模式增长最快?

 

孙林君:目前,整个行业仍在探索阶段。客户的付费习惯实际上也是可以被引导的。在 SaaS 模式出现之前,大家通常采用系统开发的一次性付费方式,但这种模式并不利于行业的长期发展。SaaS 模式出现后,由于其成本低廉且服务具有较好的延续性,越来越多的客户开始选择这种模式。这对行业的发展是有益的。然而,收费方式需要不断培养用户的习惯,找到一种在商业模式中能够让各方都能生存和发展的方式。否则,如果这种模式只对一方有利,缺乏平衡,最终可能导致行业的消亡。对我们来说,目前我们更倾向于采用年租模式。

 

当前,C 端和 B 端存在明显区别。目前,C 端的收费模式主要是会员制,而 B 端的收费模式则多为授权费用和私有化部署费用。C 端产品通常客单价较低,且要求易于上手,使用成本低。相比之下,B 端产品客单价较高,对上手成本的要求没有 C 端那么高,但对产品的可靠性、稳定性和高效性有很高的要求。

 

InfoQ: 客户付费意愿的核心驱动因素是什么?

 

孙林君:最核心的驱动因素是人工智能让客户能够实现以前无法完成的事情。过去,许多经验和知识都储存在人们的脑海中,人们也没有能力去构建复杂的系统。但现在,智能体提供了一种高效的方式,帮助客户将自己的想法实现出来。客户无需再构建新的系统,而是可以利用大模型来代替自己进行思考。他们只需要向大模型传达自己的思路,大模型就能帮助他们完成相应的操作。我们只需将工作流沉淀下来,并不断优化,使其准确率越来越符合我们的要求。这样一来,它就像一个人一样,变成了我们的代理人。

 

InfoQ:实在智能在技术、渠道与生态层面采取了哪些“护城河”策略?

 

孙林君:我们的核心竞争力,即所谓的“护城河”,主要体现在对行业的深入思考以及对行业局限性的突破上。在技术积累方面,我们凭借持续的技术进步推动产品的不断演进,进而驱动销售的拓展。因此,归根结底,我们真正的护城河还是在于对行业的深刻理解和持续的创新能力。

 

InfoQ:Altman 有在采访中提到,2025 年将是智能体完成大规模应用的一年。你认同吗?

 

孙林君:他的观点与我们基本一致。今年年初,我们就提出了 2025 年将是智能体的商业化元年。在 2024 年,我们提出了智能体元年的概念。2024 年被称为智能体元年,是因为在人工智能行业,大家开始看到智能体的潜力,并探索其在企业端的应用,但当时企业端可能还没有大规模意识到这个问题。到了 2025 年,整个行业都在关注智能体,并开始将其落地应用。因此,今年可以说是智能体商业化元年的开端,这与 2025 年将是智能体完成大规模应用的说法非常相似。

 

InfoQ:当前智能体应用发展还面临哪些挑战?

 

孙林君:目前,整个行业面临的挑战是,在用户需求如此迫切的情况下,如何实现快速落地。很多时候,我们应该更关注实用性技术,而不是那些仍停留在实验室里的产品。如何能够快速为客户创造出他们想要的价值,这才是最大的挑战,而所有的工作都应该围绕这一点展开。不同的技术路线可以帮助客户解决这个问题,有的人可能会选择大模型,有的人可能会选择大模型加 API,有的人可能会选择大模型加工具,还有的人可能会选择大模型加 RPA。最终,这取决于用户的选择。

 

InfoQ:你认为,Agent 产品形态最终会是什么样子的?

 

孙林君:我认为,最终的产品形态应当是一个助手,可能仅需一个对话框或对话界面就已足够。至于交互方式,更多地应是功能点的呈现,其本质是对话。我们与助手的交互本质上就是对话,因此,一个界面就足以满足需求。甚至在未来,操作系统或许都不再需要界面,我们只需通过语音与内置的助手进行交互即可。

 

InfoQ:随着“数字员工”越来越多,大众接受度越来越高,你对人类员工有哪些建议?

 

孙林君:对于人类员工而言,当务之急是掌握人工智能的能力。因为人工智能本质上仍是一种工具,目前尚未达到完全智能化的时代,人机协同才是当下最可靠、最实际的选择。最先拥抱人工智能的人将率先享受到红利,掌握人工智能的人将成为社会最为需要的人才。因此,我的建议是大家以开放的心态拥抱人工智能时代,深度参与并使用人工智能。

 

InfoQ:企业员工对 AI 的接受度怎样?

 

孙林君:我观察到,企业员工对人工智能的接受度正在逐渐提高。这主要是因为人工智能已经成为一种共识性工具,从最初的焦虑和敬畏,到现在大家开始将其视为一种实用的工具,并积极地使用它。甚至有些人已经深入地将其融入到工作中,实现了较高的应用水平。

 

以程序员为例,曾经有人认为他们是最早可能被人工智能替代的职业之一。然而,随着时间的推移,大家逐渐意识到,这种替代并非如最初想象的那样简单。许多工作,尤其是编程工作,并不是简单地通过一句话就能完成的,它们的复杂性在于构思和创造的过程。实际上,如果思路已经明确,编写代码只是最后一步,程序员们在此之前需要进行大量的思考和设计工作。因此,要完全替代程序员的工作,并非易事。

 

目前,大家对人工智能的态度已经发生了积极的转变。人们不再像以前那样焦虑,而是将其视为一个强大的助手和助理。

2025-06-09 14:094194

评论

发布
暂无评论

OpenAtom OpenHarmony携千行百业创新成果亮相HDC.Together 2023

开放原子开源基金会

开源 OpenHarmony

Ethereum第一笔转账

FunTester

细数应用软件的缺陷分类

华为云开发者联盟

后端 开发 华为云 华为云开发者联盟 企业号 8 月 PK 榜

Koordinator 异构资源/任务调度实践

阿里巴巴云原生

阿里云 开源 云原生

TiDB Bot:用 Generative AI 构建企业专属的用户助手机器人

PingCAP

人工智能 数据库 AI TiDB

开源软件下游分发合规性讨论 ——“心寄源”法律沙龙(2023第四期 | 总第九期)成功召开

开放原子开源基金会

开源

在软件开发领域寻找更安全的众包平台?YesPMP助您无忧!

知者如C

TiDB v7.1.0 跨业务系统多租户解决方案

PingCAP

MySQL 数据库 多租户 TiDB

如何快速完成PostgreSQL数据迁移?|NineData

NineData

postgresql 数据迁移 不停机发布 NineData 结构迁移

Nginx 基本原理与最小配置

timerring

nginx

对标数据科学家,直面AI浪潮丨和鲸助力中国石油大学(华东)理学院,打造有学科特色的数据科学与大数据专业

ModelWhale

大数据 人才培养 数据科学 高等教育 数据科学家

优测云服务平台|【压力测试功能升级】轻松压测

优测云服务平台

性能测试 压力测试 并发测试 云性能测试

企业大数据分析系统可以给企业主带来哪些帮助?

夜雨微澜

程序员如何利用低代码平台提升软件开发效率?

互联网工科生

程序员 低代码 PaaS 开发工具 开发效率

在Next.js 13中使用React Server组件实现国际化

汽车之家客户端前端团队

React next.js app route RSC

天翼云加速落地紫金DPU实践应用,让算力供给更高效!

天翼云开发者社区

云计算

现代技术与语言翻译的未来

汽车之家客户端前端团队

AI 语言翻译 现代技术 AI翻译

软件测试/测试开发丨Python 多态 学习笔记

测试人

Python 软件测试 测试开发 多态

OSCS开源安全周报第 55 期:JeecgBoot 远程代码执行漏洞

墨菲安全

网络安全 安全 漏洞

全链路Trace全量存储-重造索引

乘云数字DataBuff

校源行丨开放原子开源基金会赴厦门大学访问交流

开放原子开源基金会

开源 校源行

深入思考 Next.js App Directory 架构

汽车之家客户端前端团队

架构 nextjs App Directory

17. 正则表达式

茶桁

Python 正则表达式

华为携手华中地区5大高校倡议共建湖北省高性能计算研究院建设

彭飞

GaussDB技术解读系列之应用无损透明(ALT)

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 企业号 8 月 PK 榜

WAVE SUMMIT2023六大分会场同步开启,飞桨+文心大模型加速区域产业智能化!

飞桨PaddlePaddle

人工智能 paddle 百度飞桨

HarmonyOS NEXT新能力,一站式高效开发HarmonyOS应用

HarmonyOS开发者

HarmonyOS

数仓中典型的几种不下推语句整改案例

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 企业号 8 月 PK 榜

别被MCP的包装骗了!重构系统、向智能体转型,CEO亲述:关键时刻还是RPA兜底?_AI&大模型_褚杏娟_InfoQ精选文章