写点什么

如何让 AI 智能体从“玩具”变“工具”?

  • 2025-12-12
    北京
  • 本文字数:3201 字

    阅读完需:约 11 分钟

如何让AI智能体从“玩具”变“工具”?

“我们的智能体跑起来了,但不知道提示词有没有被‘投毒’,也不知道模型到底用了哪些数据。”


这是国内某头部光伏企业在 AI 应用过程中面临的一大困惑,并且,这还不是个例。企业部署的智能体数量激增,但真正嵌入业务流程、产生可量化 ROI 的,仍是少数。


“有的客户已经上了四五十个智能体,但结果不是减轻工作,反而更乱了。” IBM 大中华区科技事业部自动化资深技术专家张诚在日前接受 InfoQ 等媒体采访时坦言。


问题出在哪?答案显然不是模型不够强,而是 IT 的“基本功”没打好。


过去一年,生成式 AI 从实验室走向业务一线,但热潮之下,现实却愈发清晰:大多数企业仍困在“小而美的玩具”阶段——智能客服、知识问答、文档摘要虽然见效快,却难以规模化产生业务价值。真正将 AI 融入研发、制造、供应链等核心流程的企业,仍是少数。


“可以肯定的是,当效率上去了,方向是对的,效益一定就会回来。”IBM 大中华区 CTO 翟峰表示,但要实现这一目标,企业必须先回答四个问题:数据是否高质量?系统能否打通?安全是否合规?基础设施是否支撑多云全球化?

“最后一公里”困局:老系统不会说 AI 的语言


张诚分享了一个案例:苏州一家全球扫地机器人公司,80%的客户在海外。当德国经销商提交了一张 ZUGFeRD 格式的电子发票(PDF 内嵌 XML)时,财务团队一度手足无措——这种 2025 年起强制实施的本地标准,他们从未接触过。


理想情况下,AI 应该自动解析发票、核对订单、触发付款。但现实是,订单在 SAP,物流信息在 WMS,税务规则散落在合规文档里。智能体想干活,却调动不了对应的系统。


“智能体怎么驱动二十年前就存在的 MES 或 ERP?”在张诚看来,这些老系统缺乏现代接口,难以被 AI 直接调用——就像只会说方言的老师傅,听不懂 AI 的“普通话”。


这正是当前 AI 落地的最大断层:企业花了大价钱训练模型,却卡在“最后一公里”——无法与现有系统交互。

对此,IBM 也在今年陆续推出了多个智能体,从集成的设计到集成的开发、上线、监管、运维都可以自动化地完成。举例来说,用户只需要输入:“当 SAP S/4HANA 产生新订单,自动同步到 WMS”,AI 就可以自动生成集成流程、测试用例甚至运维监控脚本。


其中,智能体的作用是把语义理解翻译出来,形成机器可以认识、可以运行的集成的流程。甚至,当运行流程出现问题时,智能体也可以快速反馈问题发生在哪里。“我们不是让专家干集成的事,而是通过 Chatbot 完成。”张诚说。


在这背后,是 IBM 三十年集成经验的沉淀。通过收购 webMethods,IBM 获得了覆盖制造、物流、金融等行业的预置连接器;而刚刚斥资110 亿美元收购的Confluent(Apache Kafka 创始公司),则提供了实时事件流通道——让数据在系统间“流动起来”,而非静态躺在数据库里。


“做不好集成,做不好数字化的协同、打通、信息孤岛的连通,不可能做好 AI。”翟峰直言。

从对话到行动:智能体如何真正“干活”?


集成能力的价值,在 IBM 内部早已验证。IBM 大中华区科技事业部数据与人工智能资深技术专家吴敏达告诉 InfoQ 记者,作为“零号客户”(client zero),IBM 已经在内部应用了 AskHR、AskIT、AskSales 等多种智能体,涉及 HR、采购、销售、客服四大领域。


这意味着,员工可通过自然语言与 HR 系统交互,获取政策指引或流程帮助;销售人员可借助智能体快速调取客户信息与历史记录;IT 支持人员则能通过对话自动创建工单、诊断问题。这些场景共同特点是:流程标准化程度高、系统接口相对清晰、业务价值易于衡量。


更进一步,智能体还能驱动跨系统工作流。吴敏达以财务场景为例:IBM 将财务智能体与 IBM Planning Analytics 软件进行了深度集成,借此,企业 CFO 和财务主管可以用对话的方式轻松实现预算分配,在这个过程中,财务智能体会调用很多工具,包括构建沙箱、构建财务分配、构建相关的注释等等。最后通过通讯智能体,把结果推送给下一个审批人员,通过分配智能体把相关的财务分配到业务单元。这整个过程无需人工介入表单填写或系统切换。


但这一切的前提,是智能体能访问高质量、可信赖的数据。 吴敏达指出,企业 99%的数据是非结构化的——散落在邮件、工单、日志、PDF 文档中,传统数据库无法有效利用。“如果数据不可信,模型再强也没用。”


为此,IBM 推出 watsonx.data,将其定位为“AI 时代的数据高速公路”。它不仅支持高性能查询,更重要的是内置数据目录、质量评估、血缘追踪和共享策略,形成完整的数据智能(Data Intelligence)体系。“我们强调的不是数据有没有,而是数据是否干净、是否可解释、是否合规。”吴敏达说。


这一能力通过 MCP Gateway(Model Context Protocol)与智能体打通。当用户提问时,智能体不仅能调用大模型,还能通过 MCP 直接访问多源上下文——例如,一个 IT 支持智能体在处理“网络中断”请求时,可同时调取设备日志、拓扑图和历史工单,综合判断根因。


而 MCP 只是 IBM 开放架构的一环。吴敏达介绍,watsonx 平台通过三大网关实现灵活集成:Model Gateway 允许调用任意托管的大模型;MCP Gateway 将企业内部工具封装为智能体可调用的服务;Agent Gateway 则支持接入第三方智能体,实现协同工作。


“你可以用我们的平台连接你的智能体,也可以嵌入到其他应用系统里。”他说。

治理不是限制,而是让智能体“可以上路”


更重要的是,IBM 强调智能体必须“可治理”。如果说系统集成解决的是 AI“能不能干活”,那么治理解决的就是“敢不敢让它干”。


当前企业部署的智能体越来越多,但风险也随之上升。某金融机构曾发现员工使用未经批准的 AI 工具处理敏感数据,暴露出“影子 AI”的管理盲区。


对此,IBM 提出一个关键原则:智能体必须“上牌照才能上路”,背后需要一套安全治理体系。


“安全治理系统相当于做车管所的工作,”吴敏达解释,“智能体需要做注册和批准,没有‘牌照’的车是不能上路的,这是能够让这个‘车’上路的准则。”


其次是安全系统,它主要解决以下问题,比如智能体在做任何的操作是不是安全合规,是不是做了一些违规的操作,是不是有人对智能体发动了攻击。“假如智能体能够重置密码,有人用智能体的时候做了一些黑客行为,让它不仅能重置密码,还能干其他乱七八糟违规的事情,比如重启操作系统,那就会造成很大的伤害。”吴敏达举例。


这一理念源于智能体与传统应用的根本差异:即使代码完全正确,其输出结果仍可能出错;反之,错误的代码有时也可能碰巧给出正确答案。因此,仅靠代码审查无法保证可靠性。只有建立可信的治理机制,企业才敢将智能体真正用于核心业务流程。


为应对这一挑战,IBM 与 Anthropic 合作验证了一套智能体生命周期治理框架。该框架的核心是在开发和运行两个阶段引入“内循环”机制:


在开发测试阶段,治理能力被直接嵌入智能体内部。“我们把监控、审计埋进去,通过结果来导向,去验证智能体的正确性。”吴敏达说。这意味着,评估不再只看代码是否合规,更要看实际行为是否符合业务预期。


在生产运行阶段,系统持续观测智能体的成本、延迟与安全边界,一旦检测到异常操作(如试图访问未授权数据),可立即干预。


据介绍,这套方法已在 IBM 内部实践。公司正在开发的新一代代码助手“Project Bob”,就整合了该治理框架,并将接入 Anthropic 的 Claude 大模型。“这将是 2026 年发布的 watsonx Code Assistant(WCA)的基础。”吴敏达透露。


值得注意的是,该框架已通过 Anthropic 的实际验证,相关白皮书明确标注“verified by Anthropic”。

真正的智能,藏在工程细节里


当行业还在争论“Agent 能否取代人类决策”时,IBM 的选择先让智能体能连上系统、拿到数据、安全运行、快速迭代。


在 IBM 看来,真正的智能,从来不是模型有多聪明,而是系统有多协同、数据有多可信、运行有多安全——这些基石,才是 AI 从“玩具”变成“工具”的唯一路径。


正如翟峰所言:“帮助企业看到价值,IBM 也看到价值。”在这场 AI 从实验走向生产的转型中,赢家或许不是最会讲故事的,而是最能把底座打牢的。


这也是 IBM 在 2025 年 TechXchange 大会上密集发布技术能力的核心逻辑:AI 的规模化落地,不靠单点模型,而靠底层基础设施的系统性重构。

2025-12-12 13:341

评论

发布
暂无评论
发现更多内容

执子之手,与子长安:探秘华为运动健康实验室

脑极体

区块链商品溯源解决方案,区块链全程追溯系统

13530558032

金瓯无缺江河一统|Win10系统基于Docker和Python3搭建并维护统一认证系统OpenLdap

刘悦的技术博客

Python TCP ldap openldap 统一管理

新思科技:2021年软件安全行业六大趋势预测

InfoQ_434670063458

Javascript | 模拟mvc实现点餐程序

LiOnTalKING

Java mvc 大前端 H5

便民服务多元化,智慧平安小区安防智能化建设

t13823115967

智慧城市

Native 与 JS 的双向通信

Minar Kotonoha

生产环境全链路压测建设历程 19:某快递 A 股上市公司的生产压测案例之下篇

数列科技杨德华

全链路压测 七日更

永续合约交易系统开发模式定制

MySQL用户与权限管理指南

Simon

MySQL 用户权限 七日更

week5 conclusion 分布式缓存架构+消息队列

J

极客大学架构师训练营

云原生应用开发框架Quarkus介绍

gaolk

云原生 Quarkus

规划算法

田维常

算法

第六周技术选型作业-CAP原理概述

Geek_michael

极客大学架构师训练营

函数进阶· 第3篇《常用内置函数filter()、map()、zip(),怎么用的呢?》

清菡软件测试

测试开发

Docker终端无法输入中文问题解决

Simon

Docker 七日更

iOS面试基础知识 (五)

iOSer

ios 面试 底层知识

数字之暖:鹅厂云原生的“新路”与“历承”

脑极体

什么样的企业才需要用到云服务器?

德胜网络-阳

微警务平台搭建,智慧警务系统开发解决方案

t13823115967

智慧警务系统开发 微警务

浅谈数据仓库质量管理规范

数据社

数据仓库 数据质量管理 七日更

甲方日常 73

句子

工作 随笔杂谈 日常

合约交易系统开发软件定制

简析5G时代的MART流处理

VoltDB

数据库 5G

盘点2020 | 所思、所遇、所学、所悟

三钻

程序员 大前端 盘点2020

支持百万级TPS,Kafka是怎么做到的?

爱笑的架构师

kafka Kafka知识点 零拷贝 Mmap 七日更

25道mybatis面试题,不要说你不会

田维常

mybatis

90%的程序员,都没用过多线程和锁,怎么成为架构师?

小傅哥

程序员 小傅哥 线程池 架构师 七日更

甲方日常 74

句子

工作 随笔杂谈 日常

花火交易所系统开发|花火交易所软件APP开发

系统开发

平安社区平台解决方案,智慧社区管理服务平台搭建

13530558032

如何让AI智能体从“玩具”变“工具”?_AI&大模型_高玉娴_InfoQ精选文章