【ArchSummit】如何通过AIOps推动可量化的业务价值增长和效率提升?>>> 了解详情
写点什么

企业级生成式 AI 应用,如何克服“幻觉”问题

  • 2023-09-12
    北京
  • 本文字数:4205 字

    阅读完需:约 14 分钟

企业级生成式AI应用,如何克服“幻觉”问题

“最近我被问到最多的一个问题,是IBM现在还在做 AI 吗?我想告诉大家的是,IBM 是一家混合云与 AI 公司,我们一直在做 AI,并且专门做企业级 AI。”IBM 大中华区首席技术官、研发中心总经理谢东在日前接受媒体采访时强调。


面对今年以来热度一路狂飙的生成式 AI,作为 AI 发展史上的重要参与者,IBM 并没有“闲着”。今年 5 月,IBM 发布了企业级 AI 和数据平台watsonx;自 7 月份以来,各个模块陆续上市;预计在今年年底到明年初,全部功能模块将会上市。其中,watsonx.data 的 premise 版本现在已经可以提供给中国客户。


如谢东强调,IBM 在其中锚定的依旧是“企业级”市场,延续长期以来的产品和生态定位。


然而,企业级 AI 应用与个人 AI 应用需求之间存在巨大差异,对技术本身的要求也不在一个量级。仅拿当下生成式 AI 应用最让人诟病的“AI 幻觉”问题来说,放在企业级生产环境,对此几乎是“零容忍”。


根据 IBM 商业价值研究院最近发布的面向全球超过 30 个国家和地区、超过 3000 名 CEO 的调研报告显示,61%的受访 CEO 表达了对生成式 AI 中所使用的数据来源的担忧。


“这一担忧侧面反映了企业 AI 应用之路面临着重重挑战:首先是技术挑战,尤其是数据的准备、应用和治理;第二是人才挑战,企业需要快速实现人员技能的转型和提升,来拥抱 AI 浪潮;第三是文化挑战,技能的转型往往伴随组织文化的更新,如何让二者互相成就、带来生产力的提高,这需要优秀的管理智慧。”IBM 大中华区董事长、总经理陈旭东指出。


据此,在 IBM 看来,在企业落地 AI 应用有三个关键点:聚焦自身的业务需求、使用企业自己的数据、量身定制生成式 AI 解决方案和模型。那么,IBM watsonx 究竟是什么?又如何满足企业级 AI 应用的如上需求?本文将为大家揭晓。

企业使用 AI,关注的是它“不能做什么”和“不允许做什么”


从“AI 幻觉”问题说起。


企业使用 AI,不只是关心它“能做什么”,更要关注的是它“不能做什么”,以及“不允许它做什么”。AI 的可信性、可解释性非常关键。因为企业决策与经营直接相关,企业使用 AI,要避免给业务带来技术风险,因此对智能分析的准确率要求高,容错率低。


在谢东看来,消灭“幻觉”归根结底要从最初的数据抓起。“想让 AI 的回答是正确的,至少要保证训练的数据是干净合规的,数据本身的完整性、信息量要合乎要求。”他告诉 InfoQ。


IBM watsonx 正在试图解决这些问题。根据官方释义,它提供一个包括 AI 开发平台 watsonx.ai、数据存储平台 watsonx.data 和 AI 治理平台 watsonx.governance。


其中,watsonx.data 针对企业中海量且复杂的数据,可以通过集中治理和本地自动化策略实施来确保数据的安全性和合规性;此外,watsonx.governance 还采用了软件自动化来帮助企业增强能力以降低风险、满足监管要求和应对 AI 伦理问题,使得企业能够自动化和整合多个工具、应用程序和平台,同时可以记录数据集、模型、相关元数据和管道的来源。


“另一方面,幻觉的产生是因为在大模型中缺失了相应的信息,克服的方法是使用企业自己的数据,把企业的数据输入给它,这样至少可以在特定业务领域减少幻觉的产生。”谢东补充说。


据了解,除了原始数据和专有数据,企业还可以带入自己的数据来丰富和改进他们的目标模型,所有数据都存储在 watsonx.data 中,其中包含有关每个文件或文档的详细元数据,以提供可追溯的治理。在数据的过滤和处理过程中,平台首先会识别数据的来源和 ID,然后对数据进行分类和过滤,对重复数据和不合规数据进行分析和清除。并且,对数据进行版本控制和标记。在过滤和预处理后,每个数据集都会获得一个数据名片。数据名片包含数据堆的名称和版本,以及其内容和已应用的过滤器等其他相关内容。


“换句话说,IBM 非常清楚自己用于训练模型所有的数据及其版本,也会告诉用户我们的模型是由哪些数据训练而来,并且后期还有很多调优的工作,以此增强用户对模型的信心。”谢东进一步解释。


事实上,从现阶段来看,几乎所有生成式模型都可能产生幻觉,都会给出一些不相关或不准确的答案。尤其典型的是,当提示模型去处理一个它没有接受过训练的题目或者用的训练集数据不足时,AI 幻觉很难不发生。


对此,据 IBM 透露,其内部还在研究一种降低 AI 幻觉风险的方法,名为“检索增强生成”,意在使模型能够在生成答案之前从知识库中检索相关数据。


IBM 大中华科技事业部数据人工智能、自动化中国华南与华东大区总经理许伟杰表示,IBM 正在通过模型融合进一步解决这一问题。“大语言模型所做的最重要的一件事是语义理解,目前我们正在通过语义识别,基于 IBM watsonx 能力做精准答案确定。也就是说,利用通用语言大模型的方式了解语义,帮助既有的模型实现既有答案的匹配,再回溯给语义大模型。”

基础模型带来拐点,数据无需再打标签


值得一提的是,IBM watsonx 平台聚焦于特定业务领域的基础模型。基础模型基于特定类型的 Transformer 神经网络架构而构建,为生成相关数据元素的序列(例如句子)而设。非常重要的一点在于,Transformer 架构能够帮助基础模型理解未标记数据,并将输入转换为输出,从而生成新的内容(ChatGPT 就是基于 Transformer 架构开发)。


“以前基于深度学习、机器学习的算法,通常要对海量数据打标签,再交给机器进行学习。并且,经过学习和部署,这个模型也只能做一个特定的事情,比如用于人脸识别或者下棋。”谢东解释道。

换言之,深度学习和机器学习的痛点在于,前期工作巨大,但最终输出的算法模型能应用的范围非常局限,“性价比”不高。


有别于此,基础模型允许在大量未标记的数据上进行训练,可以适应新的场景和用例。尽管基础模型也需要前期大量投资,但每次使用时,它都会摊销 AI 模型构建的初始工作,因为微调基于基础模型构建的其他模型的数据要求要比从头开始构建低得多。这既可以大幅提高投资回报率(ROI),又可以大大缩短上市时间。


因此,在 IBM 看来,基础模型把 AI 技术发展带到一个拐点——使企业级 AI 的加速和扩展成为可能


“我们认为,相较于通用大语言模型,企业应该更加关注基础模型。”谢东解释道,“在企业应用 AI 的时候,除了大语言模型,还会有不同的应用场景,包括 IT 自动化模型、数字劳动力的模型、网络安全模型等等,这些不同的专业模型支撑了这些企业级应用。”


据了解,IBM 目前正在构建一系列针对多种类型的业务数据进行训练的特定领域的基础模型,包括代码、时间序列数据、表格数据、地理空间数据、半结构化数据和混合模态数据(如文本与图像的组合)。IBM 认为,这些基础模型的灵活性和可扩展性将显著加速企业对 AI 的采用。


在今年 7 月举办的 2023 温网锦标赛上,IBM 已经利用 watsonx 为大赛所有视频集锦提供生成式 AI 解说,并且,基于 IBM AI Draw Analysis 提供的一套全新的统计数据,还可以使用 AI 来预测单打抽签中每个球员进入决赛的可能性。

大模型不一定越“大”越好


有了基础模型,下一个解决的问题是,企业如何根据自身的业务需求,选择适用的模型。谢东强调,所谓“适用”,意味着模型不一定越“大”越好。因为,企业在任何技术领域的投入都是以驱动经营为目的,更在乎其中的投入产出比。


一方面,虽然模型越“大”,其知识和能力也越强,但是成本投入也是巨大的。对于企业而言,很多应用场景的落地并不在于模型本身大小,而在于多大程度符合企业特定要求,能不能很好地完成任务,匹配业务目标;


另一方面,支持一个大模型的训练和运行非常消耗算力,模型上线之后,企业业务本身仍然在不断变化,这要求模型具备适应性和可扩展性,系统能力也要不断学习和进化。而出于运维成本的考虑,“小”模型反而比“大”模型更加节约且灵活。


“在这个过程中,基础模型要演化出各种不同应用,还需要有新的自动化工具和项目管理方法,实现持续的训练、调试、部署等工作。”谢东举例,IBM watsonx 就是这样一个平台工具,IBM 希望借此减轻企业的 AI 负担,让企业可以更轻松地实现大规模开发、调整和部署企业级 AI。


举例来说,基于 watsonx.ai,AI 开发者就可以利用 IBM 自有的模型和 Hugging Face 的模型来完成一系列 AI 开发任务。这些模型经过预训练,可以支持一系列自然语言处理 (NLP) 类型的任务,包括问答、内容生成和摘要、文本分类和提取。据了解,未来的版本还将提供更多由 IBM 训练的针对提升相关领域效率和任务专业化的专有基础模型的访问。


事实上,多年来,IBM 一直在帮助企业把 AI 部署到核心应用中,从而增强企业生产力。据菜鸟科技首席科学家、菜鸟物流科技部算法总监王子豪介绍,菜鸟与 IBM 在 AI 开放和赋能方面有很多共性,菜鸟物流最早在快递行业提出了神经网络驱动的大规模地址分单技术,并且陆续在仓储、客服、供应链等环节实现了广泛的智能化升级,包括在仓储场景应用机器视觉、推出物流智能客服和快递末端地理大模型、基于决策智能技术构建菜鸟全球供应链网络等等。并且,菜鸟还在无锡构建了亚洲最大规模的智能调度现场,最高峰期可以调度同时 1000 台飞机。


但是,随着基础模型的演进,以及生成式AI的兴起,的的确确给各行业 AI 的规模化广泛应用带来了新的变化。


谢东强调:“我们需要从以前数据为先的‘+AI’时代迈入 AI 为先的‘AI+’时代。这个说法不光是一个加号在前在后,当我们说+AI 的时候,注重的是以数据为中心,企业是在数据应用的层面上附加一些 AI 的能力。而当我们走到 AI+的阶段,意味着企业需要建立起 AI 的基础能力,在这基础上,我们需要进一步结合企业自身的数据和不同的业务目标,构建新的核心应用。”

写在最后


对于企业而言,IBM watsonx 是一个全新的 AI 和数据平台工具,那么,如何才能让这个工具“物尽其用”?

除了搞定数据质量、数据共享的问题之外,IBM Consulting 大中华区总裁陈科典表示,企业中还必须具备相应的文化、人才和制度。“企业需要去提升内部人才的能力,培养新的文化,如此以来,才能让内部对生成式 AI 的信心越来越充足,那么,更多的场景才会被创造出来。”


具体而言,IBM 认为在生成式 AI 的技术背景下,相关技术人员需要至少具备两类能力:一是理解业务场景,能够针对业务目标,对模型进行训练和调整;二是理解企业自己的数据,知道数据分布在哪里,使用过程中的标准和规则等等


IBM 大中华区客户成功管理部总经理朱辉强调,“生成式 AI 的应用现在基本还处于‘打开脑洞’的阶段,所以我们特别强调共创。因为有构建大模型能力的人,不一定拥有业务场景的支持,而拥有业务场景的企业,也不一定具有建设大模型的能力。这也是 IBM 一直以来的战略定位,热衷于提供基础能力,与合作伙伴和客户共创解决方案,从而解决客户的问题。而不是拿出一个现成方案,告诉别人这就是你应该要的东西。”

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2023-09-12 17:342944

评论

发布
暂无评论
发现更多内容

华为云低时延技术的九大绝招

坚果

6月月更

Java Core 「16」J.U.C Executor 框架之 ScheduledThreadPoolExecutor

Samson

学习笔记 Java core 6月月更

一文简述:供应链攻击知多少

穿过生命散发芬芳

供应链攻击 6月月更

uni-app进阶之认证【day12】

恒山其若陋兮

6月月更

Vue2/3 自定义组件的 v-model 到底怎么写?💎

德育处主任

JavaScript Vue model Javascript框架 6月月更

一个使用 Shell 脚本实现的 Docker

ScratchLab

开源一款监控数据采集器,啥都能监控

龙渊秦五

Nightingale #Prometheus

国内外最好的12款项目管理系统优劣势分析

PingCode

保健品一物一码防窜货营销软件开发

开源直播系统源码

软件开发 app源码

Android 11适配指南之Toast解析

yechaoa

android 适配 6月月更 11.0

linux存储结构与磁盘划分

乌龟哥哥

6月月更

给你讲懂 MVCC

Nick

MySQL 源码 MVCC 6月月更 深入解析

应用升级SpringCloud版本时的注意事项(Dalston升级到Edgware)

程序员欣宸

spring Spring Cloud 6月月更

C语言自定义类型的介绍(结构体,枚举,联合体,位段)

未见花闻

6月月更

LRU 原理与算法实现

Ayue、

LRU

一款支持内网脱机分享文档的接口测试软件

Xd

Java 后端 接口测试工具

apipost接口断言详解

Xd

Java 接口测试工具

事件

Jason199

js 事件 6月月更

flutter系列之:flutter中的offstage

程序那些事

flutter 程序那些事 6月月更

如何低成本构建一个APP

Geek_99967b

小程序

JVM调优简要思想及简单案例-怎么调优

zarmnosaj

6月月更

一次 MySQL 误操作导致的事故,「高可用」都顶不住了!

悟空聊架构

MySQL 高可用 悟空聊架构 6月月更 事故复盘

Prometheus PushGateway 碎碎念

耳东@Erdong

Prometheus PushGateway 6月月更

《梦华录》要大结局了,看超前点映不如先来学学它!

博文视点Broadview

什么是数据中台

奔向架构师

数据中台 数据仓库 6月月更

ribbon

卢卡多多

6月月更

Java中使用正则检查有效日期

okokabcd

Java

讲讲我的不丰富的远程办公经验和推荐一些办公利器 | 社区征文

Regan Yue

远程办公 初夏征文

Linux开发_BMP图片编程(翻转、添加水印)

DS小龙哥

6月月更

【直播回顾】战码先锋第七期:三方应用开发者如何为开源做贡献

OpenHarmony开发者

OpenHarmony

浅谈如何运营好小红书账号:利用好长尾词理论

石头IT视角

企业级生成式AI应用,如何克服“幻觉”问题_生成式 AI_高玉娴_InfoQ精选文章