AICon上海「Agent与多模态解决方案专场」火热来袭!即刻报名,与创新同行~ 了解详情
写点什么

智源技术分享:大模型行业应用新模式和关键实现路径

  • 2025-05-20
    北京
  • 本文字数:3972 字

    阅读完需:约 13 分钟

智源技术分享:大模型行业应用新模式和关键实现路径

在不久前举办的 AICon 全球人工智能开发与应用大会上智源研究院大模型行业应用总监周华为我们带来了精彩专题演讲“智源技术分享:大模型行业应用新模式和关键实现路径”,演讲分析当前行业企业在大模型落地过程中技术团队普遍会遇到的问题和障碍,结合智源研究院在大模型产业落地过程中的实践经验,总结帮助企业跨越大模型应用技术障碍的以大模型为核心新型技术路径,涵盖数据、模型评测、模型训练和应用集成,并针对行业落地过程中突出的数据问题给出数据生产流程的构建技术建议,最后向各行业的大模型应用开发者分享智源研究院在大模型行业应用方向上的最新开源技术成果。


内容亮点:


  • 理解大模型行业应用落地问题的深层次原因;

  • 理解大模型行业应用的独特技术差异,获得以大模型为核心的应用构建的技术方法;

  • 高效构建可持续行业大模型数据生产流程的技术方案;

  • 智源研究院最新的大模型行业应用相关开源技术成果详细讲解。


以下是演讲实录(经 InfoQ 进行不改变原意的编辑整理)。


去年,我们经历了一场被称为“百模大战”的激烈竞争,这场竞争主要在通用领域展开。然而,从今年开始,我们注意到众多企业,包括央企和国企,以及中小企业,都开始着手将这些模型应用于具体的行业实践中。


尽管行业落地的挑战显而易见,但我们可以认为,我们的大模型应用的发展已经进入了一个新的阶段,也就是所谓的行业落地“深水区”。下面,我将与大家分享一个我在过去两年中一直在研究的话题,即《大模型在行业应用中的新模式和关键实现路径》。

AI 大模型浪潮推动企业 IT 系统架构变革


回顾历史,早期计算机系统进入企业时,主要是以流程为中心,强调企业流程的优化和支持复杂流程的实现。进入 21 世纪,随着互联网尤其是移动互联网的兴起,架构逐渐转向以服务为核心。


对于资深从业者来说,可能还记得 AWS 早期提出的企业部门间以 API 的服务形式对外的理念,这一理念经过多年实践已经得到了很好的执行,特别是在微服务架构的落地上。


到了 2010 年左右,云计算和大数据技术成为主流,企业开始以数据为核心,大量大数据平台应运而生,主要处理结构化数据,同时也涉及非结构化和半结构化数据。数据被视为企业的重要资产。


ChatGPT 的出现标志着一个新的转变,我们正在进入一个以大模型为核心的时代。但这并不意味着数据将不再重要,实际上,数据和大模型是相互结合并行发展的。


未来,大模型将进一步整合数据和服务,利用其强大的泛化能力,支持系统执行许多以往需要人工完成的任务。智能系统不再是单纯的工具,而是成为一种能够主动学习、自适应和协调的智能体,支持企业 IT 系统的发展。因此,以大模型为核心的系统将成为企业 IT 系统发展的重要方向



以 AI 和大模型为核心的应用系统正在经历一场演进。在没有大模型的时代,用户使用 IT 系统的过程是手动的:用户需要设定任务目标,规划流程,分析信息,执行路径,最终获得所需结果。在这个过程中,用户需要与系统交互,了解系统功能,并选择相应的功能来提出请求,获得请求结果,然后决定选择下一个应用功能。开发人员的主要任务是从功能上实现整个 IT 系统服务,这是当前传统的模式。


随着大模型的引入,我们看到了一种新模式的出现。在许多企业应用中,多智能体助手成为核心,它们背后依托的是行业大模型。用户只需设定任务目标,智能体助手将负责执行用户想要的操作,并最终提供任务完成的结果。智能体助手将接管任务分解、规划和执行的工作。


在 ChatGPT 刚出现时,我们可能直接与模型对接,进行问答形式的交互,大模型还无法与 IT 系统进行整合。要让大模型真正融入 IT 系统,必须与现有的 IT 系统对接。智能体通过函数调用或工具调用与 IT 系统对接,这一过程与用户与系统的交互过程非常相似,实际上是让多智能体助手帮助用户发起请求、获取和处理请求。


应用开发者不仅要维护现有的 IT 系统,还需要实现智能体应用。同时,算法工程师这一新角色变得非常重要,他们负责训练驱动行业应用智能体的核心大模型,并提供模型服务。


智能体与传统系统之间的分工是,智能体完成专业的认知任务,而非认知性的,程序化的任务则保留在传统系统中,通过原有接口和工具执行。在这种分工趋势下,许多应用系统都将朝着这个方向发展,智能体和传统系统将共同协作,为用户提供更加智能化的服务。

以 AI 大模型为核心的应用系统关键实现路径


实现以大模型为核心的企业 IT 应用系统的关键路径可以分为以下几个主要模块。首先,我们需要进行需求分析和方案设计,这是实现系统的第一步。接下来,在完成方案设计后,我们将并行进行模型训练、数据工程和智能体应用系统的开发。在整个过程中,数据工程被视为核心,因此被放在中间位置。



具体来看,需求分析和方案设计阶段与我们传统的 IT 系统设计相似,但存在一些差异。首先,我们需要进行可行性分析,这是任何项目启动前的标准步骤。然后,我们要梳理模型的业务需求,这是确保模型能够满足实际业务需求的关键步骤。


接着是模型能力的定义,这一点与传统 IT 系统不同,需要明确系统的应用场景,并梳理出哪些任务可以由模型执行,哪些仍需依赖现有的 IT 系统。最独特的地方在于评测体系的建立。


在传统的 IT 系统中,我们通常通过测试用例来进行测试,但现在我们需要构建一套测试集来评估模型或基于模型的智能体,因为模型或基于模型的智能体的输出并不是完全确定的。能够成功完成任务的评估结果可能以百分比形式呈现,一般而言都不是绝对的 100%。最后,我们需要确定总体的应用方案,这是需求分析和方案设计阶段的总结。



在实现以大模型为核心的企业 IT 应用系统中,模型训练、数据工程和智能体应用开发是三个关键环节。首先,我们来看数据工程。企业拥有大量数据,但关键在于如何收集数据、判断哪些数据有用。


这需要根据模型的能力需求来确定数据的方向。数据分为外部数据和内部数据,外部数据主要是行业通用的专业知识,需要有获取渠道;内部数据则是专业的业务数据,需要盘点并进行文档预处理和数据集制作。文本数据和多模态数据的处理也包括在内。


此外,如果应用需要向量数据库,就需要进行数据拆分。如果向量模型的准确率和召回率不高,还需要准备微调数据。对于大型项目,可能还需要制作继续训练的数据集和微调的指定数据,甚至是人力对齐的数据。数据工程强调的是了解数据位置、盘点数据以及获取外部专业数据的渠道。


接下来是模型训练,AI 大模型的应用系统中模型训练常被首先提及,但实际上它并不是一个非常难的环节,因为模型训练的方法在通用领域已有解决方案,我们只需遵循即可。模型训练有两个分支:RAG 方向和 CPT(继续预训练)或 SFT 方向。


RAG 方向的模型训练是指针对 Embedding 模型在专业领域性能下降的问题,需要使用企业专业数据进行 Embedding 模型微调的训练。模型训练的关键在于模型的选型,需要根据业务场景选择最合适的模型,并考虑模型在系统中的能力要求,选取适合评估相关能力的评测指标,并选择评测指标强的模型。


最后,使用准备好的数据进行模型训练,这个过程可能需要多轮迭代,如果评测结果不佳,可能需要回到数据层面解决能力问题。



最后是智能体应用的开发,这与传统模式有所不同。需要根据需求明确智能体应用的功能,设计整体架构,以及执行流程,可能是顺序执行或层级执行。同时,需要提出智能体核心模型的需求,并设计和管理提示词库,建议统一管理提示词并进行集中评测和优化。记忆体的设计也非常关键。


在完成这些准备工作后,将流程串联起来,实现智能体与现有 IT 系统的对接,并进行测试评估。这不仅仅是软件测试,更多的是评估智能体是否达标,如果不达标,可能需要进行迭代优化。


最后要说明的一点是,智能体应用的发展目前刚刚起步,各种框架实现群雄逐鹿,生产环境可用性需要开发团队有很大的耐心去试错填坑,并且智能体应用的工程化实现的思路和传统软件工程化实现思路差异还是比较大的,这也是未来智能体应用开发者们要解决的问题。


在完成模型训练、数据工程和智能体应用开发这三个关键任务之后,我们进入最后的部署阶段。这包括模型的生产部署、检索正向库的构建、智能应用体的生产系统集成,以及系统的上线。


项目完成后,我们可以进行 demo 展示或者实现项目的结算结项,这是整个实现路径的最终步骤。



上述所有这些实现过程与传统的 IT 系统实现有着相似之处。我们需要定义系统的能力,即需求,从模型的能力出发去训练模型。


以一个具体的例子来说,如果我们要在医疗行业应用大模型,我们不仅需要通用的语言能力和安全价值观,还需要将医疗业务能力整合进去。这种业务能力是层级性的,需要逐步分解。


从最顶层开始,逐步细化,直至分解为一个个具体任务。每个任务对应需要的数据类型和评测性能的标准。


总之,我们需要从能力出发选择合适的模型,根据能力需求收集或制作训练数据,并指导模型训练。这个过程要求我们不仅要关注技术实现,还要深入理解业务需求,确保大模型能够真正融入并提升企业的 IT 系统能力。

总结


对于企业 IT 系统的未来,它肯定会朝着以大模型为核心的应用体系架构发展。大模型的能力决定了我们系统的能力上限,因此我们的评测也主要是针对模型的能力来进行。


多智能体系统的开发和应用将拓展大模型的能力,不再局限于简单的问答,而是与 IT 系统联动,极大扩展模型的能力。我们需要以用户助理的视角来理解新的业务和技术特点,而不仅仅是作为开发者解决用户的功能需求。


对于关键路径而言,需求和业务场景是引领整个关键路径的核心。工程、数据工程、模型训练以及多智能体应用开发需要齐头并进,其中业务场景和数据工程可能在企业应用智能化改造的前期过程中是最为重要的。


AICon 2025 强势来袭,5 月上海站、6 月北京站,双城联动,全览 AI 技术前沿和行业落地。大会聚焦技术与应用深度融合,汇聚 AI Agent、多模态、场景应用、大模型架构创新、智能数据基建、AI 产品设计和出海策略等话题。即刻扫码购票,一同探索 AI 应用边界!


2025-05-20 16:403

评论

发布
暂无评论

深度 | 阿里云蒋江伟:什么是真正的云原生?

阿里巴巴云原生

云计算 容器 运维 云原生 k8s

week9-conclusion

J

历史上的今天

IT蜗壳-Tango

七日更

一个系统小BUG修复投产居然花了3个小时来处理(上)

罗小龙

28天写作 投产事故 解决思路

28天瞎写的第二百二十六天:TechCrunch Hackathon 的故事

树上

28天写作

史上最全!阿里巴巴2021年最新最全500道Java后端面试大全(值得收藏)

Java 编程 程序员 面试

共识算法的简单理解(一)

石君

28天写作

【并发编程的艺术】JVM内存模型

程序员架构进阶

架构 Java内存模型 Java虚拟机 28天写作

无代码、Excel与Airtable

lidaobing

低代码 Excel 无代码开发 28天写作 Airtable

Soul 源码阅读 03|WebSocket 同步数据分析

哼干嘛

Java 源码分析 Soul网关

疫情闭关修炼半个月,我竟把JDK源码都读懂了!

996小迁

Java 编程 架构 面试 程序人生

Windows AD 是否开启或者关闭了UAC服务

BigYoung

windows Windows 10

如何管理过程质量?新手管理者的陷阱

一笑

管理 管理者 28天写作 质量保证

惊悚,单个java进程占用700%的CPU

万里无云

Java 后端 cpu

2020 总结 | VoltDB的亮点,你了解多少?

VoltDB

数据库 物联网 VoltDB

人设崩塌的美国生物实验室

脑极体

【高并发】ReadWriteLock怎么和缓存扯上关系了?!

冰河

并发编程 读写锁 高并发 ReadWriteLock 签约计划第二季

2050年的一次出游 (28天写作 Day15/28)

mtfelix

自动驾驶 28天写作 科幻写作

关于“为更新而更新”的一种新的理解

Nydia

week9-homework

J

5G最核心的本质是能力可被编排及开放

JiangX

5G 数字化转型 28天写作

项目管理系列(8)-从0到1搭建PMO(一)

Ian哥

28天写作

soul 数据同步(三)http长轮询 同步策略

xzy

产品质量管理活动流程

L3C老司机

用docker-compose快速部署ChirpStack

远鹏

Docker-compose IoT ChirpStack LoraWan Go 语言

大数据知识专栏 - Hadoop的资源管理 Yarn介绍

小马哥

大数据 hadoop YARN 七日更

区块链数字货币钱包系统软件开发|区块链数字货币钱包APP开发

系统开发

技术招聘常被吐槽,企业应该考虑好这一点

李忠良

28天写作

你有多久没去看海了呢「幻想短篇 15/28」

道伟

28天写作

为什么很多事情说起来容易做起来难

Justin

学习 心理学 成长 心态 28天写作

【CSS】红砖背景

德育处主任

css3 大前端 html/css CSS小技巧 28天写作

智源技术分享:大模型行业应用新模式和关键实现路径_AI&大模型_李忠良_InfoQ精选文章