2025上半年,最新 AI实践都在这!20+ 应用案例,任听一场议题就值回票价 了解详情
写点什么

Gartner 预测:特定领域生成式 AI 模型前景广阔,5 年内占比将过半

  • 2025-06-10
    北京
  • 本文字数:2285 字

    阅读完需:约 7 分钟

大小:1.16M时长:06:45
Gartner预测:特定领域生成式AI模型前景广阔,5年内占比将过半

在 GPT-4、PaLM 和 Llama 等强大的大型语言模型的出现推动下,自然语言处理和语言模型领域经历了显著的转变。这些模型经过海量数据集的训练,表现出了令人印象深刻的理解和生成类人文本的能力,解锁了各个领域的新可能性。

 

然而,随着人工智能应用不断渗透到不同的行业,对针对特定领域及其独特语言细微差别的语言模型的需求日益增长。特定领域的语言模型应运而生,这是一种新型人工智能系统,旨在在特定行业或知识领域的背景下理解和生成语言。这种专门的方法有望彻底改变人工智能与不同领域交互和服务的方式,提高语言模型的准确性、相关性和实际应用。

 

那么,什么是特定领域语言模型?

 

特定领域语言模型(DSLM)是一类人工智能系统,专门用于在特定领域或行业的背景下理解和生成语言。与在不同数据集上训练的通用语言模型不同,DSLM 是在特定领域的数据上从头开始进行微调或训练的,使它们能够理解并生成适合该领域流行的独特术语、行话和语言模式的语言。

 

这些模型旨在弥合通用语言模型与法律、金融、医疗保健和科学研究等各个行业的专业语言要求之间的差距。通过利用特定领域的知识和上下文理解,DSLM 可以提供更准确和相关的输出,从而提高这些领域内人工智能驱动的解决方案的效率和适用性。

 

DSLM 的起源可以追溯到通用语言模型在应用于特定领域任务时的局限性。虽然这些模型擅长理解和生成广义上的自然语言,但它们经常难以应对专业领域的细微差别和复杂性,从而导致潜在的不准确或误解。

 

随着人工智能应用日益渗透到各个行业,对能够在特定领域内有效理解和交流的定制语言模型的需求呈指数级增长。这种需求,加上大型特定领域数据集的可用性和自然语言处理技术的进步,为 DSLM 的发展铺平了道路。

 

DSLM 的重要性在于它们能够提高专业领域内人工智能驱动的解决方案的准确性、相关性和实际应用。通过准确解释和生成特定领域的语言,这些模型可以促进更有效的沟通、分析和决策过程,最终推动各个行业提高效率和生产力。

 

DSLM 到底会发展到什么程度?据 Gartner 预测:到 2030 年在企业使用 GenAI 模型中,将有 50%以上侧重于特定领域(即用于特定行业或业务职能),高于 2024 年的 5%。

特定领域的语言模型如何工作

 

DSLM 通常建立在大型语言模型的基础上,这些模型是在大量通用文本数据上进行预训练的。然而,关键的区别在于微调或再训练过程,这些模型在特定领域的数据集上进行进一步训练,使它们能够专门研究特定行业的语言模式、术语和背景。

 

开发 DSLM 有两种主要方法:


  • 微调现有语言模型:在这种方法中,预训练的通用语言模型针对特定领域的数据进行微调。调整和优化模型的权重以捕获目标域的语言模式和细微差别。该方法利用基础模型的现有知识和功能,同时使其适应特定领域。

  • 从头开始训练:或者,DSLM 可以使用特定领域的数据集完全从头开始训练。这种方法涉及构建语言模型架构并在大量特定领域文本的语料库上对其进行训练,使模型能够直接从数据中学习领域语言的复杂性。

 

无论采用哪种方法,DSLM 的训练过程都涉及将模型暴露于大量特定领域的文本数据,例如学术论文、法律文件、财务报告或医疗记录。通常采用迁移学习、检索增强生成和提示工程等先进技术来增强模型的性能并使其适应目标领域。

领域特定语言模型对企业应用的影响


在人工智能技术快速发展的当下,企业正面临关键抉择:是选择通用大模型,还是部署领域专属 AI?这一选择将直接影响企业的智能化转型成效。

 

“企业在选用 AI 模型时,首先要评估应用场景的特性。”Gartner 研究副总裁蔡惠芬表示,“对于跨领域的通用需求,大模型确实表现出色,但存在'幻觉'风险;而在高度专业化的场景中,领域专属模型能提供更精准的解决方案。”这种专业化模型通过整合行业特定数据和知识图谱,不仅能显著提升输出准确性,还能实现快速部署,因其已预先掌握行业知识框架。

 

在构建方式上,企业可根据实际情况选择三种主要路径:

 

  • 全量训练:适合数据资源丰富且需求稳定的企业,虽然前期投入较大,但长期使用成本更低;

  • 微调轻量模型:基于现有小型模型进行优化,平衡成本与效果,特别适合中等规模企业;

  • RAG(检索增强生成)方案:为注重数据隐私且需求快速迭代的企业提供了灵活选择,但其知识覆盖范围相对有限。

 

蔡惠芬举了一个半导体科技公司 Aitomatic 的例子。Aitomatic 的实践印证了领域专属模型的价值。

 

作为一家专注于半导体行业的企业,Aitomatic 积累了丰富的行业知识和专业数据资源。该公司开发的领域模型旨在协助半导体制造厂商解决一个关键痛点:大量宝贵的专业知识和经验仅存在于资深工程师的头脑中,尚未实现系统化的数字转化。

 

该 AI 系统采用了智能问答交互机制,通过结构化的问题设计来提取工程师的隐性知识。系统会向工程师提出针对性问题,例如:“在过去三个月中,您遇到过哪些特别具有挑战性的问题案例?这些问题是否存在标准解决方案?您是如何突破常规思维找到解决方法的?”随后进一步追问:“请您详细说明当时的思考过程和分析思路?您采取了哪些关键步骤来定位和解决问题?”



这种问答交互并非简单的信息收集,而是基于深入的领域知识和业务逻辑设计,能够循序渐进地将工程师的专业技能和问题解决经验进行结构化解析。通过这种方式,系统成功地将原本存在于工程师头脑中的非结构化知识转化为数字化的知识库。

 

这一转化过程创造了显著的业务价值:第一是它解决了企业知识传承的难题,使新入职的工程技术人员能够快速获取过去仅存在于资深工程师经验中的问题解决方法;其次,它大幅提升了生产效率,缩短了问题诊断和解决的时间周期;最终还能有效降低了企业运营成本,避免了因人员流动导致的知识流失风险。这些优势共同构成了该领域专属 AI 模型的明确商业价值。

2025-06-10 15:4810
用户头像
李冬梅 加V:busulishang4668

发布了 1089 篇内容, 共 705.4 次阅读, 收获喜欢 1243 次。

关注

评论

发布
暂无评论

另眼旁观 Linkerd 2.12 的发布:服务网格标准的曙光?

张晓辉

云原生 kuberne Linkerd 服务网格

vivo 基于 JaCoCo 的测试覆盖率设计与实践

vivo互联网技术

DevOps JACOCO

Java反射是什么

TimeFriends

8月月更

java程序员培训学习需要多长时间?

小谷哥

MAUI + Masa Blazor 开发界面跟随系统主题切换的App

MASA技术团队

.net blazor MASA MAUI Xamarin

Databend v0.8 新版本上线!

Databend

开源社区 云平台 大数据 开源 databend

如何有效改进回顾会议(下)?

敏捷开发

Scrum 回顾会 Scrum团队

分分钟带你了解 ES2022 最重要的 4 个特性!

掘金安东尼

前端 8月月更 ES2022

参加大数据培训机构学习前景怎么样

小谷哥

你必须要会uvloop!让Python asyncio异步编程性能直逼Go协程性能

HullQin

Go golang 后端 websocket 8月月更

数字藏品app:如何开发?

开源直播系统源码

数字藏品 数字藏品软件开发 数字藏品开发 数字藏品系统

SpringCloud Eureka参数配置项详解

echoes

大厂裁员小厂跑路,是时候做这件事了,否则到时可别后悔!!!

CRMEB

深圳选择java培训机构哪家靠谱?

小谷哥

设计模式的艺术 第十章桥接设计模式练习(设计一个数据转换工具,可以将数据库中的数据转换成多种文件格式,例如txt、xml、pdf等格式,同时该工具需要支持多种不同的数据库)

代廉洁

设计模式的艺术

面试突击78:@Autowired 和 @Resource 有什么区别?

王磊

SpringCloud

深究索引:Mysql索引模型及其不同结构优劣势

知识浅谈

8月月更

阿里云首期云原生加速器第二次集结活动成功举办,秒云获阿里云加速器荣誉伙伴认证

MIAOYUN

阿里云产品集成认证 阿里云产品生态集成认证 阿里云云原生加速器 阿里云首期云原生加速器 阿里云加速器荣誉伙伴

Databend 源码阅读系列(一): 开篇

Databend

源码阅读 源码剖析 云平台 大数据 开源 databend

ClickHouse与Elasticsearch压测实践

京东科技开发者

elasticsearch 分布式 数据分析 Clickhouse 数据库·

如何快速地学习东西(下篇)

宇宙之一粟

学习方法 8月月更

SpringCloud 注册中心 (Eureka) 快速入门

微服务 Eureka SpringCould 8月月更

Kubernetes深入学习之二:编译和部署镜像(api-server)

程序员欣宸

Kubernetes 8月月更

ClickHouse 挺快,esProc SPL 更快

dvlinker

数据库 oracle sql Clickhouse SPL

开源 DevOps 工具,你值得拥有!

飞算JavaAI开发助手

web前端培训学习应该注意什么

小谷哥

聊聊动态线程池的9个场景

马丁玩编程

GitHub 开源 动态线程池

详解 Sqllogictest

Databend

大数据 databend Sqllogictest

css入门

楠羽

#开源

选择web前端培训机构需要注意什么?

小谷哥

携手HMS Core统一扫码服务, 兴业证券优理宝App提升用户扫码体验

HarmonyOS SDK

扫码

Gartner预测:特定领域生成式AI模型前景广阔,5年内占比将过半_生成式 AI_李冬梅_InfoQ精选文章