写点什么

Gartner 预测:特定领域生成式 AI 模型前景广阔,5 年内占比将过半

  • 2025-06-10
    北京
  • 本文字数:2285 字

    阅读完需:约 7 分钟

大小:1.16M时长:06:45
Gartner预测:特定领域生成式AI模型前景广阔,5年内占比将过半

在 GPT-4、PaLM 和 Llama 等强大的大型语言模型的出现推动下,自然语言处理和语言模型领域经历了显著的转变。这些模型经过海量数据集的训练,表现出了令人印象深刻的理解和生成类人文本的能力,解锁了各个领域的新可能性。

 

然而,随着人工智能应用不断渗透到不同的行业,对针对特定领域及其独特语言细微差别的语言模型的需求日益增长。特定领域的语言模型应运而生,这是一种新型人工智能系统,旨在在特定行业或知识领域的背景下理解和生成语言。这种专门的方法有望彻底改变人工智能与不同领域交互和服务的方式,提高语言模型的准确性、相关性和实际应用。

 

那么,什么是特定领域语言模型?

 

特定领域语言模型(DSLM)是一类人工智能系统,专门用于在特定领域或行业的背景下理解和生成语言。与在不同数据集上训练的通用语言模型不同,DSLM 是在特定领域的数据上从头开始进行微调或训练的,使它们能够理解并生成适合该领域流行的独特术语、行话和语言模式的语言。

 

这些模型旨在弥合通用语言模型与法律、金融、医疗保健和科学研究等各个行业的专业语言要求之间的差距。通过利用特定领域的知识和上下文理解,DSLM 可以提供更准确和相关的输出,从而提高这些领域内人工智能驱动的解决方案的效率和适用性。

 

DSLM 的起源可以追溯到通用语言模型在应用于特定领域任务时的局限性。虽然这些模型擅长理解和生成广义上的自然语言,但它们经常难以应对专业领域的细微差别和复杂性,从而导致潜在的不准确或误解。

 

随着人工智能应用日益渗透到各个行业,对能够在特定领域内有效理解和交流的定制语言模型的需求呈指数级增长。这种需求,加上大型特定领域数据集的可用性和自然语言处理技术的进步,为 DSLM 的发展铺平了道路。

 

DSLM 的重要性在于它们能够提高专业领域内人工智能驱动的解决方案的准确性、相关性和实际应用。通过准确解释和生成特定领域的语言,这些模型可以促进更有效的沟通、分析和决策过程,最终推动各个行业提高效率和生产力。

 

DSLM 到底会发展到什么程度?据 Gartner 预测:到 2030 年在企业使用 GenAI 模型中,将有 50%以上侧重于特定领域(即用于特定行业或业务职能),高于 2024 年的 5%。

特定领域的语言模型如何工作

 

DSLM 通常建立在大型语言模型的基础上,这些模型是在大量通用文本数据上进行预训练的。然而,关键的区别在于微调或再训练过程,这些模型在特定领域的数据集上进行进一步训练,使它们能够专门研究特定行业的语言模式、术语和背景。

 

开发 DSLM 有两种主要方法:


  • 微调现有语言模型:在这种方法中,预训练的通用语言模型针对特定领域的数据进行微调。调整和优化模型的权重以捕获目标域的语言模式和细微差别。该方法利用基础模型的现有知识和功能,同时使其适应特定领域。

  • 从头开始训练:或者,DSLM 可以使用特定领域的数据集完全从头开始训练。这种方法涉及构建语言模型架构并在大量特定领域文本的语料库上对其进行训练,使模型能够直接从数据中学习领域语言的复杂性。

 

无论采用哪种方法,DSLM 的训练过程都涉及将模型暴露于大量特定领域的文本数据,例如学术论文、法律文件、财务报告或医疗记录。通常采用迁移学习、检索增强生成和提示工程等先进技术来增强模型的性能并使其适应目标领域。

领域特定语言模型对企业应用的影响


在人工智能技术快速发展的当下,企业正面临关键抉择:是选择通用大模型,还是部署领域专属 AI?这一选择将直接影响企业的智能化转型成效。

 

“企业在选用 AI 模型时,首先要评估应用场景的特性。”Gartner 研究副总裁蔡惠芬表示,“对于跨领域的通用需求,大模型确实表现出色,但存在'幻觉'风险;而在高度专业化的场景中,领域专属模型能提供更精准的解决方案。”这种专业化模型通过整合行业特定数据和知识图谱,不仅能显著提升输出准确性,还能实现快速部署,因其已预先掌握行业知识框架。

 

在构建方式上,企业可根据实际情况选择三种主要路径:

 

  • 全量训练:适合数据资源丰富且需求稳定的企业,虽然前期投入较大,但长期使用成本更低;

  • 微调轻量模型:基于现有小型模型进行优化,平衡成本与效果,特别适合中等规模企业;

  • RAG(检索增强生成)方案:为注重数据隐私且需求快速迭代的企业提供了灵活选择,但其知识覆盖范围相对有限。

 

蔡惠芬举了一个半导体科技公司 Aitomatic 的例子。Aitomatic 的实践印证了领域专属模型的价值。

 

作为一家专注于半导体行业的企业,Aitomatic 积累了丰富的行业知识和专业数据资源。该公司开发的领域模型旨在协助半导体制造厂商解决一个关键痛点:大量宝贵的专业知识和经验仅存在于资深工程师的头脑中,尚未实现系统化的数字转化。

 

该 AI 系统采用了智能问答交互机制,通过结构化的问题设计来提取工程师的隐性知识。系统会向工程师提出针对性问题,例如:“在过去三个月中,您遇到过哪些特别具有挑战性的问题案例?这些问题是否存在标准解决方案?您是如何突破常规思维找到解决方法的?”随后进一步追问:“请您详细说明当时的思考过程和分析思路?您采取了哪些关键步骤来定位和解决问题?”



这种问答交互并非简单的信息收集,而是基于深入的领域知识和业务逻辑设计,能够循序渐进地将工程师的专业技能和问题解决经验进行结构化解析。通过这种方式,系统成功地将原本存在于工程师头脑中的非结构化知识转化为数字化的知识库。

 

这一转化过程创造了显著的业务价值:第一是它解决了企业知识传承的难题,使新入职的工程技术人员能够快速获取过去仅存在于资深工程师经验中的问题解决方法;其次,它大幅提升了生产效率,缩短了问题诊断和解决的时间周期;最终还能有效降低了企业运营成本,避免了因人员流动导致的知识流失风险。这些优势共同构成了该领域专属 AI 模型的明确商业价值。

2025-06-10 15:483515
用户头像
李冬梅 加V:busulishang4668

发布了 1121 篇内容, 共 738.4 次阅读, 收获喜欢 1267 次。

关注

评论

发布
暂无评论

被问了n遍怎么把FB视频无水印下载到手机相册!现在双手奉上教程!

frank

facebook #Facebook

8年服务百万客户,这家SaaS公司是懂云原生的

科技热闻

从零开始搭建一个通用的业务技术架构,这套架构 有点牛逼!

程序知音

Java 程序员 编程语言 后端

NineData x 阿里云 正式上线

NineData

数据库 阿里云 数据迁移 数据管理 NineData

ExpandableListView的基本使用

芯动大师

Adapter ExpandableListView 可折叠的列表

OpenHarmony编译固件新增支持Ubuntu22.04平台

离北况归

OpenHarmony

OpenHarmony NAPI 类对象导出及其生命周期管理(下)

离北况归

OpenHarmony

@所有人,优秀前端都应该具备的开发好习惯

引迈信息

前端 低代码 开发

非侵入式入侵 —— Web缓存污染与请求走私

vivo互联网技术

CDN

开源的未来:启动 Open100

开源雨林

社区 开源软件 商业化

Blazor在IoT领域的前端实践 @.NET开发者日

MASA技术团队

.net blazor MASA MAUI

URule规则引擎

规则引擎 java

架构训练营模块四作业

null

使用C++ template进行多厂商接口的适配

老王同学

c++ 模板

助力白帽成长 百度安全2022 BSRC年度盛典圆满收官

Geek_283163

百度 #百度#

OpenHarmony NAPI 类对象导出及其生命周期管理(上)

离北况归

OpenHarmony

极客时间运维进阶训练营第十二周作业

Starry

Matlab常用图像处理命令108例(四)

timerring

图像处理

DockQuery | 基于E-R图的数据建模功能使用实践

BinTools图尔兹

数据建模 信创 #数据库

Polygon马蹄链质押DApp开发合约部署案例

薇電13242772558

智能合约 dapp

【OpenHarmony设备开发】修改屏幕 DPI(像素密度)

离北况归

OpenHarmony

OpenHarmony内核学习[1]--单独编译OpenHarmony标准系统内核

离北况归

OpenHarmony

图解Redis,谈谈Redis的持久化,RDB快照与AOF日志

小小怪下士

Java redis 程序员 后端

企业如何构建内部开发者平台?

SEAL安全

IdP 平台工程 企业号 3 月 PK 榜 内部开发者平台

OpenHarmony NDK工具(上)

离北况归

OpenHarmony

PyTorch深度学习实战 | 深度学习框架(PyTorch)

TiAmo

深度学习 PyTorch

京东小程序CI工具实践

京东科技开发者

小程序 ci 开发 代码 企业号 3 月 PK 榜

【网络安全必备知识】本地提权漏洞分析

网络安全学海

黑客 网络安全 信息安全 渗透测试 漏洞挖掘

如何规避MyBatis使用过程中带来的全表更新风险

京东科技开发者

数据库 mybatis 代码 代码规范 企业号 3 月 PK 榜

一天吃透MySQL锁面试八股文

程序员大彬

MySQL 面试

科技助力金融转型 阿里云联合中国信通院在京举办未来金融思享会

阿里云云效

DevOps 数字化转型 金融 BizDevOps 业技融合

Gartner预测:特定领域生成式AI模型前景广阔,5年内占比将过半_生成式 AI_李冬梅_InfoQ精选文章