写点什么

Gartner 预测:特定领域生成式 AI 模型前景广阔,5 年内占比将过半

  • 2025-06-10
    北京
  • 本文字数:2285 字

    阅读完需:约 7 分钟

大小:1.16M时长:06:45
Gartner预测:特定领域生成式AI模型前景广阔,5年内占比将过半

在 GPT-4、PaLM 和 Llama 等强大的大型语言模型的出现推动下,自然语言处理和语言模型领域经历了显著的转变。这些模型经过海量数据集的训练,表现出了令人印象深刻的理解和生成类人文本的能力,解锁了各个领域的新可能性。

 

然而,随着人工智能应用不断渗透到不同的行业,对针对特定领域及其独特语言细微差别的语言模型的需求日益增长。特定领域的语言模型应运而生,这是一种新型人工智能系统,旨在在特定行业或知识领域的背景下理解和生成语言。这种专门的方法有望彻底改变人工智能与不同领域交互和服务的方式,提高语言模型的准确性、相关性和实际应用。

 

那么,什么是特定领域语言模型?

 

特定领域语言模型(DSLM)是一类人工智能系统,专门用于在特定领域或行业的背景下理解和生成语言。与在不同数据集上训练的通用语言模型不同,DSLM 是在特定领域的数据上从头开始进行微调或训练的,使它们能够理解并生成适合该领域流行的独特术语、行话和语言模式的语言。

 

这些模型旨在弥合通用语言模型与法律、金融、医疗保健和科学研究等各个行业的专业语言要求之间的差距。通过利用特定领域的知识和上下文理解,DSLM 可以提供更准确和相关的输出,从而提高这些领域内人工智能驱动的解决方案的效率和适用性。

 

DSLM 的起源可以追溯到通用语言模型在应用于特定领域任务时的局限性。虽然这些模型擅长理解和生成广义上的自然语言,但它们经常难以应对专业领域的细微差别和复杂性,从而导致潜在的不准确或误解。

 

随着人工智能应用日益渗透到各个行业,对能够在特定领域内有效理解和交流的定制语言模型的需求呈指数级增长。这种需求,加上大型特定领域数据集的可用性和自然语言处理技术的进步,为 DSLM 的发展铺平了道路。

 

DSLM 的重要性在于它们能够提高专业领域内人工智能驱动的解决方案的准确性、相关性和实际应用。通过准确解释和生成特定领域的语言,这些模型可以促进更有效的沟通、分析和决策过程,最终推动各个行业提高效率和生产力。

 

DSLM 到底会发展到什么程度?据 Gartner 预测:到 2030 年在企业使用 GenAI 模型中,将有 50%以上侧重于特定领域(即用于特定行业或业务职能),高于 2024 年的 5%。

特定领域的语言模型如何工作

 

DSLM 通常建立在大型语言模型的基础上,这些模型是在大量通用文本数据上进行预训练的。然而,关键的区别在于微调或再训练过程,这些模型在特定领域的数据集上进行进一步训练,使它们能够专门研究特定行业的语言模式、术语和背景。

 

开发 DSLM 有两种主要方法:


  • 微调现有语言模型:在这种方法中,预训练的通用语言模型针对特定领域的数据进行微调。调整和优化模型的权重以捕获目标域的语言模式和细微差别。该方法利用基础模型的现有知识和功能,同时使其适应特定领域。

  • 从头开始训练:或者,DSLM 可以使用特定领域的数据集完全从头开始训练。这种方法涉及构建语言模型架构并在大量特定领域文本的语料库上对其进行训练,使模型能够直接从数据中学习领域语言的复杂性。

 

无论采用哪种方法,DSLM 的训练过程都涉及将模型暴露于大量特定领域的文本数据,例如学术论文、法律文件、财务报告或医疗记录。通常采用迁移学习、检索增强生成和提示工程等先进技术来增强模型的性能并使其适应目标领域。

领域特定语言模型对企业应用的影响


在人工智能技术快速发展的当下,企业正面临关键抉择:是选择通用大模型,还是部署领域专属 AI?这一选择将直接影响企业的智能化转型成效。

 

“企业在选用 AI 模型时,首先要评估应用场景的特性。”Gartner 研究副总裁蔡惠芬表示,“对于跨领域的通用需求,大模型确实表现出色,但存在'幻觉'风险;而在高度专业化的场景中,领域专属模型能提供更精准的解决方案。”这种专业化模型通过整合行业特定数据和知识图谱,不仅能显著提升输出准确性,还能实现快速部署,因其已预先掌握行业知识框架。

 

在构建方式上,企业可根据实际情况选择三种主要路径:

 

  • 全量训练:适合数据资源丰富且需求稳定的企业,虽然前期投入较大,但长期使用成本更低;

  • 微调轻量模型:基于现有小型模型进行优化,平衡成本与效果,特别适合中等规模企业;

  • RAG(检索增强生成)方案:为注重数据隐私且需求快速迭代的企业提供了灵活选择,但其知识覆盖范围相对有限。

 

蔡惠芬举了一个半导体科技公司 Aitomatic 的例子。Aitomatic 的实践印证了领域专属模型的价值。

 

作为一家专注于半导体行业的企业,Aitomatic 积累了丰富的行业知识和专业数据资源。该公司开发的领域模型旨在协助半导体制造厂商解决一个关键痛点:大量宝贵的专业知识和经验仅存在于资深工程师的头脑中,尚未实现系统化的数字转化。

 

该 AI 系统采用了智能问答交互机制,通过结构化的问题设计来提取工程师的隐性知识。系统会向工程师提出针对性问题,例如:“在过去三个月中,您遇到过哪些特别具有挑战性的问题案例?这些问题是否存在标准解决方案?您是如何突破常规思维找到解决方法的?”随后进一步追问:“请您详细说明当时的思考过程和分析思路?您采取了哪些关键步骤来定位和解决问题?”



这种问答交互并非简单的信息收集,而是基于深入的领域知识和业务逻辑设计,能够循序渐进地将工程师的专业技能和问题解决经验进行结构化解析。通过这种方式,系统成功地将原本存在于工程师头脑中的非结构化知识转化为数字化的知识库。

 

这一转化过程创造了显著的业务价值:第一是它解决了企业知识传承的难题,使新入职的工程技术人员能够快速获取过去仅存在于资深工程师经验中的问题解决方法;其次,它大幅提升了生产效率,缩短了问题诊断和解决的时间周期;最终还能有效降低了企业运营成本,避免了因人员流动导致的知识流失风险。这些优势共同构成了该领域专属 AI 模型的明确商业价值。

2025-06-10 15:483478
用户头像
李冬梅 加V:busulishang4668

发布了 1114 篇内容, 共 726.9 次阅读, 收获喜欢 1256 次。

关注

评论

发布
暂无评论

Stream流处理快速上手最佳实践 | 京东物流技术团队

京东科技开发者

京东云 企业号9月PK榜

跟模型和中间层聊聊:什么是最好的AI原生应用?

Zilliz

Milvus 大模型 AIGC 向量数据库

软件测试/测试开发丨Web自动化—capability参数配置 学习笔记

测试人

Python 程序员 软件测试 自动化测试 Web自动化测试

移动云桌面,随时随地交付桌面系统!

青椒云云电脑

云桌面

【云资讯】行云管家-云计算服务商佼佼者

行云管家

云计算 云管理 云计算运维 云服务商

Footprint Analytics 宣布与 GameFi 平台 Game Verse 达成合作

Footprint Analytics

区块链

团队绩效考核,OKR还是KPI?

老张

OKR KPI 绩效考核

基于Spring事务的可靠异步调用实践 | 京东物流技术团队

京东科技开发者

spring 京东云 企业号9月PK榜

一文了解袋鼠云在实时数据湖上的探索与实践

袋鼠云数栈

数据湖 实时数据湖 湖仓一体 实时湖仓

创新型联合共创 |数糖 × 和鲸:挖掘数据价值,形成数据产出

ModelWhale

数据分析 数据 商业价值 地理标志 联合共创

科兴未来 | 第十届中国(泰州)国际大健康产业高层次人才创新创业大赛公告

科兴未来News

实力!云起无垠获评清华校友三创大赛“天使组”十强

云起无垠

多链代币开发数字货币开发相关介绍

区块链软件开发推广运营

交易所开发 数字藏品开发 dapp开发 NFT开发 区块链开发链游开发

开箱即⽤!HashData 云数仓上线华为蓝鲸应⽤商城

酷克数据HashData

杭州站|阿里云 Serverless 技术实践营(Serverless + 大数据)开启报名!

Serverless Devs

大数据 开源 Serverless 云原生

软件测试/测试开发丨Web自动化—headless无头浏览器 学习笔记

测试人

软件测试

文心一言 VS 讯飞星火 VS chatgpt (92)-- 算法导论8.3 5题

福大大架构师每日一题

福大大架构师每日一题

从好玩到好用:程序员用AI提效的那些事儿 | 京东云技术团队

京东科技开发者

AI 京东云 ChatGPT 企业号9月PK榜

如何选择安全稳定的大文件传输软件平台,企业传输必看

镭速

为什么用代理ip网页加载不出来,一直转圈?

巨量HTTP

代理IP

2023 年中国国际服务贸易交易会发布:和鲸科技两项成果入选“智赋百业”人工智能融合发展与安全应用典型案例

ModelWhale

人工智能 大模型 AIGC

云桌面是什么?看完这篇你就明白了

青椒云云电脑

桌面云 云桌面

《孤注一掷》揭露你我身边的网络安全威胁

云起无垠

行云管家全面适配信创国产化平台

行云管家

云计算 信创 国产化 安全运维

WorkPlus | 好用、专业、安全的局域网即时通讯及协同办公平台

BeeWorks

Gartner预测:特定领域生成式AI模型前景广阔,5年内占比将过半_生成式 AI_李冬梅_InfoQ精选文章