AICon 上海站|日程100%上线,解锁Al未来! 了解详情
写点什么

搞定企业 AI 落地多重障碍,红帽“AI+ 混合”模式成降本关键

  • 2025-04-03
    北京
  • 本文字数:1379 字

    阅读完需:约 5 分钟

大小:706.37K时长:04:01
搞定企业AI落地多重障碍,红帽“AI+混合”模式成降本关键

尽管生成式 AI 技术持续火热,但企业落地 AI 仍面临成本、复杂度和灵活性的多重挑战。

 

近日,红帽组织了一场媒体沟通会,分享了如何通过开源与混合 AI 解决方案,助力企业低门槛落 AI。

 

根据红帽最新数据,94%的企业正处于生成式 AI 的测试或试点阶段,但多数预计需 3 至 5 年才能实现投资回报。对此,红帽提出以开源、混合 AI 和小模型为核心的解决方案,助力企业跨越技术鸿沟。

 

红帽 CEO Matt Hicks 强调:“企业应自由选择 AI 部署的位置,而开源是这一愿景的基础。”红帽的 AI 战略依托开源生态,通过全球开发者协作推动技术创新,同时倡导“混合 AI”模式——支持 AI 模型在云端、本地数据中心、边缘设备及私有环境中灵活部署,确保企业数据主权与算力效率的平衡。

 

与通用大模型不同,红帽聚焦行业定制化小模型,为医疗、汽车、零售等领域提供高针对性解决方案。例如,通过优化模型架构和开源工具,企业可减少对高价 GPU 的依赖,降低运营成本。去年红帽论坛提出的“小模型”理念已逐步落地,结合近期对 AI 软件公司 Neural Magic 的收购,红帽进一步强化了在稀疏化计算和高效推理领域的技术优势。

 

而仅仅有小模型还不够,还要更积极地采用开源 AI 模型,为什么这么说?

 

红帽全球副总裁兼大中华区总裁曹衡康(Victor Tsao)表示,“企业在使用 AI 时,会面临成本、复杂度和灵活性这三大挑战。开源在这些方面都能给客户很好的解答。”

 

首先是成本。采用目前的开源模型或开源方式,能让企业在很多方面节省费用。红帽主张“小而专业”的模型,与大规模的商业闭源模型相比,需要更少的硬件资源,维护成本也更低。

 

其次是复杂度。开源模型对接口和架构是透明的,像红帽支持所有平台——物理机、虚拟机、私有云、公有云,都能非常灵活地去部署。企业也不必一次性投入大量资源在某一个特定云上或特定环境中,可以根据自己的需求和预算来选择。

 

再者是灵活性和可扩展性。许多企业有多个业务部门,人力资源部门、研发部门、市场部门、制造部门等,它们所需的模型类型可能不尽相同,比如有人适合 Llama,有人适合 DeepSeek。而红帽支持各种开源模型,并通过 OpenShift 进行统一调度,让企业能够更灵活地根据不同业务场景选择最优解。

 

此外,开源还意味着跨平台。可能有人最开始只想在一个小环境(比如笔记本)上做开发和验证,后面发现需求量很大,就要迁移到数据中心甚至公共云。通过开源架构和 OpenShift,这个过程几乎无需重新开发,大大节省了资源。

 

最后是安全方面。开源意味着参数和代码都是透明的,用户可以在社区看到所有内容,也就有更多人共同进行安全审计。对于企业来说,这是非常重要的。既能把成本降下来,又能灵活选择平台,不受制于某一家云或某一家商业模型,同时还能确保更高的安全可靠性。

 

但 Victor 也补充说道,“这并不是说闭源模型一定不好,如果有企业觉得某种闭源模型更适合自身需求,红帽也能支持。只要对方愿意开放接口,我们都可以进行适配。我们会让客户自己决定,他们需要的是开源还是闭源,或者两者结合”。

 

此外,值得一提的是,生成式 AI 只是近几年火起来的概念,但 AI 的探索几十年前就开始了。现在许多企业真正盈利的部分还是预测性 AI,那些模型大多使用开源工具,也早已能跑在红帽平台上。在生成式 AI 时代,因为规模更大、未知挑战更多,开源方式会更有利于企业在技术和成本等方面维持优势。否则,若沿用过去的封闭式做法,企业会在成本和可持续性上承受更多压力。

2025-04-03 17:167097
用户头像
李冬梅 加V:busulishang4668

发布了 1061 篇内容, 共 679.4 次阅读, 收获喜欢 1223 次。

关注

评论 2 条评论

发布
用户头像
👍
2025-04-03 17:56 · 北京
回复
👍
2025-04-03 17:56 · 北京
回复
没有更多了

那些会阻碍程序员成长的细节[1]

MavenTalker

程序员 职业规划

使用SpreadJS 开发在线问卷系统,构筑CCP(云数据采集)平台

葡萄城技术团队

数据挖掘 大数据 SpreadJS CCP

【快点查查】微信小程序使用流程

tomatocc

绝了!Dataway让Spring Boot不再需要Controller、Service、DAO、Mapper

哈库纳

StringBoot DataQL

Dataway 整合 Swagger2,让 API 管理更顺畅

哈库纳

Spring Boot DataQL Dataway Hasor

Vol.2 谷歌不只有搜索

pyfn2030

谷歌Google

计算机的时间

伴鱼技术团队

分布式 服务器 技术交流

ARTS-WEEK01

子路无倦

ARTS 打卡计划

系统服务化构建-两方OAuth

图南日晟

微服务 软件工程 身份认证 架构设计

Vol.4 了解一下渗透测试

pyfn2030

黑客 网络安全

Dataway 配置数据接口时和前端进行参数对接

哈库纳

Spring Boot DataQL Dataway Hasor

Vol.3 人工智能这么热,你必须知道一点儿!

pyfn2030

人工智能

自己常用的一些快捷键 windows10

halapano

Windows技巧

Vol.6 几个数据库相关的词

pyfn2030

数据库 大数据 新手指南

免费领课的活动你错过了么?

池建强

极客时间

Dataway 4.1.5 以上版本升级指南

哈库纳

string StringBoot Dataway Hasor

如何用一台电脑制作一部动画短片?

zhoo299

动画 CG

原创 | 使用JUnit、AssertJ和Mockito编写单元测试和实践TDD (十)在项目中准备测试环境

编程道与术

Java 编程 软件测试 TDD 单元测试

从 0 到 1 搭建技术中台之技术文化篇

伴鱼技术团队

企业文化 技术管理

AB 测试平台的设计与实现

伴鱼技术团队

架构 系统设计 后端 A/B

码农远程办公指北

大伟

Wi-Fi p2p & ap 共存

贾献华

wifi p2p ap

完美兼容老项目!Dataway 4.1.6 返回结构的全面控制

哈库纳

spring Spring Boot Dataway Hasor

《程序员的数学》笔记

Rex

读书笔记

Vol.5 Go初探,新手必看!

pyfn2030

编程语言 新手指南

无需代码!通过 Dataway 配置一个带有分页查询的接口

哈库纳

spring springboot Dataway Hasor

Gartner 【RPA市场竞争格局】:中国厂商首次进入国际视野

人称T客

代码简洁之路 [持续更新]

hq

Java 大前端 编程习惯

说到做到

Yukun

拖延症

艺术生,我劝你Mac

zhoo299

Mac CG 艺术

Anaconda与虚拟环境

halapano

Python virtualenv Anaconda

搞定企业AI落地多重障碍,红帽“AI+混合”模式成降本关键_生成式 AI_李冬梅_InfoQ精选文章