写点什么

搞定企业 AI 落地多重障碍,红帽“AI+ 混合”模式成降本关键

  • 2025-04-03
    北京
  • 本文字数:1379 字

    阅读完需:约 5 分钟

大小:706.37K时长:04:01
搞定企业AI落地多重障碍,红帽“AI+混合”模式成降本关键

尽管生成式 AI 技术持续火热,但企业落地 AI 仍面临成本、复杂度和灵活性的多重挑战。

 

近日,红帽组织了一场媒体沟通会,分享了如何通过开源与混合 AI 解决方案,助力企业低门槛落 AI。

 

根据红帽最新数据,94%的企业正处于生成式 AI 的测试或试点阶段,但多数预计需 3 至 5 年才能实现投资回报。对此,红帽提出以开源、混合 AI 和小模型为核心的解决方案,助力企业跨越技术鸿沟。

 

红帽 CEO Matt Hicks 强调:“企业应自由选择 AI 部署的位置,而开源是这一愿景的基础。”红帽的 AI 战略依托开源生态,通过全球开发者协作推动技术创新,同时倡导“混合 AI”模式——支持 AI 模型在云端、本地数据中心、边缘设备及私有环境中灵活部署,确保企业数据主权与算力效率的平衡。

 

与通用大模型不同,红帽聚焦行业定制化小模型,为医疗、汽车、零售等领域提供高针对性解决方案。例如,通过优化模型架构和开源工具,企业可减少对高价 GPU 的依赖,降低运营成本。去年红帽论坛提出的“小模型”理念已逐步落地,结合近期对 AI 软件公司 Neural Magic 的收购,红帽进一步强化了在稀疏化计算和高效推理领域的技术优势。

 

而仅仅有小模型还不够,还要更积极地采用开源 AI 模型,为什么这么说?

 

红帽全球副总裁兼大中华区总裁曹衡康(Victor Tsao)表示,“企业在使用 AI 时,会面临成本、复杂度和灵活性这三大挑战。开源在这些方面都能给客户很好的解答。”

 

首先是成本。采用目前的开源模型或开源方式,能让企业在很多方面节省费用。红帽主张“小而专业”的模型,与大规模的商业闭源模型相比,需要更少的硬件资源,维护成本也更低。

 

其次是复杂度。开源模型对接口和架构是透明的,像红帽支持所有平台——物理机、虚拟机、私有云、公有云,都能非常灵活地去部署。企业也不必一次性投入大量资源在某一个特定云上或特定环境中,可以根据自己的需求和预算来选择。

 

再者是灵活性和可扩展性。许多企业有多个业务部门,人力资源部门、研发部门、市场部门、制造部门等,它们所需的模型类型可能不尽相同,比如有人适合 Llama,有人适合 DeepSeek。而红帽支持各种开源模型,并通过 OpenShift 进行统一调度,让企业能够更灵活地根据不同业务场景选择最优解。

 

此外,开源还意味着跨平台。可能有人最开始只想在一个小环境(比如笔记本)上做开发和验证,后面发现需求量很大,就要迁移到数据中心甚至公共云。通过开源架构和 OpenShift,这个过程几乎无需重新开发,大大节省了资源。

 

最后是安全方面。开源意味着参数和代码都是透明的,用户可以在社区看到所有内容,也就有更多人共同进行安全审计。对于企业来说,这是非常重要的。既能把成本降下来,又能灵活选择平台,不受制于某一家云或某一家商业模型,同时还能确保更高的安全可靠性。

 

但 Victor 也补充说道,“这并不是说闭源模型一定不好,如果有企业觉得某种闭源模型更适合自身需求,红帽也能支持。只要对方愿意开放接口,我们都可以进行适配。我们会让客户自己决定,他们需要的是开源还是闭源,或者两者结合”。

 

此外,值得一提的是,生成式 AI 只是近几年火起来的概念,但 AI 的探索几十年前就开始了。现在许多企业真正盈利的部分还是预测性 AI,那些模型大多使用开源工具,也早已能跑在红帽平台上。在生成式 AI 时代,因为规模更大、未知挑战更多,开源方式会更有利于企业在技术和成本等方面维持优势。否则,若沿用过去的封闭式做法,企业会在成本和可持续性上承受更多压力。

2025-04-03 17:167220
用户头像
李冬梅 加V:busulishang4668

发布了 1121 篇内容, 共 737.8 次阅读, 收获喜欢 1267 次。

关注

评论 2 条评论

发布
用户头像
👍
2025-04-03 17:56 · 北京
回复
👍
2025-04-03 17:56 · 北京
回复
没有更多了

听GPT 讲Rust源代码--compiler(25)

fliter

用过都说好!FigJam在线白板使用技巧&替代软件推荐!

彭宏豪95

效率工具 在线白板 办公效率 在线协作 boardmix

图像处理-Java-去噪/高斯模糊/套红

alexgaoyh

Java 图像处理 去噪 高斯模糊 套红

2023 IoTDB Summit:湖南大唐先一科技有限公司主任架构师舒畅《IoTDB 在发电领域的应用实践》

Apache IoTDB

Java核心技术·卷I(原书第12版)PDF

程序员李木子

《On Java 中文版 进阶卷》PDF

程序员李木子

Flyway 的主要命令及其作用如下:

虚实的星空

论文翻译 | 【深入挖掘Java技术】「底层原理专题」深入分析一下并发编程之父Doug Lea的纽约州立大学的ForkJoin框架的本质和原理

码界西柚

Java 并发编程 后端技术 2024年第十五篇文章 Doug Lea

NineData云原生智能数据管理平台架构

NineData

postgresql 阿里云 生态 polarDB NineData

开发者 | Mint Blockchain 重点支持发展的 15 个细分赛道项目

NFT Research

blockchain web3 NFT\

POKT Network 开启周期性通缩,该计划将持续至 2025 年

股市老人

微服务架构设计模式PDF

程序员李木子

首次公开发声,OpenAI CEO 奥特曼回忆“宫斗门”丨 RTE 开发者日报 Vol.129

声网

C# 数据类型与类型转换:包含教程与示例

小万哥

C# 程序人生 编程语言 软件工程 后端开发

《Java解惑》PDF

程序员李木子

90%企业在探索的敏捷开发怎么做?极狐GitLab总结了这些逻辑与流程

极狐GitLab

业财融合,释放财务更多潜力

智达方通

战略规划 企业战略 业财融合 财务与业务 预算控制

【年后跳槽必看篇】Kafka核心知识点 技术探秘第一章

派大星

Java 面试 kaffa

X Winner受邀出席泰国政府加密峰会,上演未来独角兽的独角戏

股市老人

“元”启未来 · 万象“新”生!合肥少荃湖畔等你来

声网

听GPT 讲Rust源代码--compiler(24)

fliter

听GPT 讲Rust源代码--compiler(26)

fliter

听GPT 讲Rust源代码--compiler(27)

fliter

为什么在数学的意义上GraphQL严格的优于REST?

canonical

DDD 低代码 graphql

Java语言程序设计(基础篇 原书第10版)PDF

程序员李木子

《On Java 中文版 基础卷》PDF

程序员李木子

求求你别用轮询了!手把手教你封装WebSocket消息推送,告别轮询方式!

陇锦

JavaScript 前端 websocket

搞定企业AI落地多重障碍,红帽“AI+混合”模式成降本关键_生成式 AI_李冬梅_InfoQ精选文章