在 2025 收官前,看清 Data + AI 的真实走向,点击查看 BUILD 大会精华版 了解详情
写点什么

AI 芯片或面临新一轮短缺,首席信息官们如何提前布局应对?

  • 2024-09-27
    北京
  • 本文字数:1635 字

    阅读完需:约 5 分钟

AI芯片或面临新一轮短缺,首席信息官们如何提前布局应对?

根据咨询研究机构贝恩公司本周发布的一份报告,随着 AI 计算需求的激增,数据中心芯片、个人电脑和智能手机的供应链将面临重大压力。其指出,持续的地缘政治紧张局势和其他供应风险可能会导致下一轮半导体短缺


半导体的供需是一个微妙的平衡,过去几年的经历让业界对此深有感触。在此背景下,贝恩公司呼吁各方密切关注半导体供应链的复杂性——“当需求增加约 20% 或更多,很有可能打破平衡,导致芯片短缺’。”

从报告来看,其关键观察有以下几点:


  1. 数据中心及其专用芯片的支出依然强劲,主要云服务提供商预计在 2024 年的资本支出将同比增长 36%,这一增长主要源于对 AI 和加速计算的投资。

  2. 如果数据中心对当前一代图形处理单元(GPU)的需求到 2026 年翻倍——鉴于当前的趋势,这是一个合理的假设,那么关键部件的供应商在某些情况下需要将产量增加 30% 或更多。

  3. 为促进 AI 的增长,必须在建设数据中心、晶圆厂、先进封装技术和电力保障等方面整合复杂的供应链要素,确保获得先进的封装技术和充足的电力。


虽然报告的重点是购买芯片的组织需要做什么,但首席信息官们可以采取一些措施,以确保将来能获得所需的产品,或为价格剧烈波动做好准备。


Info-Tech 研究集团的研究主管 Scott Bickley 指出,先进的半导体供应链是全球最脆弱的供应链之一,必须有超过 5000 家供应商完美协作才能生产最先进的芯片。


他说,其中许多供应商“为单个公司供应单一的组件,如果没有它们,整个系统就会嘎然而止。单是技术障碍就令人瞠目结舌,更不用说台积电面临的地缘政治风险和物流管理的阻力了。”


Bickley 还表示,技术买家主要分为两类:一类是为大规模基础设施采购的买家,例如私有云环境...... 也可以说是财富 200 强规模的客户;另一类则是为小规模项目采购的买家,比如数据中心现代化、小规模的 LLM 内部模型,以及先进的 AI 功能 PC。


在私有云层面,Bickley 建议买家应立即制定技术战略。举例来说,你是否要大干一场,押注于英伟达下一代 Blackwell 系列 GPU,或选择第一代 H100 进行模型训练。数据中心基础设施的挑战不容小觑,尤其是在水冷环境和高密度 GPU 集群的设计上,以平衡能耗、性能和环境要求。


而传统企业环境中的技术买家面临的挑战则不同,他们由于规模较小,对供应商的影响力有限,在这种环境中,这些买家将不得不过度扩张,现在就下注,以确保以后的供应。“为生产延迟做提前规划可能需要买家承担一些昂贵的前沿技术产品库存,并且这些产品可能很快就会过时。”


Forrester Research 的高级分析师 Alvin Nguyen 补充道,谈到首席信息官可以做些什么来确保他们能够继续获得所需的产品,或者为价格的剧烈变化做好准备,他们需要考虑几个方面:

  • 风险管理:Nguyen 说,生成式 AI 的进展速度以及对特定模型或方法的巨额投资,日后可能被证明是错误或非最佳的选择:“对于大多数希望利用 AI 而非推动 AI 市场发展的企业来说,规避风险,利用现有的 AI 服务,而不是大力获取大量 AI 基础设施,是最有意义的。”

  • 人员培训:首席信息官和技术高管“需要投资于 现有员工的培训 / 技能提升,以及为已知的可有效利用的 AI 用例(如代码开发)招聘具备基本 AI 技能的新人才。他们需要让他们的技术人员、架构师和工程师试验最新的 AI 技术,以确定他们需要做出的选择。如果你能够获取大量的 AI 基础设施,那么就在这里大量投资,以建立相对于他人的竞争优势。”

  • AI 基础设施:目前 AI 加速器的需求超出供应,在未来几年内不太可能改变,因此 AI 加速器 /GPU 目前会有溢价。因此,企业可以考虑利用云服务提供商的 AI 服务。

  • 可持续性:生成式 AI 对更多能源和水资源的需求,以及其碳足迹,已经影响了一些组织实现其可持续性目标的能力。在对 AI 的需求持续增长的情况下,这种情况不太可能改变。因此首席信息官和技术高管需要从可再生能源中采购电力,并在可能的情况下采用可持续的建筑和运营实践(建筑材料的选择、施工方法、回收利用)。


参考链接:

https://www.cio.com/article/3540407/bain-warns-prepare-for-ai-chip-shortage.html

2024-09-27 14:539581

评论

发布
暂无评论
发现更多内容

网络安全之内核提权漏洞深入分析

网络安全学海

网络安全 信息安全 渗透测试 WEB安全 漏洞挖掘

Apache ShardingSphere 代码格式化实战 —— Spotless

SphereEx

Apache 数据库 开源 ShardingSphere SphereEx

资源画像,让容器资源规格的填写不再纠结

阿里巴巴云原生

阿里云 容器 云原生

R 编程语言 - 简介

海拥(haiyong.site)

R语言 4月月更

我们在讲的 Database Plus,到底能解决什么样的问题?

SphereEx

Apache 数据库 开源 ShardingSphere SphereEx

细数云上综合治理始末,华为云联创营解码企业运维之道

极客天地

linux之软连接和硬连接的区别

入门小站

Linux

在线Excel转SQL工具

入门小站

工具

参加 KubeVela 开源之夏,给你的云计算编程能力加个 Buff

阿里巴巴云原生

阿里云 云原生 开源之夏

Java面试题库答案(技术+人事)

Java架构追梦

Java java面试 后端开发 程序员面试、

多方安全计算(MPC)发展脉络及应用实践

洞见科技

数据安全 隐私计算 多方安全计算 密码学和算法

虎符Hoo即将上线现货网格交易功能

区块链前沿News

虎符交易所

RTC 科普视频丨聊聊空间音频的原理与其背后的声学原理

RTE开发者社区

RTE技术详解 空间音频

DaaS服务之分布式日志/缓存/对象存储

穿过生命散发芬芳

4月月更

浮点数-Float-Double转二进制

入门小站

工具

2022语言与智能技术竞赛再升级,推出NLP四大前沿任务

百度大脑

重学架构之电商秒杀系统

陈华英

架构实战营

多方系统集成的启示

QualityFocus

集成测试 系统集成

linux之软连接和硬连接的区别

入门小站

Linux

ECA 认证备考指南

Se7en

从概念、部署到优化,Kubernetes Ingress 网关的落地实践

阿里巴巴云原生

阿里云 Kubernetes 云原生 网关

数据库管理系统的未来是什么?

CnosDB

IoT 时序数据库 开源社区 CnosDB infra

云原生时代的搜索服务算力管理

百度Geek说

架构 云原生 后端

Selenium自动化应该避免的测试场景

FunTester

关于K8s中Service Account的一些笔记:Pod内部如何访问K8s集群

山河已无恙

k8s 4月月更

你竟不劝我坚持

QualityFocus

职业规划 职业生涯规划

制造蝴蝶飓风,微众区块链的蝶变和ESG新使命

脑极体

[Day28]-[二叉树]左叶子之和

方勇(gopher)

LeetCode 数据结构与算法

[Day29]-[数组]将一维数组转变成二维数组

方勇(gopher)

LeetCode 数据结构算法

AI芯片或面临新一轮短缺,首席信息官们如何提前布局应对?_芯片与网络_Paul Barker_InfoQ精选文章