【AICon】AI 基础设施、LLM运维、大模型训练与推理,一场会议,全方位涵盖! >>> 了解详情
写点什么

华为发布 2024 数据中心能源十大趋势

华为数字能源

  • 2024-01-15
    北京
  • 本文字数:2459 字

    阅读完需:约 8 分钟

大小:1.30M时长:07:34
华为发布2024数据中心能源十大趋势

1 月 15 日,华为举办 2024 数据中心能源十大趋势发布会并发布《白皮书》。发布会上,华为数据中心能源领域总裁尧权定义未来数据中心的三大特征:安全可靠、融合极简、低碳绿色,并分享数据中心在部件、产品、系统和架构方面的技术演进趋势。


尧权表示,AI 大模型时代,未来 5 年全球 AI 算力年复合增长率超过 80%,数据中心逐步从云数据中心向云+智算中心演进。


据 Uptime 权威数据,从 2019 年到 2022 年,数据中心业务中断损失超过 10 万美金的比例,已经从 39%上升至 71%,且会随着算力需求翻番成倍增长。毫无疑问,安全可靠是数据中心最核心需求,应始终作为最高优先级关注。


趋势 1:高可靠产品+专业化服务是保障数据中心安全可靠运行的关键


数据中心承载海量数据的存储、处理和传输,为千行百业坚定运行提供保障,而数据中心的安全性、可靠性一直是较薄弱的环节。为确保数据中心的安全可靠运行,在产品设计、生产环节就要贯穿“全链安全”的理念,同时严控产线质量,高度自动化,减少人为干预,保障产品自身的高可靠性。此外,要大胆假设,充分考虑产品出现问题后的应对措施,通过提供专业化部署和运维服务,降低产品失效率,最小化灾后影响,完善端到端的保障机制,双管齐下保障数据中心安全可靠运行。


趋势 2:分布式制冷架构将成为温控安全的更优选择


传统大型数据中心多采用集中式制冷架构的方案,如传统冷冻水系统,冷冻站中涉及七大子系统和几十种设备,各设备之间不能独立运行,一旦发生单点故障,可能会影响整个冷冻站的安全运行,导致数据中心大规模宕机,近年来业内部分数据中心安全事故也说明集中式制冷架构存在单点故障的风险。相较之下,分布式制冷架构灵活,各个子系统相互独立,单台设备故障不会影响其他设备运行,故障域更小,可靠性更高,可以直接从架构设计上避免数据中心制冷系统的单点故障,提升数据中心的运行可靠性。


趋势 3:预测性维护将成为数据中心基础设施的标配


数据中心的维护往往是事后型,发生事故后才知道问题所在,但随着智算时代的到来,数据中心的故障响应时间大幅缩短。未来数据中心基础设施的运维,预测性维护将成为标配,从事后型转为事前型。得益于 AI 技术的快速发展,预测性维护的范围将持续扩大,从电容、风扇等易损件的寿命预测、设备的热失控预警到制冷系统的漏液预警,都能提前预测,提前处理避免事故的发生,做到“治未病”,从被动“救火”走向主动“防火”,在运维方面大幅提升数据中心可靠性。


趋势 4:全生命周期的网络安全防护体系将成为数据中心基础设施的保护盾


随着数字化、智能化程度的加深,网络安全风险也在成倍增加,网络攻击越来越常态化。不管是 UPS 还是空调设备,一旦遭遇恶意攻击,都会直接影响数据中心安全可靠性。未来数据中心基础设施,硬件安全加软件安全,才是全方位的安全,软件安全要从供应安全、纵深防御和运维/运营安全三个维度,构筑全生命周期网络安全防护体系,为数据中心的安全可靠运行保驾护航。


趋势 5:预制化、模块化将成为高质量快速交付的最佳选择


互联网云厂商全球业务加速发展,带动数据中心建设需求显著增长。而传统的数据中心建设模式,建设速度慢,工程复杂,不能满足快速部署的要求。因此,建设周期更短、质量更高的预制化、模块化方案将成为首选。通过“工程产品化”和“产品模块化”,在工厂一体化集成,完成预制和预调试,保证现场交付的是高质量产品,有效缩短交付周期,同时满足客户业务快速上线需求,还大幅减少现场施工造成的“三废”垃圾。


趋势 6:专业化管理平台让数据中心运维更安全、更高效


从千柜级建筑到万柜级园区,数据中心呈现规模化、集约化发展趋势,相应的整体运维复杂度也大幅提升,且数据中心设备多为“哑”设备,依赖传统巡检难度大,对技能的要求较高,故障定位时间长。构建专业化的管理平台,可以显著提升数据中心运维效率和准确性,通过原厂的专业化管理平台,帮助客户构建设备深度管理能力,大大降低运维难度,做到快速判断问题,及时排除故障,确保数据中心安全稳定运行。


趋势 7:风液融合将成为业务需求不确定场景下的优选架构


当前正处于通用算力和智能算力的过渡期,同一个数据中心会同时存在通用算力和智能算力场景。通用服务器单柜功率密度一般不超过 15kW,风冷型设备即可满足制冷需求,而智算中心单柜功率密度通常超过 30kW,这种场景往往需要液冷来散热。对于需求不确定的业务场景,风液融合将成为适配未来演进的数据中心优选架构,通过风冷+液冷的组合和比例可调,灵活适应业务需求变化,保护用户投资。


趋势 8:间接蒸发冷依然是现在和未来最优的制冷方案


当前风冷方案仍占据主流应用场景,在冷源侧,间接蒸发冷却方案相较冷冻水系统,在架构、效率和运维方面存在明显优势,是现在和未来最经济适用的制冷方案。间接蒸发冷却的分布式制冷架构可有效避免单点故障,可靠性更高;并且通过最大化利用自然冷源,仅需一次热交换,在寒冷地区绝大部分时间无需压缩机制冷,实现极致 PUE;针对智能算力需求,间接蒸发冷却支持未来演进的架构,进一步适配液冷的计算场景。


趋势 9:能效 PUE 挖潜要从关注部件高效调整为系统工程最优解


“碳中和”是全球共识和使命,传统数据中心关注提升 UPS、空调等部件效率,但受限于元器件物理限制,部件的效率提升接近瓶颈,微小改进的时间和成本远赶不上算力时代需求。因此,数据中心能效的提升要转换思路,从关注部件效率转为系统工程优化,用系统工程思维综合审视,在现实条件和部件技术水平进行权衡,得出最优解,如 UPS 双变换模式转向 S-ECO、数据中心 PUE 转向 PFPUE(算力 PUE),端到端的进行数据中心能效优化。


趋势 10:AI 调优将成为存量 DC 能效智能优化的最佳选择


在数据中心节能方面,除了新建的数据中心,仍有大量存量数据中心 PUE 远高于“国家一体化大数据中心”政策要求,面临节能改造的迫切需求。传统的节能改造需要停线停业务,存在业务中断的风险,而采用人工调整优化的方式,难度大,效果差,频率低。相较之下,AI 能效调优解决方案通过预置 AI 算法和大数据模型,可对存量数据中心实现节能优化,且 AI 调优不依赖人工经验,优化速度快,效果好,实现从“制冷”到“智冷”的转变。



2024-01-15 18:325252

评论

发布
暂无评论
发现更多内容

60岁代码匠的几篇小作文,解决了大多数程序的迷茫(上)

图灵社区

java 编程

深入解析Apache Pulsar系列: Broker消息确认的管理

博文视点Broadview

这8个JS 新功能,你应该去尝试一下

华为云开发者联盟

JavaScript 前端 开发 索引 开发语言

数据安全是指什么?有什么意义?

行云管家

防火墙 信息安全 数据安全 堡垒机

17 Prometheus之服务发现介绍

穿过生命散发芬芳

Prometheus 1月月更

实战 MongoDB Aggregate

PingCode研发中心

mongo pipeline Expression

LeetCode 每日一题 No.1220 统计元音字母序列的数目

DawnMagnet

rust LeetCode 力扣

改进企业CRM系统实施的方法

低代码小观

企业管理 CRM 企业管理系统 CRM系统 企业管理工具

在字节,A/B 实验是这么做的!

字节跳动数据平台

大数据 字节跳动 AB testing实战 ab测试

【网络安全】2022年第一次靶场渗透实战学习

H

网络安全 渗透测试

恒源云(GPUSHARE)_实例关机后如何操作迁移?

恒源云

gpu 运维 实例

60岁代码匠的几篇小作文,解决了大多数程序的迷茫(下)

图灵社区

java 编程

iOS——解密RunLoop原理

iOSer

ios iOS面试 ios开发 RunLoop

推动数字化人才发展|奈学科技CEO孙玄受邀出席2022年CXO领导力峰会

科技热闻

2022年RPA行业发展十大趋势,六千字长文助你看懂RPA

王吉伟频道

RPA 机器人流程自动化 RPAaaS 超自动化 自动化优先

前端开发之Vue事件修饰符和按键修饰符

@零度

Vue 前端开发

阿里云视频云「 vPaaS 」演绎了怎样的音视频应用开发「未来图景」?

阿里云视频云

阿里云 音视频 低代码 低代码开发平台 视频云

物联网场景中灵活实施对设备的控制管理

亚马逊云科技 (Amazon Web Services)

analytics

IT运维人员日常工作包含哪些?核心任务是什么?工作量多吗?

行云管家

运维 IT运维 服务器运维

建木持续集成平台v2.2.0发布

Jianmu

开源 持续集成 CI/CD

带你玩转Flink流批一体分布式实时处理引擎

华为云开发者联盟

flink 分布式 实时计算 批处理 流处理框架

复盘和反思一个被全公司邮件通报的漏测

LynnYang

测试 Postman Mock

Linux下玩转nginx系列(一)——初识nginx及其使用入门

anyRTC开发者

nginx Linux 音视频 WebRTC 服务器

第二节:SpingBoot单元测试

入门小站

java 编程

Flink是如何支持批流一体的

编程江湖

flink

4 种高速安全混合云解决方案,助力您的云迁移之旅!

亚马逊云科技 (Amazon Web Services)

网络

java开发之Redis数据结构

@零度

redis JAVA开发

手把手教程|通过部署 Apache Superset 实现 Amazon S3 的数据可视化

亚马逊云科技 (Amazon Web Services)

analytics

无服务器应用DevOps最新实践(内附完整演讲+视频)

亚马逊云科技 (Amazon Web Services)

计算

都2022年了,你的前端工具集应该有vueuse

华为云开发者联盟

Vue 前端 API 工具集 vueuse

大数据平台中的企业级数仓建设

五分钟学大数据

数据仓库 1月月更

华为发布2024数据中心能源十大趋势_华为_InfoQ精选文章