写点什么

谷歌首创基于云的 AI 自治系统,为数据中心自动降温

  • 2018-09-06
  • 本文字数:1813 字

    阅读完需:约 6 分钟

2016 年,DeepMind 联合开发了一个人工智能驱动的推荐系统,用以提高谷歌数据中心的能源效率。现在,他们将这个系统提升到一个新的水平:在数据中心运营专家的监督之下直接让 AI 系统控制数据中心的冷却系统。这种首创的基于云的控制系统现在可以安全地为多个谷歌数据中心提供节能服务。

现实世界的很多最紧迫的问题变得越来越复杂,为它们寻求解决方案可能会让人不堪重负。在 DeepMind 和谷歌,谷歌认为,如果其能够将 AI 作为发现新知识的工具,那么就可以更容易得找到解决方案。

2016 年,谷歌联合开发了一个人工智能驱动的推荐系统,用以提高谷歌数据中心的能源效率。谷歌的想法很简单:即使是微小的改进也可以显著地节约能源,减少二氧化碳排放,从而有助于应对气候变化。

现在谷歌将这个系统提升到一个新的水平:谷歌不是通过人为的方式实现推荐系统,而是在数据中心运营专家的监督之下让谷歌的 AI 系统直接控制数据中心的冷却系统。这种首创的基于云的控制系统现在可以安全地为多个谷歌数据中心提供节能服务。

它是怎么运作的

每隔五分钟,谷歌的 AI 系统就会从数千个传感器收集数据中心冷却系统的快照,并将其输入到谷歌的深度神经网络中,用以预测不同的潜在操作的组合将如何影响未来的能源消耗。然后,AI 系统将识别出哪些操作将会最小化能量消耗,同时又能满足安全约束。这些操作被发送回数据中心,数据中心的本地控制系统负责验证和执行它们。

这个想法源于使用 AI 推荐系统的数据中心专家的反馈。他们告诉谷歌,虽然推荐系统已经为他们提供了一些新的最佳实践——例如将冷却负载分散到更多而不是更少的设备上——但实现推荐仍然需要很多的运营工作量和监督。当然,他们想知道谷歌是否可能实现在没有人工干预的情况下实现类似的节能。

谷歌很高兴地说,答案是肯定的!

专为安全和可靠性而设计

谷歌的数据中心包含数千台服务器,用于支持谷歌搜索、Gmail 和 YouTube 等热门服务。确保它们可靠高效地运行是谷歌的关键任务。谷歌从头开始设计谷歌的 AI 代理和底层控制基础设施,并时刻考虑到安全性和可靠性问题,还使用了八种不同的机制来确保系统始终按预期运行。

谷歌已经实现的一个简单方法是预估不确定性。对于每一个潜在的操作——可能有数十亿个——谷歌的 AI 代理会计算出它们的信心指数。低信心指数的操作将不予考虑。

另一种方法是进行双层验证。谷歌将根据由数据中心运维人员定义的内部安全约束列表对 AI 计算得出的最佳操作进行审查。在指令从云端发送到物理数据中心后,本地控制系统就根据自己的约束集对指令进行验证。这种冗余检查可以确保系统保持在局部约束范围内,并且运维人员可以完全控制操作边界。

最重要的是,谷歌的数据中心运维人员始终控制着局面,可以随时选择退出 AI 控制模式。在这些情况下,控制系统将无缝地从 AI 控制转移到现场规则。

可以从下图了解谷歌开发的其他安全机制:

逐渐增长的节能

谷歌的原始推荐系统有运维人员进行审查和实现操作,而谷歌新的 AI 控制系统却直接自己实现了操作。考虑到安全性和可靠性问题,谷歌有目的地将系统的优化边界限制在较窄的操作体系中,这意味着在节能方面存在风险和回报之间的折衷。

尽管只有几个月的时间,这个系统已经实现了平均约 30%的持续节能,并有了进一步的预期改进。这是因为随着时间的推移,系统会因为数据越来越多而变得更好,如下图所示。随着技术的成熟,谷歌的优化边界也将得到扩展,从而实现更高效的节能。

这张图描绘了相对于历史基线的 AI 性能趋势。性能通过通用的工业冷却能效指标(kW/ton,每吨冷却对应的能量输入)来衡量。在 9 个月时间里,谷歌的 AI 控制系统性能从 12%的改进增加到大约 30%的改进。

谷歌的 AI 控制系统正在寻找更多新颖的管理冷却的方式,这些方法甚至让数据中心运维人员感到惊讶。谷歌数据中心运维人员 Dan Fuenffinger 说:“看到 AI 学会利用冬季条件并生成比普通水更冷的水,着实令人感到惊讶,这样可以降低冷却所需的能量。随着时间的推移,人工规则不会变得更好,但 AI 却可以“。

谷歌很高兴谷歌的 AI 控制系统能够安全可靠地运行,同时始终如一地实现节能。但是,数据中心只是个开始。从长远来看,谷歌认为有可能将这项技术应用到其他工业环境,并在更大规模的范围内应对气候变化。

查看英文原文: https://de ep mind.com/blog/safety-first-ai-autonomous-data-centre-cooling-and-industrial-control/

感谢陈利鑫对本文的审校。

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2018-09-06 19:001398
用户头像

发布了 731 篇内容, 共 434.1 次阅读, 收获喜欢 1997 次。

关注

评论

发布
暂无评论
发现更多内容

Vector Magic for mac(矢量图片转换工具)

展初云

Mac 矢量图 Mac软件

什么是Vim,Vim安装

智趣匠

Mac电脑版专业矢量绘图软件 Amadine 最新激活版

mac大玩家j

Mac软件 矢量绘图软件 矢量绘图工具

音频修复增强工具:iZotope RX 10 for mac 支持M1

加油,小妞!

音频修复 iZotope RX 10

VM虚拟机安装Win11系统图文教程(附VMware13永久密钥)

Rose

Win11镜像下载 VM虚拟机破解版 VMware13永久密钥

EndNote 21 for Mac(文献管理软件)

展初云

Mac 文献管理 endnote

专业高效的视频编辑软件Premiere Pro 2023补丁激活版

胖墩儿不胖y

Mac软件 视频处理工具 视频编辑软件

创享蜀都 创力澎湃|2023鲲鹏开发者创享日·成都站成功举办

科技热闻

iOS App Store上传项目报错 缺少隐私政策网址(URL)解决方法

雪奈椰子

mac音频传输工具Loopback激活版 完美兼容macOS14系统和M芯片

Rose

mac音频编辑器 Loopback下载 Loopback激活版 Loopback Mac版

mac文件夹数据同步工具推荐 Sync Folders Pro中文最新版

胖墩儿不胖y

Mac软件 文件同步工具 文件备份同步

【最新破解秘钥】Vectorworks 2023 Mac必备3D建筑设计软件

Rose

3D建筑设计软件 Mac破解软件 Vectorworks 2023下载 Vectorworks 2023密钥

支持M1、Capture One Pro 23 Mac 「raw图像处理工具」

繁星

图像处理工具 Capture One Pro 23

免费算力部署stable-diffusion

打工人!

Stable Diffustion

Amadine for Mac 矢量图设计工具 完美兼容M1

彩云

矢量图设计 Amadine下载

「支持M1/M2」Topaz Video AI for mac 4.0.3

加油,小妞!

Topaz Video AI 视频增强修复工具

Mac电脑专业PHP集成开发推荐:PhpStorm 2023注册码激活版

mac大玩家j

php 开发工具 Mac软件

Vert.x 教程 (三):Vertx 应用的Operation

Kevin_913

Linux网络、进程详解。

百度搜索:蓝易云

云计算 Linux 运维 云服务器 ECS

【强推】苹果Mac电脑后期处理软件,打造极致的

Rose

Mac破解软件 后期特效软件有哪些 Mac特效制作工具 视频剪辑Mac版

OmniGraffle Pro 图表绘制工具 附 注册机 支持M1

繁星

OmniGraffle Pro 图表绘制

制造行业数字化运维破局之道

云智慧AIOps社区

提升团队合作效率,这10款可视化协作软件值得拥有!

彭宏豪95

团队协作 软件推荐 科技 在线白板 协同办公软件

支持m1、IntelliJ IDEA 2023.2.4 Mac中文版 附 注册码

彩云

IntelliJ IDEA 2023最新 IntelliJ IDEA 2023

CodeWhisperer 的使用心得

亚马逊云科技 (Amazon Web Services)

Python 包管理器入门指南

小万哥

Python 程序员 软件 后端 开发

苹果mac电脑GoLand 2023 注册码最新 GoLand 2023 中文下载「支持m1 m2」

Rose

Go 语言 GoLand 2023破解版 GoLand 2023注册码

Maya 2024 for Mac(3D图形软件)

展初云

maya Mac软件 玛雅 3D图形

免费算力部署ChatGLM3-6B大语言模型

打工人!

大模型

Ubuntu22.04系统搭建环境编译AOSP?

百度搜索:蓝易云

android Linux ubuntu 运维 AOSP

Golang微服务框架居然可以开发单体应用?—— Kratos单体架构实践

喵个咪

golang 微服务架构 单体架构 Kratos #微服务

谷歌首创基于云的AI自治系统,为数据中心自动降温_AI&大模型_DeepMind_InfoQ精选文章