写点什么

好未来云上资源效能优化实践 | QCon 北京

  • 2025-03-31
    北京
  • 本文字数:1384 字

    阅读完需:约 5 分钟

大小:742.97K时长:04:13
好未来云上资源效能优化实践 | QCon北京

2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将汇聚全球 140+ 技术先行者及创新实践者,直击行业痛点,解锁可复制的经验与模式。这不仅是一场会议,更是一次对技术演进的集体探索。无论你是资深开发者,还是技术管理者,都能在这里有所收获,为下一步的技术决策提供方向。


好未来基础服务中台负责人李明辉已确认出席并发表题为《好未来云上资源效能优化实践》的主题分享。在云原生与 AI 浪潮下,云的资源扩展能力和使用便捷性让企业能够更加专注于业务创新,同时,如何用好云也成为大家持续探索的课题,特别是上云之后面临成本失控的风险,包括云产品品类多而杂、多云环境差异大、成本波动难分析、AI 算力成本快速增长等。本次分享将介绍好未来在云上资源效能优化方面的实践,通过搭建 FinOps 运营体系以及技术治理体系实现上亿元的成本节省。


李明辉 2010 年加入百度,2021 年进入好未来至今。目前担任好未来基础服务中台负责人,负责集团高可用能力建设、成本优化,基础设施和业务运维,基础架构组件及平台产品研发。他在本次会议的详细演讲内容如下:


演讲提纲

1. 好未来云资源布局

2. 云成本治理面临的挑战

  • 多云异构管理难题

  • 资源冗余与高可用矛盾

  • AI 算力需求激增

3. FinOps 运营体系搭建

  • 成本分摊与归因机制

  • 自动化治理空间分析

  • 基于业务 ROI 的指标体系

4. 资源效能优化的技术方案

  • 精细化弹性容量管理

  • 多云布局调优

  • AI 算力成本优化、训推、异构混部等

5. 总结与展望


您认为,这样的技术在实践过程中有哪些痛点?

  • 多云环境的异构性使得统一纳管和成本分析难度大幅增加,特别是在使用的云产品品类众多的情况下,很难有效的发现和识别不合理的云成本支出,也无法解释云账单波动

  • 云资源使用的灵活性是一把双刃剑,高可用和资源冗余之间的冲突在一定程度上会被放大,如果无法说清楚不同业务场景下云资源投入产出目标,具体的技术治理策略很难落实

  • 生成式大模型的发展推动 AI 算力需求激增,AI 算力成本快速增长,既要快速迭代,又要确保成本可控,而分布式训练和推理架构的复杂性推高了算力成本优化的门槛


演讲亮点

  • 多云架构下的 FinOps 运营体系建设方案,实现集团各业务在多云的成本分摊和波动分析;基于不同云产品特性实现自动化的治理空间分析与用云策略建议

  • 建立围绕业务资源效能的北极星指标体系,转变问题视角,从成本问题到业务投入产出问题;通过设计精细化的弹性容量管理方案、多云布局调优等实现降本增效

  • 基于内部 AI 算力成本治理的实践,包括训推服务的算力调度、负载均衡及异构混部等方案,提升算力资源的综合使用效率

听众收益

  • 可以帮助相关从业人员了解或学习云成本优化的主要技术方案,并在日常工作中进行运用


除此之外,本次大会还策划了多模态大模型及应用AI 驱动的工程生产力面向 AI 的研发基础设施不被 AI 取代的工程师大模型赋能 AIOps云成本优化Lakehouse 架构演进越挫越勇的大前端等专题,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京现场带来前沿技术洞察和一线实践经验。


目前,所有大会演讲嘉宾已结集完毕,了解更多报名和详情信息可扫码或联系票务经理 18514549229 咨询。



为确保大会顺利举行,现诚邀志愿者加入,时长 3.5 天。可与大咖交流、获极客时间 VIP 月卡、大会演讲视频资源和证书。主办方提供午餐和交通支持。时间:4 月 9 日 13:00-4 月 12 日 18:00,地点:北京万达嘉华酒店,报名链接:https://www.infoq.cn/form/?id=2088

2025-03-31 17:004692

评论

发布
暂无评论

MIAOYUN获评“2023年度一云多芯稳定安全运行优秀案例”

MIAOYUN

解决方案 信创 中国信通院 信创云 可信云大会

站在营销的角度浅谈直播行业

山东布谷网络科技

直播 直播app 直播APP源码

软件测试 | mysqlhotcopy(MyISAM表热备份工具)

测吧(北京)科技有限公司

测试

直击运维痛点,大数据计算引擎 EasyMR 的监控告警设计优化之路

袋鼠云数栈

监控 监控告警

基于低代码平台快速搭建应用

互联网工科生

低代码 低代码开发 JNPF java低代码开发平台

使用低代码平台提高生产力

树上有只程序猿

低代码 生产力 全栈开发 JNPF

如何为物联网设备注入“华为云+鸿蒙DNA”?

华为云开发者联盟

云计算 后端 华为云 华为云开发者联盟 企业号 8 月 PK 榜

软件测试 | 日志的删除

测吧(北京)科技有限公司

测试

如何解决大量小文件传输慢的问题

镭速

小文件传输

平台工程社区:与全球 2w+ 早期实践者同行

杨振涛

DevOps 云原生 社区 平台工程 平台工程师

GPTCache 悬赏令!寻找最佳捉虫猎手,豪华赏格等你来拿!

Zilliz

Zilliz AIGC ChatGPT LLM gptcache

如何通过Python线程池实现异步编程?

互联网工科生

Python 线程池

LeetCode题解:剑指 Offer 56 - I. 数组中数字出现的次数,哈希表,JavaScript,详细注释

Lee Chen

JavaScript LeetCode

安全文件传输的重要性及其对企业的影响

镭速

文件传输

利用文心千帆打造一个属于自己的小师爷

为自己带盐

大语言模型 文心千帆

【十万个等保小知识】等保测评报告是在等保整改之后发吗?

行云管家

等保 等级保护 等保测评 等保整改

代码随想录Day36 - 贪心算法(五)

jjn0703

定档!WAVE SUMMIT 2023@全球开发者,8月16日北京见!

飞桨PaddlePaddle

人工智能 百度 paddle 飞桨 百度飞桨

saas堡垒机定义以及优势简单说明-行云管家

行云管家

SaaS 堡垒机 saas堡垒机

校源行|开放原子开源社团(山东大学)授牌仪式隆重举行

开放原子开源基金会

开源 山东大学

校源行 | 2023年开放原子校源行开源大使培训圆满结束,考试时间正式公布

开放原子开源基金会

开源

AI+游戏,内容生产力的又一次变革

澳鹏Appen

人工智能 AR vr 生成式AI 游戏AI

作为CTO,我真正想要的可观测性平台

JainChen

开发者 监控 可观测性

让数据管理由繁至简的低代码开发平台

力软低代码开发平台

第二期开源答题挑战,看看你是什么级别吧!

开放原子开源基金会

开源 挑战 答题

软件测试 | mysqlshow(数据库对象查看工具)

测吧(北京)科技有限公司

测试

铜锁 SM2 算法性能优化实践(二)|快速模约减算法实现

铜锁开源密码库

开源 开发者 算法 同态加密 密码学

首期"源规律"开源公益课程正式上线

开放原子开源基金会

开源 合规 法律法规

DLRover 在 K8s 上千卡级大模型训练稳定性保障的技术实践

AI Infra

人工智能 开源 AI 开发者 kubernetes 运维

好未来云上资源效能优化实践 | QCon北京_云计算_QCon全球软件开发大会_InfoQ精选文章