AICon 北京站 Keynote 亮点揭秘,想了解 Agent 智能体来就对了! 了解详情
写点什么

小红书 FinOps 实践:云成本优化与资源效率提升之道 |QCon 北京

  • 2025-03-31
    北京
  • 本文字数:1426 字

    阅读完需:约 5 分钟

大小:764.90K时长:04:21
小红书 FinOps 实践:云成本优化与资源效率提升之道 |QCon北京

2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将汇聚全球 140+ 技术先行者及创新实践者,直击行业痛点,解锁可复制的经验与模式。这不仅是一场会议,更是一次对技术演进的集体探索。无论你是资深开发者,还是技术管理者,都能在这里有所收获,为下一步的技术决策提供方向。


小红书混合云资源管理负责人梁啟成已确认出席并发表题为《小红书 FinOps 实践:云成本优化与资源效率提升之道》的主题分享。眼下,云计算已成为众多互联网企业支撑业务运行的关键基础设施,然而云计算的便利性和灵活性也带来了一系列资源成本管理挑战,包括成本增速过快、成本归属不清晰、缺乏有效成本控制手段、对云厂商高度依赖等。本次分享将重点介绍小红书的 FinOps 实践经验,并通过技术优化手段提升资源使用效率,每年节省数亿成本。


梁啟成多年 IT 资源管理与成本优化经验,曾深度参与头部互联网企业上云、大规模在离线业务混部,并持续推进业财一体化以及精细化的混合云资源成本管理,2024 年参与了信通院《IT 基础设施资源运营成熟度模型》标准制定,是 FinOps 文化的践行者。他在本次会议的详细演讲内容如下:


演讲提纲

1. 小红书用云概述

2. 成本优化面临的问题与挑战

  • 分摊云成本与实际资源用量存在偏差

  • 资源规模不断增长但利用效率持续低下

  • 大模型的部署与运行成本高昂

3. 成本洞察与优化实践

  • 技术商品化实现内外账分离

  • 大 Node 小 Pod 策略下的在线业务混部

  • 工作负载性能瓶颈分析

  • 机型收敛与 RightSizing

  • 内容大模型的降本增效

  • 多维并行提升训练效率

  • 量化蒸馏压缩模型大小

  • 算子优化提升推理速度

4. 总结与展望


这样的技术在实践过程中有哪些痛点?

  • 常规按比例分账方法能帮助测算出各业务部门的资源成本费用,但不一定能解释清楚其背后的量价对应关系,进而影响了技术优化方向判断

  • 云厂商硬件经过虚拟化后,不同规格大小虚拟机会存在跨 numa、共用一个 Socket 产生干扰,进而表现出内存性能差、业务 CPU 使用率明显分层、服务 RT 抖动明显等问题,云上客户不得不开通更多资源降低容量水位来保证在线服务不受损,最终造成了成本浪费

  • 高昂的训练和推理成本、高硬件需求、资源利用效率低下,这些问题限制了内容大模型的广泛应用和普及,需要通过技术创新和优化策略来解决


演讲亮点

  • 重点聚焦于建立清晰、透明的成本洞察机制以及配套系统能力建设,尝试分别从买卖家视角梳理清楚各自团队的资源用量、技术成本支出以及收入情况

  • 看清、看准、分析出系统关键性能瓶颈,通过机型迭代、内核优化等措施确保各业务具备将 CPU 跑高的能力,进而执行缩容退机操作达到降低成本的目标

  • 分别从数据、训练、压缩、推理等方面介绍小红书对于内容大模型的降本增效实践

听众收益

  • 可以帮助相关从业人员了解或学习云成本优化的主要技术方案,并在日常工作中进行运用


除此之外,本次大会还策划了多模态大模型及应用AI 驱动的工程生产力面向 AI 的研发基础设施不被 AI 取代的工程师大模型赋能 AIOps云成本优化Lakehouse 架构演进越挫越勇的大前端等专题,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京现场带来前沿技术洞察和一线实践经验。

目前,所有大会演讲嘉宾已结集完毕,了解更多报名和详情信息可扫码或联系票务经理 18514549229 咨询。



为确保大会顺利举行,现诚邀志愿者加入,时长 3.5 天。可与大咖交流、获极客时间 VIP 月卡、大会演讲视频资源和证书。主办方提供午餐和交通支持。时间:4 月 9 日 13:00-4 月 12 日 18:00,地点:北京万达嘉华酒店,报名链接:https://www.infoq.cn/form/?id=2088

2025-03-31 14:004324

评论

发布
暂无评论

每日一题:LeetCode-128. 最长连续序列

Geek_4z9ami

Go 面试 算法 数组 LeetCode

如何使用凹凸贴图和位移贴图制作逼真的模型

3D建模设计

WebGL 3D渲染 three.js 材质编辑 材质纹理贴图

如何思考软件工程师与AI的共存发展

Onegun

AI 工程师 AI编程

敏捷:应对软件定义汽车时代的开发模式变革

DevOps和数字孪生

软件定义汽车

软件开发

Geek_8da502

探索在线教育流量从小程序中挖掘

Onegun

小程序 在线教育 在线学习

数据库内核那些事|PolarDB HTAP Serverless:打造经济易用的实时分析系统

阿里云瑶池数据库

数据库 阿里云 Serverless 云原生

抢占式批任务分配设计

Windows 平台下如何安装与配置 MySQL 5.7.36

小魏写代码

java浅拷贝BeanUtils.copyProperties引发的RPC异常 | 京东物流技术团队

京东科技开发者

万字带你熟悉静态分析工具的评估测试

华为云开发者联盟

后端 软件开发 华为云 华为云开发者联盟

华为、海信、TCL、CEC等龙头企业齐聚“2024深圳电子展会”

AIOTE智博会

电子展 深圳电子展 电子信息展 电博会

GLB模型的热门行业用例

3D建模设计

WebGL 3D渲染 three.js 材质编辑 材质纹理贴图

Next Station of Flink CDC

Apache Flink

大数据 flink 实时计算

3D换肤在服装行业的应用

3D建模设计

WebGL 3D渲染 three.js 材质编辑 材质纹理贴图

BRC-20铭文代币合约质押挖矿系统开发

l8l259l3365

获得JD商品评论 API 如何实现实时数据获取

Noah

开卷有益,思想有力:华为阅读发布2023年度榜单

最新动态

淘宝店铺所有商品数据接口(Taobao.item_search_shop)

tbapi

淘宝API接口 淘宝店铺所有商品数据接口 淘宝商品数据接口 淘宝整站商品数据接口 淘宝店铺商品接口

深度探讨全链路测试:定义、特点及与其他测试方法的对比

Apifox

测试 单元测试 自动化测试 全链路测试 测试工具

人工智能的局限性与期望管理:理解’人工智障’的瞬间

人工智能

精彩回顾|【ACDU 中国行·西安站】数据库主题交流活动成功举办!

墨天轮

数据库 postgresql opengauss oceanbase KaiwuDB

软件测试/测试开发丨应该如何设计测试方案

测试人

软件测试 测试开发

OpenHarmony城市技术论坛武汉站:探索大模型时代的终端操作系统创新

科技热闻

记一次kubernetes获取internal Ip错误流程

华为云开发者联盟

后端 开发 华为云 华为云开发者联盟

软件开发

Geek_8da502

Skia 编译及踩坑实践

京东科技开发者

小红书 FinOps 实践:云成本优化与资源效率提升之道 |QCon北京_云计算_QCon全球软件开发大会_InfoQ精选文章