写点什么

小米资源画像体系构建与业务实践 | QCon 北京

  • 2025-04-01
    北京
  • 本文字数:1363 字

    阅读完需:约 4 分钟

大小:726.09K时长:04:07
小米资源画像体系构建与业务实践 | QCon北京

2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将汇聚全球 140+ 技术先行者及创新实践者,直击行业痛点,解锁可复制的经验与模式。这不仅是一场会议,更是一次对技术演进的集体探索。无论你是资深开发者,还是技术管理者,都能在这里有所收获,为下一步的技术决策提供方向。


小米高级云原生研发工程师李洋已确认出席并发表题为《小米资源画像体系构建与业务实践》的主题分享。在 Kubernetes(简称 K8s)场景中,很多原生包括扩展的策略都是依托于不同维度的资源数据进行开发的,可以理解为资源数据是最能直接影响到策略结果的因素之一。然而无论是小到容器,还是大到集群,都拥有各自独特的资源属性,不能一概而论。但在通用型场景下,也不能重复造轮子。


资源画像,就是朝着 K8s 中最根本的资源方向,对不同类型的负载分层分类的刻画出更高维度的聚合数据,用数据丰富上游各种维度策略或提升现有策略准确性,从而解决“稳定性”、“交付”和“成本”等场景中的实际问题。本次分享将介绍小米内部在资源画像方面的实践,以及解决了哪些业务场景问题,带来了哪些收益,希望能为大家提供一些新的思路。


李洋现任小米高级云原生研发工程师,专注于云原生技术研发与优化,此前曾就职于快手和陌陌。深度参与内部核心组件研发(如 scheduler、descheduler、volcano、vGPU、koordinator 等)。其主导的资源画像预测压缩功能累计减少 5W+CPU 资源浪费,并通过优化 HPA 扩容策略显著提升业务稳定性和资源利用率。他在本次会议的详细演讲内容如下:


演讲提纲

1. 从真实场景中分析不同维度遇到的挑战

  • 交付 &成本:资源浪费导致集群容量不足,发布“pending”,间接导致无法容纳更多的业务,导致集群资源利用率低。

  • 稳定性:静态分配调度转实时负载感知调度后仍然有单机热点问题,影响业务稳定性。

  • 稳定性:弹性扩缩滞后,业务稳定性受到影响。

2. 画像体系构建与架构设计

  • 组织阵型搭建:资源画像研发小组及基础架构的设计。

  • 画像架构设计:能力拆解、组件划分、目标一致、各司其职。

3. 业务场景实践

  • 预测 workload 申请资源压缩,减少浪费,提高利用率。

  • 预测 node 真实用量调度,减少热点,提高稳定性。

  • 预测 HPA 提前扩容,避免无效缩容,提高稳定性。

4. 总结展望

  • 总结小米在资源画像实践中的效果。

  • 探讨更多机制设计与思考。


内容亮点

  1. 很少有项目能从“资源预测”与“特征训练”等层面直接解决用户与 K8s 间的痛点问题。

  2. 贴近实际业务场景来讲解如何使用资源画像增强策略,带来收益。


听众收益

  1. 学习如何通过特征提取、预测与算法等技术,为 K8s 场景赋能。

  2. 了解小米内部如何通过资源画像解决真实业务问题。


除此之外,本次大会还策划了多模态大模型及应用AI 驱动的工程生产力面向 AI 的研发基础设施不被 AI 取代的工程师大模型赋能 AIOps云成本优化Lakehouse 架构演进越挫越勇的大前端等专题,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京现场带来前沿技术洞察和一线实践经验。


目前,所有大会演讲嘉宾已结集完毕,了解更多报名和详情信息可扫码或联系票务经理 18514549229 咨询。



为确保大会顺利举行,现诚邀志愿者加入,时长 3.5 天。可与大咖交流、获极客时间 VIP 月卡、大会演讲视频资源和证书。主办方提供午餐和交通支持。时间:4 月 9 日 13:00-4 月 12 日 18:00,地点:北京万达嘉华酒店,报名链接:https://www.infoq.cn/form/?id=2088

2025-04-01 14:005513

评论 1 条评论

发布
用户头像
沙发
2025-05-07 15:40 · 北京
回复
没有更多了

Elmedia Video Player Pro for Mac 视频播放软件 v8.19

Rose

数据飞轮:驱动企业持续增长的新引擎

松子(李博源)

数据分析 增长 #大模型

利用Kafka,实时挖掘企业数据的价值

NineData

MySQL oracle kafka NineData 数据管道

【YashanDB知识库】客户端字符集与数据库字符集兼容问题

YashanDB

yashandb 崖山数据库 yashandb知识库

声网发布 aPaaS 灵动会议:RTE + AI,打造下一代会议产品

ToB行业头条

云资源高效运维就用云管平台!

行云管家

云计算 云管平台 云资源

如何更高效传输非结构化数据?Zilliz 推出全新数据迁移服务

Zilliz

AI 数据迁移 向量数据库

【YashanDB知识库】查询YashanDB表空间使用率

YashanDB

yashandb 崖山数据库 yashandb知识库

FxFactory 8 Pro 视觉特效处理包 mac软件最新版 v8.0.18激活版

Rose

如何用Rust编写一个ChatGPT桌面应用(保姆级教程)

京东科技开发者

这样的SQL太吓人了

江南一点雨

API 蔓延问题出现的六大迹象

NGINX开源社区

读书笔记 程序员 个人成长 最佳实践 API Gateway

阿里巴巴商品详情API返回值中的商品标签与关键词

技术冰糖葫芦

api 货币化 API 接口 API 测试 pinduoduo API

NLP技术在营业选址中的实践与探索

鲸品堂

大模型 企业号2024年9月PK榜

微信技术总监谈架构:微信之道——大道至简(演讲全文)

JackJiang

即时通讯;IM;网络编程

Native SQLite Manager v1.28.1 Mac极简SQLite数据库管理器

Rose

USBclean for Mac(USB专杀工具)v4.0激活版

Rose

美团VS饿了么,到底谁更胜一筹?

王中阳Go

美团 面经 饿了么 面试问题

【YashanDB知识库】如何配置jdbc驱动使getDatabaseProductName()返回Oracle

YashanDB

yashandb 崖山数据库 yashandb知识库

三明市等保测评机构有几家?在哪里?

行云管家

等保 等保测评 三明企业

【YashanDB知识库】YAS-04110 invalid variant name

YashanDB

yashandb 崖山数据库 yashandb知识库

支持离线模式:iOS 移动应用程序的关键策略和优势

哦豁完蛋了

ios

基于Sentinel自研组件的系统限流、降级、负载保护最佳实践探索

京东科技开发者

mac苹果电脑奈飞客户端:Netflix Mac 激活版

你的猪会飞吗

Netflix Mac激活版 Netflix客户端 Netflix mac版破解版下载

智源研究院与百度达成战略合作 共建AI产研协同生态

智源研究院

小米资源画像体系构建与业务实践 | QCon北京_架构_QCon全球软件开发大会_InfoQ精选文章