写点什么

云上百万大数据任务的自动优化实践|QCon 北京

  • 2025-03-31
    北京
  • 本文字数:1302 字

    阅读完需:约 4 分钟

大小:701.20K时长:03:59
云上百万大数据任务的自动优化实践|QCon 北京

2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将汇聚全球 140+ 技术先行者及创新实践者,直击行业痛点,解锁可复制的经验与模式。这不仅是一场会议,更是一次对技术演进的集体探索。无论你是资深开发者,还是技术管理者,都能在这里有所收获,为下一步的技术决策提供方向。


贝联珠贯大数据技术负责人杨少华已确认出席并发表题为《云上百万大数据任务的自动优化实践》的主题分享。近年来降本增效成为许多公司技术团队的重要工作方向,特别是上云后,云的便利性同时带来云开支的不可控,如何有效控制云开支成为上云后大家需要面临的问题。而在 IT 成本组成上,大数据相关基础设施的成本占不小比例,不少公司甚至超过一半以上。本演讲将分享贝联珠贯在开源大数据平台成本优化方面的技术实践。通过大数据任务参数动态优化、自动引擎升级以及 SQL 优化等自动优化手段,对数十家客户超过百万的大数据任务进行优化,节省了超过 500TB 内存和 15 万 CPU 核的计算资源。



杨少华毕业于哈工大本科、中科院计算所博士,2009 年毕业后加入阿里云,是阿里大数据平台(ODPS/MaxCompute)的主要创始成员,负责过 SQL、MapReduce 和 Graph 等分布式计算引擎的研发,以及平台稳定性保障和对外生态与输出,曾负责把阿里大数据集群利用率提升至 70% 以上。 之后从阿里离开先后加入知名创业公司浙江执御和哈啰出行,分别负责数据平台和算法平台的研发工作,是前哈啰出行软件技术首席架构师。现为 Finops 领域领先的技术公司贝联珠贯的合伙人、大数据产品技术负责人。他在本次会议的详细演讲内容如下:


演讲提纲

1. 问题与背景

2. 云上大数据平台成本优化的技术挑战

3. 优化方案:大数据任务参数动态优化

4. 优化方案:自动引擎升级

5. 优化方案:自动 SQL 优化

6. 实践案例分享

7. 总结与展望


您认为,这样的技术在实践过程中有哪些痛点?

  • 任务动态参数优化是一种基于历史数据的优化技术,适用于具有周期性的大数据任务(如天级/小时级任务),随机的 Adhoc 查询缺乏历史实例,则无法适用此项优化技术

  • 客户对生产稳定性极为看重,优化实施过程中需要有一套稳定性保障机制,确保不因为优化实施导致任务异常


演讲亮点

  • 优化收益明显,大部分实施案例可节省资源 30% 以上

  • 全自动任务优化,极小人力投入成本

  • 实施成本低,任务参数动态优化和自动引擎升级,零业务代码变更


听众收益

  • 可以帮助相关从业人员了解或学习大数据平台成本优化的主要技术方案,并在日常工作中进行运用


除此之外,本次大会还策划了多模态大模型及应用AI 驱动的工程生产力面向 AI 的研发基础设施不被 AI 取代的工程师大模型赋能 AIOps云成本优化Lakehouse 架构演进越挫越勇的大前端等专题,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京现场带来前沿技术洞察和一线实践经验。


目前,所有大会演讲嘉宾已结集完毕,了解更多报名和详情信息可扫码或联系票务经理 18514549229 咨询。



为确保大会顺利举行,现诚邀志愿者加入,时长 3.5 天。可与大咖交流、获极客时间 VIP 月卡、大会演讲视频资源和证书。主办方提供午餐和交通支持。时间:4 月 9 日 13:00-4 月 12 日 18:00,地点:北京万达嘉华酒店,报名链接:https://www.infoq.cn/form/?id=2088

2025-03-31 10:004341

评论

发布
暂无评论

和鲸赞助!第16届中国R会议暨2023 X-AGI大会通知

ModelWhale

机器学习 R 数据科学 X-AGI 统计之都

2023-10-25:用go语言,假如某公司目前推出了N个在售的金融产品(1<=N<=100) 对于张三,用ai表示他购买了ai(0<=ai<=10^4)份额的第i个产品(1<=i<=N) 现给出K(

福大大架构师每日一题

福大大架构师每日一题

SpringBoot自动配置原理解析 | 京东物流技术团队

京东科技开发者

spring-boot 自动配置 企业号10月PK榜

实测亚马逊 AI 编程助手 Amazon CodeWhisperer

全栈若城

1024 特别企划|揭秘 StarRocks 社区背后的神秘力量(内涵福利)

StarRocks

开源社区 StarRocks

开放原子开源基金会联合主办的2023 CCF中国开源大会正式开幕

开放原子开源基金会

开源 CCF

语雀服务宕机带来的稳定性思考

老张

高可用 SRE 稳定性保障

英特尔以创新边缘AI技术赋能未来智慧城市建设

E科讯

HarmonyOS SDK,赋能开发者实现更具象、个性化开发诉求

HarmonyOS SDK

鸿蒙 HarmonyOS

用友BIP,为打造世界一流光伏数智灯塔工厂聚势蓄能

用友BIP

光伏产业

支付宝权限问题大全|一文搞定,持续更新

盐焗代码虾

支付宝 经验分享 支付宝权限

唱衰PHP?这些言论别太离谱~《PHP综合现状分析报告》来了

禅道项目管理

php

装备修理行业数智化转型之道

用友BIP

装备修理行业

跨国企业如何选择跨境数据传输平台,了解这篇就够了

镭速

跨境数据传输

ETL工具与数据处理的关系

谷云科技RestCloud

数据处理 ETL

用友BIP智能分析资产包正式发布,助力企业智能化决策!

用友BIP

智能分析

介绍SDK(C++版)使用方法

矩视智能

深度学习 机器视觉

实况窗功能上线,即时掌握活动最新进展

HarmonyOS SDK

HarmonyOS

数智化浪潮中,广电行业收入管理流程该如何重构?

用友BIP

广电行业

一文了解企业云盘和大文件传输哪个更适合企业传输

镭速

大文件传输

TuGraph Analytics图建模研发:为图计算业务提速增效

TuGraphAnalytics

分布式 图计算 图平台 图研发 图运维

语音识别技术在医疗健康领域的应用与挑战

数据堂

用友全球司库十问(五)| 企业如何主动管理资金流动性?

用友BIP

全球司库 流动性管理

开放原子开源基金会理事长孙文龙一行赴拓维信息参观交流

开放原子开源基金会

开源

2023 CCF中国开源大会「开放科学——引领未来科学研究发展的新范式分论坛」成功举办

开放原子开源基金会

云图说|华为云CodeArts Build,云端化的编译构建平台

华为云开发者联盟

华为云 华为云开发者联盟 编译构建

云上百万大数据任务的自动优化实践|QCon 北京_大数据_QCon全球软件开发大会_InfoQ精选文章