2025上半年,最新 AI实践都在这!20+ 应用案例,任听一场议题就值回票价 了解详情
写点什么

云上百万大数据任务的自动优化实践|QCon 北京

  • 2025-03-31
    北京
  • 本文字数:1302 字

    阅读完需:约 4 分钟

大小:701.20K时长:03:59
云上百万大数据任务的自动优化实践|QCon 北京

2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将汇聚全球 140+ 技术先行者及创新实践者,直击行业痛点,解锁可复制的经验与模式。这不仅是一场会议,更是一次对技术演进的集体探索。无论你是资深开发者,还是技术管理者,都能在这里有所收获,为下一步的技术决策提供方向。


贝联珠贯大数据技术负责人杨少华已确认出席并发表题为《云上百万大数据任务的自动优化实践》的主题分享。近年来降本增效成为许多公司技术团队的重要工作方向,特别是上云后,云的便利性同时带来云开支的不可控,如何有效控制云开支成为上云后大家需要面临的问题。而在 IT 成本组成上,大数据相关基础设施的成本占不小比例,不少公司甚至超过一半以上。本演讲将分享贝联珠贯在开源大数据平台成本优化方面的技术实践。通过大数据任务参数动态优化、自动引擎升级以及 SQL 优化等自动优化手段,对数十家客户超过百万的大数据任务进行优化,节省了超过 500TB 内存和 15 万 CPU 核的计算资源。



杨少华毕业于哈工大本科、中科院计算所博士,2009 年毕业后加入阿里云,是阿里大数据平台(ODPS/MaxCompute)的主要创始成员,负责过 SQL、MapReduce 和 Graph 等分布式计算引擎的研发,以及平台稳定性保障和对外生态与输出,曾负责把阿里大数据集群利用率提升至 70% 以上。 之后从阿里离开先后加入知名创业公司浙江执御和哈啰出行,分别负责数据平台和算法平台的研发工作,是前哈啰出行软件技术首席架构师。现为 Finops 领域领先的技术公司贝联珠贯的合伙人、大数据产品技术负责人。他在本次会议的详细演讲内容如下:


演讲提纲

1. 问题与背景

2. 云上大数据平台成本优化的技术挑战

3. 优化方案:大数据任务参数动态优化

4. 优化方案:自动引擎升级

5. 优化方案:自动 SQL 优化

6. 实践案例分享

7. 总结与展望


您认为,这样的技术在实践过程中有哪些痛点?

  • 任务动态参数优化是一种基于历史数据的优化技术,适用于具有周期性的大数据任务(如天级/小时级任务),随机的 Adhoc 查询缺乏历史实例,则无法适用此项优化技术

  • 客户对生产稳定性极为看重,优化实施过程中需要有一套稳定性保障机制,确保不因为优化实施导致任务异常


演讲亮点

  • 优化收益明显,大部分实施案例可节省资源 30% 以上

  • 全自动任务优化,极小人力投入成本

  • 实施成本低,任务参数动态优化和自动引擎升级,零业务代码变更


听众收益

  • 可以帮助相关从业人员了解或学习大数据平台成本优化的主要技术方案,并在日常工作中进行运用


除此之外,本次大会还策划了多模态大模型及应用AI 驱动的工程生产力面向 AI 的研发基础设施不被 AI 取代的工程师大模型赋能 AIOps云成本优化Lakehouse 架构演进越挫越勇的大前端等专题,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京现场带来前沿技术洞察和一线实践经验。


目前,所有大会演讲嘉宾已结集完毕,了解更多报名和详情信息可扫码或联系票务经理 18514549229 咨询。



为确保大会顺利举行,现诚邀志愿者加入,时长 3.5 天。可与大咖交流、获极客时间 VIP 月卡、大会演讲视频资源和证书。主办方提供午餐和交通支持。时间:4 月 9 日 13:00-4 月 12 日 18:00,地点:北京万达嘉华酒店,报名链接:https://www.infoq.cn/form/?id=2088

2025-03-31 10:004077

评论

发布
暂无评论

中智车联:用TDengine高效处理车辆运营可视化管理

TDengine

数据库 tdengine 时序数据库 企业号九月金秋榜

微服务低代码Serverless平台(星链)的应用实践

京东科技开发者

Serverless 微服务 云原生 低代码 VMS

漫谈 SAP 产品里页面上的 Checkbox 设计与实现

汪子熙

JavaScript 前端开发 web开发 SAP 9月月更

新消费时代,零售业的进与退?

华为云开发者联盟

中台 后端 开发 企业号九月金秋榜

拒绝花里胡哨,零基础也能把机器学习给你捣鼓明白

博文视点Broadview

OpenHarmony 3.2 Beta源码分析之MediaLibrary

OpenHarmony开发者

OpenHarmony

MobTech ShareSDK 后台配置说明

MobTech袤博科技

开发者 sdk 微信平台 SDK 教程

龙智 | 电话更换通知

龙智—DevSecOps解决方案

分布式架构下如何选择最佳 Store?

KaiwuDB

数据库 分布式数据库 数据存储

【数据结构】顺序表(增、删、查、改)的实现 [初阶篇_ 复习专用]

Dream-Y.ocean

c 顺序表 9月月更

【C语言】深度剖析文件操作 [进阶篇_ 复习专用]

Dream-Y.ocean

c 文件 9月月更

Qt|QGraphicsView总体架构学习

中国好公民st

c++ qt 9月月更

带你掌握如何使用CANN 算子ST测试工具msopst

华为云开发者联盟

人工智能 算子 CANN 企业号九月金秋榜

手把手教你:轻松打造沉浸感十足的动态漫反射全局光照

HarmonyOS SDK

移动开发 图像 Andriod 引擎

【C语言】动态内存管理 [进阶篇_ 复习专用]

Dream-Y.ocean

c c++ 9月月更

“企业级零代码黑客马拉松大赛”决赛名单公布

明道云

低代码 零代码 企业数字化转型 黑客马拉松

手把手教大家在 Spring Boot 中处理 flowable 中的用户和组!

江南一点雨

springboot workflow flowable

【Vue3】穿梭框 -- 思路与实现分析

Sam9029

前端 Vue 3 9月月更

数据火器库八卦系列之瑞士军刀随APP携带的SQLite

sqlite 数据库 科技 玖章算术

通用漏洞评分系统 (CVSS)系统入门指南

SEAL安全

漏洞修复 漏洞管理

GOPS现场 | 对话某科技公司DevOps工程师,从用户角度探讨DevOps工具链

龙智—DevSecOps解决方案

DevOps 运维 DevOps工具

版本控制 | 如何有效管理SVN服务器上的多个储存库

龙智—DevSecOps解决方案

svn SVN储存库

SAP 电商云 Spartacus UI 的 checkout 场景中的串行请求设计分析

汪子熙

angular 调试 电商 Spartacus 9月月更

基于高效采样算法的时序图神经网络系统(二)

Baihai IDP

人工智能 神经网络 AI 图数据

GOPS现场 | 对话龙智大规模安全研发技术专家,分享静态代码、开源组件扫描干货

龙智—DevSecOps解决方案

开源组件 安全研发 静态代码

【数据结构】单链表(增、删、查、改)的实现 [初阶篇_ 复习专用]

Dream-Y.ocean

c 单向链表 9月月更

Java之static关键字【实例变量与类变量、实例方法与类方法】

Fire_Shield

Java static 9月月更

【数据结构】带头+双向+循环链表(增、删、查、改)的实现_【附源码、图片示例】_ [初阶篇_ 复习专用]

Dream-Y.ocean

c 双向循环链表 9月月更

聊聊Kafka在生产实践中出的一个问题

Java永远的神

kafka 源码 程序人生 中间件 Java 面试

跟我学Python图像处理丨关于图像金字塔的图像向下取样和向上取样

华为云开发者联盟

Python 人工智能 企业号九月金秋榜

“3” 生万物,勇敢前行

MIAOYUN

云上百万大数据任务的自动优化实践|QCon 北京_大数据_QCon全球软件开发大会_InfoQ精选文章