AICon 上海站|日程100%上线,解锁Al未来! 了解详情
写点什么

Kubernetes 运行大数据工作负载的探索和实践

  • 2020-02-05
  • 本文字数:744 字

    阅读完需:约 2 分钟

Kubernetes 运行大数据工作负载的探索和实践

ArchSummit 北京 2019 大会上,王雷博讲师做了《Kubernetes 运行大数据工作负载的探索和实践》主题演讲,主要内容如下。


演讲简介


随着 Kubernetes 的成熟,越来越多的大数据用户希望将 Spark 作业运行在 Kubernetes 之上。Spark 从 2.3 版本开始已经可以运行在 Kubernetes 之上,然而目前 Kubernetes 默认调度器对于大数据场景的支持还有很多不足,例如高并发场景,动态集群资源共享场景,亲和调度场景等。Volcano 针对于这些大数据特有场景进行了定制化开发。提供了 Pod delay creation,Queue,Zone aware scheduling 等,获得了很好的功能体验和性能提升。


在本次演讲中将介绍 Kubernetes 运行大数据工作负载的探索和实践,以及 Volcano 针对大数据工作负载的优化,并演示相应的功能和性能提升等。


内容大纲


  1. Kubernetes 运行大数据作业的现状

  2. Kubernetes 运行大数据的痛点

  3. Volcano 针对大数据的方案设计

  4. 性能方面的提升

  5. 后续的改进计划


听众受益点


  1. 如何在社区中运营一个开源项目

  2. 如何使用 Kubernetes 来运行大数据

  3. 如何优化 Kuberentes 来支持 计算类任务


讲师介绍


王雷博


华为 基础服务产品部/主任工程师


华为云基础服务产品部主任工程师,曾就职于 NEC,Platform computing,IBM,Oracle 等公司。拥有 10 年以上大规模分布式计算、高性能计算领域的从业经验。熟悉云原生和大数据领域的开源生态系统。专注于大规模集群资源管理,资源调度,作业调度引擎的开发。


目前主要负责 Volcano 云原生批量计算平台的研发工作。Volcano 社区致力于在 Kubernetes 上构建一个批处理调度系统,提供高性能任务调度引擎、高性能异构芯片管理、高性能任务运行管理等通用计算能力。Volcano 目前已广泛应用在大数据,AI,基因容器等服务领域。












完整演讲 PPT 下载链接


https://archsummit.infoq.cn/2019/beijing/schedule


2020-02-05 19:551486

评论

发布
暂无评论
发现更多内容

MobTech|如何使用秒验

MobTech袤博科技

微前端架构的业务价值:实现独立部署、快速迭代和按需加载

FinFish

微前端 小程序容器 小程序化 微前端框架

数仓如何进行表级控制analyze

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 企业号 3 月 PK 榜

【网易云商】记一次实遇的 MySQL--index merge 死锁历程

网易智企

MySQL 数据库

在 Flutter 多人视频中实现虚拟背景、美颜与空间音效

声网

flutter AI 虚拟背景 美颜

数禾科技 AI 模型服务 Serverless 容器化之旅

阿里巴巴云原生

阿里云 Serverless 云原生 Knative 容器化

降本增效:12种常见接口优化方案总结

程序员小毕

Java 程序员 性能优化 后端 架构师

车载小程序改善车载设备体验与性能,打造智能出行生态圈

没有用户名丶

小程序容器

不会性能调优,被面试官狂虐!全靠阿里Java性能调优全彩手册死撑

做梦都在改BUG

Java 性能优化 JVM 性能调优

Flink CDC 专题首发|每天 10 分钟,解锁新一代数据集成框架

Apache Flink

大数据 flink 实时计算

中间件:数字化时代系统集成商的得力助手

FinFish

中间件 系统集成 小程序容器 软件中间件

Rainbond的 Gateway API 插件制作实践

北京好雨科技有限公司

Kubernetes API Gateway rainbond

海泰方圆出席首届工业和信息化领域商用密码应用峰会

电子信息发烧客

从数仓发展史浅析数仓未来技术趋势

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 企业号 3 月 PK 榜

类 ChatGPT 开源软件,开发者用的上吗?

开源雨林

人工智能 开源软件 ChatGPT

C++开发者必读经典书籍推荐

小万哥

c++ 程序员 后端 开发 推荐书籍

火山引擎DataLeap一招教你避坑“数据开发”中的资源隔离问题

字节跳动数据平台

大数据 数据治理 资源隔离 数据研发 企业号 3 月 PK 榜

MobTech|移动应用开发中的消息推送

MobTech袤博科技

【网易云商】记一次实遇的 MySQL--index merge 死锁历程

网易云信

MySQL 数据库 数据库死锁

中康数字科技:基于大模型的医学文本信息处理与抽取

飞桨PaddlePaddle

强势升级!融云上线第四代通信网 SD-CAN V4

融云 RongCloud

网络 通信 融云

小巧简单的图像处理软件:Acorn 激活版

真大的脸盆

Mac 图像处理 Mac 软件 图像编辑工具

窗口管理器:Lasso 中文激活版

真大的脸盆

Mac Mac 软件 窗口管理 窗口管理工具

龙蜥白皮书精选:跨云-边-端的只读文件系统 EROFS

OpenAnolis小助手

镜像 操作系统 白皮书 龙蜥技术 EROFS

通过 Amazon Managed Microsoft Active Directory 运行混合 Active Directory 服务

亚马逊云科技 (Amazon Web Services)

Amazon

OneFlow源码解析:Eager模式下的设备管理与并发执行

OneFlow

得帆云iPaaS是主数据必备工具

得帆信息

集成

Kubernetes 运行大数据工作负载的探索和实践_ArchSummit_王雷博_InfoQ精选文章