10 月 23 - 25 日,QCon 上海站即将召开,现在购票,享9折优惠 了解详情
写点什么

K8s 为 AI 应用提供大规模 GPU 算力之实践

  • 2019-08-11
  • 本文字数:442 字

    阅读完需:约 1 分钟

K8s 为 AI 应用提供大规模 GPU 算力之实践

QCon北京2019大会上,李程讲师做了《K8s 为 AI 应用提供大规模 GPU 算力之实践》主题演讲,主要内容如下。


演讲简介


华为云 CCI 服务管理数百个 GPU 卡,为华为云 EI 服务及外部客户提供 AI 计算平台,在该过程中积累了大量面向 AI 计算的优化经验。AI 计算加速的关键是 GPU 管理,K8S 资源调度优化,面向 AI 计算框架和模型的 Job/Task 调度。通过这些优化手段可以使得 128 块 GPU 卡的线性加速比达到 0.8+。本次议题将介绍如何通过开源项目 K8S + Kata 容器搭建 AI 计算平台,最大化 GPU 及 AI 芯片算力的使用效率,并给出测试结果。最后我们也会对未来的技术改进做出展望。

听众受益

  1. 了解基于 K8S 的 AI 框架的现状;

  2. 了解大规模 GPU 在 AI 分布式训练场景下的应用;

  3. 了解 K8S 在人工智能场景下的优化思路。


讲师介绍


李程


华为 高级软件架构师


2011 年加入华为,先后参与网络软件平台、SDN、公有云容器服务等产品的架构设计工作,目前任华为 Serverless 容器服务 CCI 架构师。












完整演讲 PPT 下载链接


https://qcon.infoq.cn/2019/beijing/schedule


2019-08-11 00:002106

评论

发布
暂无评论
发现更多内容

本地 IDC 中的 K8s 集群如何以 Serverless 方式使用云上计算资源

阿里巴巴云原生

阿里云 Serverless 云原生

JavaScript程序设计模式小技巧——策略模式,快看快用!!!

Immerse

JavaScript 程序设计 设计模式 策略模式 设计规则

PoseiSwap 即将开启 POSE 单币质押,治理体系将全面运行

鳄鱼视界

性能测试|JMeter逻辑控制器(九)

霍格沃兹测试开发学社

性能测试|JMeter逻辑控制器(十)

霍格沃兹测试开发学社

如何通过网关降低大模型的调用费用,并提升合规性

阿里巴巴云原生

阿里云 云原生 网关

解开心锁,放飞自我

少油少糖八分饱

认识自己 读后感 阅读笔记 被讨厌的勇气

性能测试|JMeter逻辑控制器(三)

霍格沃兹测试开发学社

性能测试|JMeter逻辑控制器(五)

霍格沃兹测试开发学社

性能测试|JMeter逻辑控制器(八)

霍格沃兹测试开发学社

性能测试|JMeter参数化(一)

霍格沃兹测试开发学社

IDE暗黑主题推荐-Dracula

越长大越悲伤

ide 前端 后端 插件 主题

PoseiSwap 即将开启 POSE 单币质押,治理体系将全面运行

股市老人

性能测试|JMeter逻辑控制器(二)

霍格沃兹测试开发学社

性能测试|JMeter逻辑控制器(四)

霍格沃兹测试开发学社

性能测试|JMeter逻辑控制器(六)

霍格沃兹测试开发学社

性能测试|JMeter逻辑控制器(七)

霍格沃兹测试开发学社

App自动化测试|Appium介绍

霍格沃兹测试开发学社

Python 测试 appium

异步编程框架:Workflow的计算调度算法

1412

c++ 开源 异步编程 workflow 调度算法

VSCode同时编译多个C文件

codists

Visual Studio Code

文本生成图像DALL·E 2背后的原理——Diffusion Model | 社区征文

秃头小苏

年中技术盘点

调整自我,安然入眠

少油少糖八分饱

读书笔记 读书感悟 #读书 睡眠 我们为什么要睡觉

MongoDB源码学习:创建记录和索引(insertDocuments)

云里有只猫

mongodb 源码解读

性能测试|JMeter连接数据库

霍格沃兹测试开发学社

PoseiSwap 即将开启 POSE 单币质押,治理体系将全面运行

西柚子

K8s 为 AI 应用提供大规模 GPU 算力之实践_QCon_李程_InfoQ精选文章