10 月 23 - 25 日,QCon 上海站即将召开,现在购票,享9折优惠 了解详情
写点什么

K8s 为 AI 应用提供大规模 GPU 算力之实践

  • 2019-08-11
  • 本文字数:442 字

    阅读完需:约 1 分钟

K8s 为 AI 应用提供大规模 GPU 算力之实践

QCon北京2019大会上,李程讲师做了《K8s 为 AI 应用提供大规模 GPU 算力之实践》主题演讲,主要内容如下。


演讲简介


华为云 CCI 服务管理数百个 GPU 卡,为华为云 EI 服务及外部客户提供 AI 计算平台,在该过程中积累了大量面向 AI 计算的优化经验。AI 计算加速的关键是 GPU 管理,K8S 资源调度优化,面向 AI 计算框架和模型的 Job/Task 调度。通过这些优化手段可以使得 128 块 GPU 卡的线性加速比达到 0.8+。本次议题将介绍如何通过开源项目 K8S + Kata 容器搭建 AI 计算平台,最大化 GPU 及 AI 芯片算力的使用效率,并给出测试结果。最后我们也会对未来的技术改进做出展望。

听众受益

  1. 了解基于 K8S 的 AI 框架的现状;

  2. 了解大规模 GPU 在 AI 分布式训练场景下的应用;

  3. 了解 K8S 在人工智能场景下的优化思路。


讲师介绍


李程


华为 高级软件架构师


2011 年加入华为,先后参与网络软件平台、SDN、公有云容器服务等产品的架构设计工作,目前任华为 Serverless 容器服务 CCI 架构师。












完整演讲 PPT 下载链接


https://qcon.infoq.cn/2019/beijing/schedule


2019-08-11 00:002089

评论

发布
暂无评论
发现更多内容

多标签分类中的损失函数与评价指标

月来客栈

PyTorch 多标签 多标签分类 文本分类

IPC阿波罗公链软件系统开发搭建

UD众筹链/UD生态系统APP开发详情

模块七 作业

CR

Redisson 分布式锁源码 03:可重入锁互斥

程序员小航

redis 源码 分布式锁 redisson

【Flutter 专题】96 图解 Draggable + DragTarget 基本拖拽效果

阿策小和尚

Flutter 小菜 0 基础学习 Flutter Android 小菜鸟 7月日更

联想科技产业行——大众集团走进联想:智慧科技赋能汽车行业智能化变革

科技大数据

科技互联网 新未来 联想

2022vue面试题+答案

buchila11

Vue Vue 3

Rust从0到1-Cargo-发布到Crates.io

rust 发布 cargo crates.io publish

富文本编辑器之游戏角色升级ing

vivo互联网技术

Java 大前端 富文本 富文本编辑器

Vue.js+ElementUI+vant生成动态表单配置

二郎神杨戬

7月日更

图分析入门

6979阿强

架构训练营模块七作业

Neil43

架构训练营

Linux之locate命令

入门小站

Linux

Go 学习笔记之 整型数据类型

架构精进之路

Go 语言 7月日更

架構實戰營 - 模塊 7 作業

Frank Yang

架构实战营

@Autowired报错原因分析和4种解决方案!

王磊

Java spring springboot @Autowired注入原理 Autowired

JavaScript数组详解-全网最全

二郎神杨戬

7月日更

海洋之星系统开发|海洋之星软件APP开发

社交软件上“你可能认识的人”到底是怎么找到你的?

华为云开发者联盟

知识图谱 社交软件 TransE模型 用户画像 知识图谱补全

在线HTTP请求/响应头转JSON工具

入门小站

工具

架构实战营模块 7

阿体

架构实战营 模块七作业

Dylan

架构实战营

一条SQL语句执行的背后

卢卡多多

log sql 更新 执行顺序 7月日更

6 月日更总结 | 总是断更的失败经验分享

耳东@Erdong

7月日更 日更

架构实战营 - 模块一作业

Julian Chu

#架构实战营

架构实战营-模块一作业

思梦乐

架构实战营

架构之:微服务和单体服务之争

程序那些事

微服务 系统架构 软件架构 程序那些事

根据舌苔判断身体状况

kof11321

模块七:课后作业

Geek_9cf7b5

反恶意收购的几种方式

石云升

职场经验 7月日更

K8s 为 AI 应用提供大规模 GPU 算力之实践_QCon_李程_InfoQ精选文章