写点什么

K8s 为 AI 应用提供大规模 GPU 算力之实践

  • 2019-08-11
  • 本文字数:442 字

    阅读完需:约 1 分钟

K8s 为 AI 应用提供大规模 GPU 算力之实践

QCon北京2019大会上,李程讲师做了《K8s 为 AI 应用提供大规模 GPU 算力之实践》主题演讲,主要内容如下。


演讲简介


华为云 CCI 服务管理数百个 GPU 卡,为华为云 EI 服务及外部客户提供 AI 计算平台,在该过程中积累了大量面向 AI 计算的优化经验。AI 计算加速的关键是 GPU 管理,K8S 资源调度优化,面向 AI 计算框架和模型的 Job/Task 调度。通过这些优化手段可以使得 128 块 GPU 卡的线性加速比达到 0.8+。本次议题将介绍如何通过开源项目 K8S + Kata 容器搭建 AI 计算平台,最大化 GPU 及 AI 芯片算力的使用效率,并给出测试结果。最后我们也会对未来的技术改进做出展望。

听众受益

  1. 了解基于 K8S 的 AI 框架的现状;

  2. 了解大规模 GPU 在 AI 分布式训练场景下的应用;

  3. 了解 K8S 在人工智能场景下的优化思路。


讲师介绍


李程


华为 高级软件架构师


2011 年加入华为,先后参与网络软件平台、SDN、公有云容器服务等产品的架构设计工作,目前任华为 Serverless 容器服务 CCI 架构师。












完整演讲 PPT 下载链接


https://qcon.infoq.cn/2019/beijing/schedule


2019-08-11 00:002008

评论

发布
暂无评论
发现更多内容

百度智能云正式上线Python SDK版本并全面开源!

爱编程的喵喵

如何优雅的开发?试试这个低代码项目

树上有只程序猿

软件开发 低代码 JNFP

2024中国供热展-2024山西国际供热采暖展会

秋硕展览

前端构建工具详解

不在线第一只蜗牛

前端 工具 前端框架

深度揭秘:数据流图四大要素的神奇作用!

职场工具箱

情感语音识别技术的应用与未来发展

数据堂

情感语音识别的前世今生

数据堂

当我们在选国产工业软件时,到底在选什么?

ToB行业头条

百度智能云千帆大模型平台再升级,SDK版本开源发布!

herosunly

常用压力测试工具锦集

优测云服务平台

《开心消消乐》完成鸿蒙原生应用开发,创新多端联动用户体验

最新动态

飞总聊IT|听飞总浅话大数据未来发展趋势

腾讯云大数据

大数据

智能未来,共铸创新 — Timecho 再次携手 Bosch Rexroth参展德国SPS智能生产解决方案展

Apache IoTDB

车联网场景中的MQTT协议应用

阿里云AIoT

车联网 物联网 mqtt 阿里云;

情感语音识别的技术挑战与解决方案

数据堂

评估 RAG 的神器来啦!TruLens + Milvus=?

Zilliz

Zilliz rag trulens

一招解密网络流量瓶颈!

观测云

基础设施 网络流量分析

【云栖2023】王峰:开源大数据平台3.0技术解读

阿里云大数据AI技术

开源

TOP8工具大揭秘!再也不怕绘制数据流图!

职场工具箱

聊点技术|100%降本增效!Bonree ONE 通过 Clickhouse实现了

博睿数据

可观测性 博睿数据

探索未来,开启无限可能:打造智慧应用,亚马逊云科技大语言模型助您一臂之力

熬夜磕代码、

大模型

采用GraphQL消灭页面数据加工代码

neverwinter

BFF graphql spring-boot

Senparc 基础库全面适配 .NET 8.0

不在线第一只蜗牛

.net

KaiwuDB x 奇瑞超级工厂 | 汽车行业能源管理平台成功实践

KaiwuDB

能源管理 KaiwuDB

10款好用的项目管理工具推荐,项目经理必备的高效办公神器!

彭宏豪95

项目管理 项目经理 在线白板 项目管理软件 办公软件

K8s 为 AI 应用提供大规模 GPU 算力之实践_QCon_李程_InfoQ精选文章