写点什么

微博深度学习平台基于 Kubernetes 的分布式解决方案

  • 2019-09-10
  • 本文字数:548 字

    阅读完需:约 2 分钟

微博深度学习平台基于Kubernetes的分布式解决方案

ArchSummit北京2018大会上,于翔讲师做了《微博深度学习平台基于 Kubernetes 的分布式解决方案》主题演讲,主要内容如下。


演讲简介


随着深度学习在微博业务场景中的广泛使用,深度学习平台遇到一些挑战:离线训练方面,各业务方需求丰富多样,任务管理纷繁复杂,大数据与大模型带来训练时长的压力;在线推理方面,基于模型服务的特殊性,如何在满足微博大流量高性能的在线业务需求同时,保证服务的高可用与稳定性。


本次分享从以上两个维度切入,基于 K8s 构建分布式离线与在线方案,解决上述遇到的挑战。


演讲提纲


  1. 介绍背景,微博业务与深度学习平台;

  2. 介绍离线训练遇到的挑战,方案选型(Yarn & K8s),方案介绍(基于 tfjob)以及相关效果;

  3. 介绍在线推理遇到的挑战,方案选型(自定义服务发现)解决方案(K8s deployment 等基础资源对象)。


听众受益点


  • 对深度学习感兴趣的听众,可以了解到深度学习算法在业务应用的基本流程;

  • 深度学习平台的基础架构;

  • 大规模深度学习会遇到的瓶颈与 K8s 解决方案;

  • 在线模型服务的服务特性与一些优化点。


讲师介绍


于翔


新浪微博 机器学习研发架构师


现就职于新浪微博,在机器学习平台中曾负责特征工程项目,目前主要负责算法服务平台与深度学习平台的搭建与开发。












完整演讲 PPT 下载链接


https://archsummit.infoq.cn/2018/beijing/schedule


2019-09-10 14:022582

评论

发布
暂无评论
发现更多内容

深入浅出 Java 泛型,一文搞定

猴哥一一 cium

Java 翻译 泛型

Vue进阶(七十八):Vue 定时器与 JS 定时器

No Silver Bullet

Vue 定时器 7月日更

AI解锁无人时代 仍需数据安全保驾护航

CECBC

一文读懂区块链技术如何改变非洲贸易(下)

CECBC

网络攻防学习笔记 Day84

穿过生命散发芬芳

网络攻防 7月日更

使用Apache Spark构建可靠的数据湖(九)

Databri_AI

spark Data Lake iceberg Hudi

大厂的产品研发流程,你知道么?

Simon郎

产品 研发体系 大厂 互联网公司

大三就拿到字节提前批,你不想成长,生活总会逼着你成长

Java架构师迁哥

去阿里应聘P7Java岗,都会被问到哪些问题?

Java架构师迁哥

通证与区块链:前台经济+后台技术

CECBC

做大做强肉牛产业,生物资产解决方案助力乡村振兴

CECBC

什么是 Druid

HoneyMoose

Vue进阶(四):使用 Vuex + axios 发送请求

No Silver Bullet

Vue axios vuex 7月日更 vue-resources

Spring之 EL表达式

邱学喆

语法规则 Expression ExpressionParser ParserContext EvaluationContext

模块三作业

A先生

Go语言:运行时反射,深度解析!

微客鸟窝

Go 语言

加速基因测序进程,北鲲云高性能计算平台再发力

北鲲云

从鉴黄师到阿里程序员,我成功逆袭上岸

Java 编程 程序员 计算机

从鉴黄师到阿里程序员,我成功拿下阿里offer

白亦杨

Java 编程 程序员 计算机

完整视频+源码!十六天带你精通基于Spring Cloud微服务电商项目

Java架构追梦

Java 架构 面试 微服务 SpringCloud

阿里大牛把电商购物、电商秒杀、12306抢票、淘宝天猫各种活动的系统架构层面全部记载到这份《高并发系统架构》手册里了

Java 编程 架构 计算机

kubernetes/k8s CSI分析-容器存储接口分析

良凯尔

Kubernetes 源码分析 CSI Kubernetes Plugin #Kubernetes#

我应该在什么时候使用 Apache Druid

HoneyMoose

根据四个商业指标找到MOT

石云升

读书笔记 用户体验 商业洞察 关键时刻 7月日更

【Kafka技术专题】「实践操作篇」单机部署实践手册(2.8.0)

码界西柚

kafka MQ kafka配置 消息队列 kafka架构

2021年WEB全栈开发技术栈

devpoint

Vue 全栈 7月日更

如何在Go 服务中做链路追踪

Rayjun

微服务 Go 语言

不要让这2个坏习惯限制了你的成长

俞凡

认知

过去几个月里面的几家大厂(美团、字节、腾讯、阿里)均拿到 offer,最终去了字节跳动

Java 编程 程序员 架构 面试

Docker的学习体验

吴脑的键客

,docker

近几天fil价格暴跌:fil还有希望吗?

区块链 分布式存储 IPFS fil fil行情

微博深度学习平台基于Kubernetes的分布式解决方案_ArchSummit_于翔_InfoQ精选文章