【AICon】探索RAG 技术在实际应用中遇到的挑战及应对策略!AICon精华内容已上线73%>>> 了解详情
写点什么

GitHub 大规模采用机器学习的痛点和破解之道

  • 2020-02-08
  • 本文字数:993 字

    阅读完需:约 3 分钟

GitHub 大规模采用机器学习的痛点和破解之道

ArchSummit 北京 2019 大会上,Jose David Baena 讲师做了《GitHub 大规模采用机器学习的痛点和破解之道》主题演讲,主要内容如下。


演讲简介


Title: Adopting Machine Learning at Scale


Scaling up machine-learning (ML), data retrieval and reasoning algorithms from Artificial Intelligence (AI) for massive datasets is a major technical challenge in our time. The scaling process can also have different dimensions: performance, development productivity, number of employees…


In this talk I will showcase how we used to develop Machine learning features at GitHub, the pain points we had and how we changed our infrastructure and way of development in order to productionize multiple ML features in terms of hours/days.


In addition, I will explore with the audience the main factors I consider when scaling ML at medium to big companies.


By the end of the talk you should have an overview and applicable framework on how to help scaling ML processes in your company.


Talk outline


Potential outline for the talk:


  • Introduction to ML at GitHub.

  • Challenges of running ML at scale. Different dimensions:

  • Performance: number of requests

  • Development: growing infrastructure, number of ML features

  • Organizational: number of employees

  • ML ecosystem architecture.

  • Improving agility and development on ML features.

  • Adopting ML at scale in your company.


讲师介绍


Jose David Baena,GitHub Senior Software Engineer。


Jose David Baena is a Senior Software Engineer at GitHub. He has more than 10 years experience in backend development, from startups to big companies, from Europe to the United States.


His experience ranges from building distributed low latency systems for financial companies to high performant crawlers for social media.


At the moment, he designs architectures that are used by the Machine Learning and Data Science teams at GitHub. He is passionate about distributed systems, machine learning scalability and developer productivity.












完整演讲 PPT 下载链接


https://archsummit.infoq.cn/2019/beijing/schedule


2020-02-08 18:35445

评论

发布
暂无评论
发现更多内容

需要转变ITSM策略的12个信号,您中了几个?

龙智—DevSecOps解决方案

金融科技领先者Broadridge选择CloudBees CI来加速软件交付

龙智—DevSecOps解决方案

ci 持续集成

LED广告机的市场趋势和发展前景

Dylan

媒体 广告 数字 LED显示屏 市场

幂律智能联合智谱AI发布千亿参数级法律垂直大模型PowerLawGLM

人称T客

华秋一文带你读懂eMMC芯片引脚定义和工作原理

华秋电子

(信息化,数字化,智能化)这是三种不同的概念吗?

优秀

数字化 信息化 智能化

基于OpenHarmony开发的玻璃拟态天气应用(3)构建天气组件并实现毛玻璃效果

路北路陈

前端 HarmonyOS OpenHarmony应用开发 6 月 优质更文活动

OSPO才是企业拥抱开源的正确选项——适兕访谈录

开源雨林

开源 OSPO LFAPAC

融云出海:TikTok 百亿美元投向东南亚,巨头将如何影响市场格局

融云 RongCloud

产品 运维 出海 市场 通讯

Gateway 实现网关聚合查询

2756

一文读懂火山引擎A/B测试的实验类型(3)——多链接实验

字节跳动数据平台

扫码登录认证技术原理介绍及实践

互联网工科生

程序员

第十四届夏季达沃斯论坛|英特尔王锐:AI驱动工业元宇宙,释放数实融合无穷潜力

E科讯

AIGC+客服|智能客服上岗即失业?AI对话背后的学问大着呢

TE智库

人工智能 智能客服 AIGC 生成式AI

云原生时代,如何通过极狐GitLab x KubeSphere 构建安全应用?

极狐GitLab

DevOps 云原生 DevSecOps KubeSphere 安全左移

对线面试官-Redis(内存消耗的问题)

派大星

Java 面试

inBuilder今日分享丨开源许可协议简介

inBuilder低代码平台

科兴未来|中国•湖州海外青创大赛全面开启!

科兴未来News

环保 #双创赛事# 新能源行业 湖州

HTML5 游戏开发实战 | 推箱子

TiAmo

html html5 6 月 优质更文活动

开源之夏2023中选结果公示,504名高校生将投入开源项目贡献

openEuler

Linux 开源 操作系统 openEuler 实习

英特尔宣布极光超级计算机安装完成,将于2023年末正式上线!

E科讯

聊聊测试团队的基础架构建设

老张

质量保障 基础设施建设 基础架构

https 原理分析进阶-模拟https通信过程

蓝胖子的编程梦

https TLS SSL证书 ssl SSL/TLS 协议

什么是Buck电源?矽力杰SQ51201值得关注

华秋电子

AIGC+任务管理|给既定目标一个“精准打击”

TE智库

人工智能 任务管理 AIGC 生成式AI

什么是HTML?

TiAmo

html html5 6 月 优质更文活动

华为云Classroom一站式教学实践平台,开启云端教学新征程

华为云PaaS服务小智

云计算 华为云 线上教学 线上培训

《2023 信创软件品牌影响力报告》发布!融云入选「信创生态」代表厂商

融云 RongCloud

IT 品牌 信创 数字 融云

行业首个多重节律照明!三翼鸟“亮”在哪?

脑极体

智能照明

【网易云信】已开源!网易云信的热点探测平台实践

网易智企

开源 热点探测

基于低代码平台从0-1搭建工单系统

这我可不懂

低代码 可视化 企业开发系统 JNPF

GitHub 大规模采用机器学习的痛点和破解之道_ArchSummit_Jose David Baena_InfoQ精选文章