写点什么

Quora 数据科学家和机器学习工程师是如何合作的

  • 2015-12-17
  • 本文字数:974 字

    阅读完需:约 3 分钟

数据科学家和机器学习工程师如何有效协作是一个困扰许多公司的问题。在前不久于旧金山举行的 MLConf 大会上,Quora 工程副总裁 Xavier Amatriain 介绍了他们应对这一问题的方法。近日,他又援引Quora 数据科学家 William Chen 的说法进一步阐述了 Quora 的做法。

按照 William 的说法,在 Quora,机器学习工程师是工程部门的组成部分,而数据科学家是数据科学部门的组成部分。工程部门负责构建产品和算法,并保证其快速可靠地运行,而数据科学部门负责理解 Quora 的数据,并指导产品决策。但机器学习工程师和数据科学家都会参与机器学习项目,他们的工作主要有如下两个方面的差别:

  • 机器学习工程师构建、实现和维护机器学习系统;
  • 数据科学家进行研究,提出有关机器学习项目的构想,并通过分析了解机器学习系统对公司指标的影响。

更具体地讲,机器学习工程师负责:

  • 构建和实现机器学习系统;
  • 维护机器学习系统,包括速度、可靠性和性能;
  • 开发供内部(机器学习工程师和数据科学家)使用的机器学习框架,为了一些常见任务(如训练 / 测试)提供便利。

数据科学家负责:

  • 评估潜在的或现有的方法、功能、算法或误差度量指标,帮助改进机器学习系统;
  • 分析机器学习算法对公司关键指标的影响;
  • 通过构建机器学习模型(仅用于一次性分析而不放入生产环境)研究和了解用户行为模式。

通常,机器学习项目会同时配备数据科学家和机器学习工程师。在 Quora,他们通过如下三个步骤实现合作:

  • 数据科学家进行研究,确定机器学习系统可能的需求或改进项;
  • 机器学习工程师构建、实现或改进机器学习系统;
  • 数据科学家评估机器学习系统对公司关键指标的影响。

对于 William 的说法,Xavier 作了一些补充。他认为,机器学习团队和数据科学团队的界限很模糊。他更喜欢谈论两者的工作重心,而不是界限,因为定义团队的目标是明确重点,而不是制造分歧。同样地,机器学习工程师和数据科学家的界限也不清晰,那取决于个人的职业选择和背景。例如,机器学习工程师并不一定是个编码专家,他可以是一个有丰富机器学习经验的人。数据科学家同样如此。


感谢杜小芳对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们,并与我们的编辑和其他读者朋友交流(欢迎加入 InfoQ 读者交流群InfoQ 好读者(已满),InfoQ 读者交流群(#2)InfoQ 好读者)。

2015-12-17 18:002466
用户头像

发布了 1008 篇内容, 共 433.0 次阅读, 收获喜欢 346 次。

关注

评论

发布
暂无评论
发现更多内容

分布式基础概念

派大星

分布式 Java 面试题

揭示API重要性,以Assistants API为例

幂简集成

AI API ASSISTANTS API

服务器管理器怎么设置?

Geek_f19a80

服务器

一种可度量的测试体系-精准测试

鲸品堂

工具 测试 企业号11月PK榜

CodeWhisperer 一款好玩的 AI 插件

亚马逊云科技 (Amazon Web Services)

Java 人工智能 云上探索实验室 Amazon CodeWhisperer

云上应用技术架构-WebAssembly (WASM)

深蓝

Python连接es笔记三之es更新操作

Hunter熊

Python elasticsearch Elasticsearch-dsl

第28期 | GPTSecurity周报

云起无垠

亚马逊EC2云服务器一键部署wordpress博客

乌龟哥哥

AWS

纯CSS实现炫酷文本时钟

南城FE

CSS css3 前端 动画 时钟

比较两个不同的裁判模型打分是否趋同

Geek_3cd80a

用友全球司库十问(七)|企业如何进行资金计划的经营化管理?

用友BIP

全球司库 资金计划

软件质量:问题在哪,如何改善?

peak徐

质量管理 研发管理

【亚马逊云科技产品测评】活动征文|aws云服务器 + 微服务Spring Cloud Nacos 实战

青花锁

微服务 ws云服务器 Spring Cloud Nacos

今探云服务器有哪些不同的应用场景?

攻城先森

云服务器 场景 亚马逊

中国AI今天的问题,是大模型又多又乱

脑极体

AI

不要仅局限于技术实现细节

老张

微服务架构 性能测试 技术选型 容器化

可视化:最热的前端Web组态工具

2D3D前端可视化开发

物联网 可视化 组态软件 web组态 组态工具

使用商品详情API接口获取商品数据

Noah

如何利用亚马逊云科技和大型语言模型构建智能化的企业业务知识库

E₀=mc²

AI AWS NLP 大模型 亚马逊云科技 LLM

Quora数据科学家和机器学习工程师是如何合作的_语言 & 开发_谢丽_InfoQ精选文章