写点什么

Quora 数据科学家和机器学习工程师是如何合作的

  • 2015-12-17
  • 本文字数:974 字

    阅读完需:约 3 分钟

数据科学家和机器学习工程师如何有效协作是一个困扰许多公司的问题。在前不久于旧金山举行的 MLConf 大会上,Quora 工程副总裁 Xavier Amatriain 介绍了他们应对这一问题的方法。近日,他又援引Quora 数据科学家 William Chen 的说法进一步阐述了 Quora 的做法。

按照 William 的说法,在 Quora,机器学习工程师是工程部门的组成部分,而数据科学家是数据科学部门的组成部分。工程部门负责构建产品和算法,并保证其快速可靠地运行,而数据科学部门负责理解 Quora 的数据,并指导产品决策。但机器学习工程师和数据科学家都会参与机器学习项目,他们的工作主要有如下两个方面的差别:

  • 机器学习工程师构建、实现和维护机器学习系统;
  • 数据科学家进行研究,提出有关机器学习项目的构想,并通过分析了解机器学习系统对公司指标的影响。

更具体地讲,机器学习工程师负责:

  • 构建和实现机器学习系统;
  • 维护机器学习系统,包括速度、可靠性和性能;
  • 开发供内部(机器学习工程师和数据科学家)使用的机器学习框架,为了一些常见任务(如训练 / 测试)提供便利。

数据科学家负责:

  • 评估潜在的或现有的方法、功能、算法或误差度量指标,帮助改进机器学习系统;
  • 分析机器学习算法对公司关键指标的影响;
  • 通过构建机器学习模型(仅用于一次性分析而不放入生产环境)研究和了解用户行为模式。

通常,机器学习项目会同时配备数据科学家和机器学习工程师。在 Quora,他们通过如下三个步骤实现合作:

  • 数据科学家进行研究,确定机器学习系统可能的需求或改进项;
  • 机器学习工程师构建、实现或改进机器学习系统;
  • 数据科学家评估机器学习系统对公司关键指标的影响。

对于 William 的说法,Xavier 作了一些补充。他认为,机器学习团队和数据科学团队的界限很模糊。他更喜欢谈论两者的工作重心,而不是界限,因为定义团队的目标是明确重点,而不是制造分歧。同样地,机器学习工程师和数据科学家的界限也不清晰,那取决于个人的职业选择和背景。例如,机器学习工程师并不一定是个编码专家,他可以是一个有丰富机器学习经验的人。数据科学家同样如此。


感谢杜小芳对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们,并与我们的编辑和其他读者朋友交流(欢迎加入 InfoQ 读者交流群InfoQ 好读者(已满),InfoQ 读者交流群(#2)InfoQ 好读者)。

2015-12-17 18:002267
用户头像

发布了 1008 篇内容, 共 412.4 次阅读, 收获喜欢 346 次。

关注

评论

发布
暂无评论
发现更多内容

AI晚报|GPT-4o最新语音交互模式即将上线,微软Build 2024开发者大会即将开幕...

可信AI进展

人工智能

那些你不得不知的常见接口协议!

测吧(北京)科技有限公司

测试

融云荣获甲子光年「2024 中国 AI 出海服务创新企业」奖

融云 RongCloud

如何用ByteHouse,实现金融场景下的精准营销

极客天地

自如开启国际化租房业务布局,中国经验能否复制到全球?

Alter

一键自动化博客发布工具,用过的人都说好(头条篇)

程序那些事

工具 程序那些事 自动发布

【IT小知识】堡垒机支持哪些私有云平台?

行云管家

网络安全 私有云 等保 堡垒机

Databend 开源周报第 145 期

Databend

即刻职达携手众多企业达成战略合作,共绘人力资源行业创新发展新篇章

新消费日报

赛前辅导 | 职场<火焰杯>测试开发大赛赛前辅导-Web自动化测试

测吧(北京)科技有限公司

测试

事业-最佳实践-架构-泛化建模

南山

领域驱动设计 DDD 领域建模 领域模型 泛化

CHIMA 回顾|图尔兹携 HySuite 亮相,新一代医疗数据安全方案更全面、更精准、更智能

BinTools图尔兹

数据安全 电子病历 数据库管理 医疗信息化 互联互通

LED显示屏:舞台艺术变革

Dylan

艺术 科技 LED显示屏 led显示屏厂家 舞台表演

LLM 大模型学习必知必会系列(五):数据预处理(Tokenizer分词器)、模板(Template)设计以及LLM技术选型

汀丶人工智能

人工智能 大模型

事业-最佳实践-架构-理解软件架构的意义

南山

架构 软件架构

事业-最佳实践-架构-框架选型

南山

框架 技术选型 框架选型

火焰杯测试开发大赛赛前辅导——web自动化

霍格沃兹测试开发学社

报名倒计时丨职场<火焰杯>测试开发大赛报名仅剩最后3天!

测吧(北京)科技有限公司

测试

【深度解析】那些你不得不知的常见接口协议!

测试人

软件测试

【FAQ】HarmonyOS SDK 闭源开放能力 —Map Kit(2)

HarmonyOS SDK

HarmonyOS

实战指南:API 集成测试详解

Apifox

测试 后端 集成测试 API 测试工具

报名倒计时丨职场<火焰杯>测试开发大赛报名仅剩最后3天!

测试人

软件测试

事业-最佳实践-架构-降低系统复杂度

南山

架构设计 架构设计原则 设计原则 复杂度 系统复杂度

中间件是什么?信创中间件有哪些牌子?

行云管家

中间件 信创 堡垒机

低代码赋能!让传统工业企业重新夺回数字化转型主动权!

优秀

低代码 数字化转型 工业数字化

Quora数据科学家和机器学习工程师是如何合作的_语言 & 开发_谢丽_InfoQ精选文章