写点什么

Quora 数据科学家和机器学习工程师是如何合作的

  • 2015-12-17
  • 本文字数:974 字

    阅读完需:约 3 分钟

数据科学家和机器学习工程师如何有效协作是一个困扰许多公司的问题。在前不久于旧金山举行的 MLConf 大会上,Quora 工程副总裁 Xavier Amatriain 介绍了他们应对这一问题的方法。近日,他又援引Quora 数据科学家 William Chen 的说法进一步阐述了 Quora 的做法。

按照 William 的说法,在 Quora,机器学习工程师是工程部门的组成部分,而数据科学家是数据科学部门的组成部分。工程部门负责构建产品和算法,并保证其快速可靠地运行,而数据科学部门负责理解 Quora 的数据,并指导产品决策。但机器学习工程师和数据科学家都会参与机器学习项目,他们的工作主要有如下两个方面的差别:

  • 机器学习工程师构建、实现和维护机器学习系统;
  • 数据科学家进行研究,提出有关机器学习项目的构想,并通过分析了解机器学习系统对公司指标的影响。

更具体地讲,机器学习工程师负责:

  • 构建和实现机器学习系统;
  • 维护机器学习系统,包括速度、可靠性和性能;
  • 开发供内部(机器学习工程师和数据科学家)使用的机器学习框架,为了一些常见任务(如训练 / 测试)提供便利。

数据科学家负责:

  • 评估潜在的或现有的方法、功能、算法或误差度量指标,帮助改进机器学习系统;
  • 分析机器学习算法对公司关键指标的影响;
  • 通过构建机器学习模型(仅用于一次性分析而不放入生产环境)研究和了解用户行为模式。

通常,机器学习项目会同时配备数据科学家和机器学习工程师。在 Quora,他们通过如下三个步骤实现合作:

  • 数据科学家进行研究,确定机器学习系统可能的需求或改进项;
  • 机器学习工程师构建、实现或改进机器学习系统;
  • 数据科学家评估机器学习系统对公司关键指标的影响。

对于 William 的说法,Xavier 作了一些补充。他认为,机器学习团队和数据科学团队的界限很模糊。他更喜欢谈论两者的工作重心,而不是界限,因为定义团队的目标是明确重点,而不是制造分歧。同样地,机器学习工程师和数据科学家的界限也不清晰,那取决于个人的职业选择和背景。例如,机器学习工程师并不一定是个编码专家,他可以是一个有丰富机器学习经验的人。数据科学家同样如此。


感谢杜小芳对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们,并与我们的编辑和其他读者朋友交流(欢迎加入 InfoQ 读者交流群InfoQ 好读者(已满),InfoQ 读者交流群(#2)InfoQ 好读者)。

2015-12-17 18:002447
用户头像

发布了 1008 篇内容, 共 431.0 次阅读, 收获喜欢 346 次。

关注

评论

发布
暂无评论
发现更多内容

Netty进阶:手把手教你如何编写一个NIO服务端(1),Java笔试常见编程题

Java 程序员 后端

Nginx服务不行了怎么办,网商银行java面试

Java 程序员 后端

Nginx配置反向代理和负载均衡,疯狂java讲义pdf百度云

Java 程序员 后端

MySQL最全整理(面试题+笔记,华为算法工程师面试经历汇总

Java 程序员 后端

RabbitMQ不讲武德,发个消息也这么多花招,nginx实现负载均衡原理

Java 程序员 后端

MySQL 5,java架构师成长直通车

Java 程序员 后端

MySQL入门篇,java三层架构登录功能实现

Java 程序员 后端

Navicat for MySQL 执行sql文件过程分析(导入数据),中软国际Java笔试题

Java 程序员 后端

Netty权威指南:I-O-多路复用技术,java技术点总结

Java 程序员 后端

new-Object()到底占用几个字节,看完这篇彻底明白了!,springboot微服务架构书籍

Java 程序员 后端

OpenFaaS实战之二:函数入门,mysql集群数据同步原理

Java 程序员 后端

MyCat:第四章:Mycat中的概念,linux内核编译教程

Java 程序员 后端

MySQL 数据库开发入门(四),java高薪训练营百度网盘

Java 程序员 后端

MySQL数据库--几种数据迁移的方法详解都在这了!看完必懂

Java 程序员 后端

Netty相关面试题汇总,java从入门到精通第五版电子书下载微盘

Java 程序员 后端

Oracle最新的Sql笔试题及答案,Java面试真题解析火爆全网

Java 程序员 后端

MySQL 千万数据量深分页优化,mybatis从入门到精通pdf

Java 程序员 后端

Peter-Java 8中的Lambda表达式,java领域的相关技术领域

Java 程序员 后端

Netty学习之旅------图说Netty线程模型,java项目面试难点

Java 程序员 后端

MySql数据引擎简介与选择方法,和字节跳动大佬的技术面谈

Java 程序员 后端

Netty中序列化框架MessagePack的简单实现,java技术面试完了复试

Java 程序员 后端

Netty入门教程——认识Netty,今年最新整理的《高频Java面试题集合》

Java 程序员 后端

Nginx + Tomcat 搭建负载均衡,大牛带你直击优秀开源框架灵魂

Java 程序员 后端

OpenYurt v0,linuxshell学习

Java 程序员 后端

P8级大佬整理在Github上45K+star手册,吃透消化,java算法面试题及答案pdf

Java 程序员 后端

【架构实战营】模块三

衣谷

架构实战营

MyCat教程【分库分表】,java教程pdf百度网盘

Java 程序员 后端

MySQL:第一次看到有人把MYSQL主从复制讲解的这么清楚,mysql教程菜鸟

Java 程序员 后端

Netty案例介绍-群聊案例实现,java架构师教程百度云

Java 程序员 后端

Netty进阶:手把手教你如何编写一个NIO服务端,java集合容器面试

Java 程序员 后端

MySQL 事务隔离级别,java面试常问的设计模式

Java 程序员 后端

Quora数据科学家和机器学习工程师是如何合作的_语言 & 开发_谢丽_InfoQ精选文章