写点什么

Quora 数据科学家和机器学习工程师是如何合作的

  • 2015-12-17
  • 本文字数:974 字

    阅读完需:约 3 分钟

数据科学家和机器学习工程师如何有效协作是一个困扰许多公司的问题。在前不久于旧金山举行的 MLConf 大会上,Quora 工程副总裁 Xavier Amatriain 介绍了他们应对这一问题的方法。近日,他又援引Quora 数据科学家 William Chen 的说法进一步阐述了 Quora 的做法。

按照 William 的说法,在 Quora,机器学习工程师是工程部门的组成部分,而数据科学家是数据科学部门的组成部分。工程部门负责构建产品和算法,并保证其快速可靠地运行,而数据科学部门负责理解 Quora 的数据,并指导产品决策。但机器学习工程师和数据科学家都会参与机器学习项目,他们的工作主要有如下两个方面的差别:

  • 机器学习工程师构建、实现和维护机器学习系统;
  • 数据科学家进行研究,提出有关机器学习项目的构想,并通过分析了解机器学习系统对公司指标的影响。

更具体地讲,机器学习工程师负责:

  • 构建和实现机器学习系统;
  • 维护机器学习系统,包括速度、可靠性和性能;
  • 开发供内部(机器学习工程师和数据科学家)使用的机器学习框架,为了一些常见任务(如训练 / 测试)提供便利。

数据科学家负责:

  • 评估潜在的或现有的方法、功能、算法或误差度量指标,帮助改进机器学习系统;
  • 分析机器学习算法对公司关键指标的影响;
  • 通过构建机器学习模型(仅用于一次性分析而不放入生产环境)研究和了解用户行为模式。

通常,机器学习项目会同时配备数据科学家和机器学习工程师。在 Quora,他们通过如下三个步骤实现合作:

  • 数据科学家进行研究,确定机器学习系统可能的需求或改进项;
  • 机器学习工程师构建、实现或改进机器学习系统;
  • 数据科学家评估机器学习系统对公司关键指标的影响。

对于 William 的说法,Xavier 作了一些补充。他认为,机器学习团队和数据科学团队的界限很模糊。他更喜欢谈论两者的工作重心,而不是界限,因为定义团队的目标是明确重点,而不是制造分歧。同样地,机器学习工程师和数据科学家的界限也不清晰,那取决于个人的职业选择和背景。例如,机器学习工程师并不一定是个编码专家,他可以是一个有丰富机器学习经验的人。数据科学家同样如此。


感谢杜小芳对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们,并与我们的编辑和其他读者朋友交流(欢迎加入 InfoQ 读者交流群InfoQ 好读者(已满),InfoQ 读者交流群(#2)InfoQ 好读者)。

2015-12-17 18:002400
用户头像

发布了 1008 篇内容, 共 426.0 次阅读, 收获喜欢 346 次。

关注

评论

发布
暂无评论
发现更多内容

助力出海!德国铁路与宝马车厂应用IoTDB数字化解决方案

Apache IoTDB

Shopify API对接的测试

北京木奇移动技术有限公司

跨境电商 软件外包公司 shopify开发

AI技术赋能企业财务管理,用友BIP创新五大智能财务场景

用友智能财务

AI 财经 数智化 会计

BOE(京东方)位列2024年PCT国际专利申请榜全球第6 创新引擎推动产业高质发展

科技热闻

AI Agent成大模型落地“接盘侠”,百度、智谱AI等国内巨头齐发力,你了解多少?

Techinsight

虾皮(shopee)商品详情API接口详解

tbapi

Shopee shopee API shopee商品详情接口 shopee商品列表接口 shopee数据采集

人工智能丨35岁危机码农如何靠AI翻盘?这波浪潮不跟就淘汰!

测试人

人工智能

爬虫+动态代理助力 AI 训练数据采集

袁袁袁袁满

代理IP Python爬虫 爬虫实战 免费代理

传统零售行业数字化转型,如何破局电商冲击与多变需求?

Techinsight

高效通过等保:哈尔滨等保整改方案,70分合格一键落地

黑龙江陆陆信息测评部

互联网技术 等保评测 黑龙江

实验室辅助管理系统(源码+文档+讲解+演示)

深圳亥时科技

【GreatSQL优化器-17】DYNAMIC RANGE

GreatSQL

阿里云 AI 搜索产品荣获 Elastic Innovation Award 2024

阿里云大数据AI技术

人工智能 elastic GenAI AI搜索

Shopify对接API开发的主要功能

北京木奇移动技术有限公司

跨境电商 软件外包公司 shopify开发

「DeepSeek-V3 技术解析」:多头潜在注意力机制(MLA)

Baihai IDP

程序员 AI LLM DeepSeek v3 MLA

投诉问题处理系统(源码+文档+讲解+演示)

深圳亥时科技

2025杭州国际智慧城市,物联网展览会

AIOTE智博会

物联网展 智慧城市展

Shopify API对接的注意事项

北京木奇移动技术有限公司

跨境电商 软件外包公司 shopify开发

DataWorks :Data+AI 一体化开发实战图谱

阿里云大数据AI技术

大数据 AI gpu 数据处理 Dataworks

边缘计算学习资料,边缘计算架构设计和技术应用

金陵老街

边缘计算

陆陆小科普:让你做黑龙江等保测评整改,少走弯路

黑龙江陆陆信息测评部

等保测评 网络安全信息安全、 哈尔滨 黑龙江

虾皮(shopee)商品列表API接口详解

tbapi

shopee API shopee商品详情接口 shopee商品列表接口

数据分析与AI丨利用知识图谱实现 AI Fabric 治理

Altair RapidMiner

人工智能 AI 数据分析 知识图谱 RapidMiner

央国企数字化转型难点重重,如何破局?

Techinsight

干货!传统工厂数字化转型,从规划到落地的实战要点

Techinsight

工厂安全审计系统(源码+文档+讲解+演示)

深圳亥时科技

《Operating System Concepts》阅读笔记:p389-p407

codists

操作系统

“满血版AI”如何进入智慧家庭?答案在华为FTTR星光F60

脑极体

AI

Quora数据科学家和机器学习工程师是如何合作的_语言 & 开发_谢丽_InfoQ精选文章