“AI 技术+人才”如何成为企业增长新引擎?戳此了解>>> 了解详情
写点什么

为什么我劝你不要当数据科学家?

  • 2020-05-09
  • 本文字数:2734 字

    阅读完需:约 9 分钟

为什么我劝你不要当数据科学家?

数据科学家这一职位越来越火热,人人都想从事数据科学,这不仅因为这份工作听上去高大上,更重要的是,它真的是一份高薪的工作。但是,数据科学家是人人都能做得来的吗?


本文系一篇观点文章,我很乐意听到读者的反驳意见。


成为一名数据科学家是每个人的梦想。甚至连奶奶级的人也想当数据科学家。但是,尽管数据科学可能是 21 世纪最性感的工作,但另一个报酬也同样丰厚的高薪职业——软件工程师,却被低估了。


我经常会收到写刚毕业的学生和想改行的人写来的信,向我寻求从事数据科学的建议。我给他们回信说应该要去做软件工程师。


鉴于我在数据科学家和软件工程师都有经验,我会试着说服你去成为软件工程师。

1. 软件工程的工作岗位更多

与数据科学相比,软件工程领域的工作岗位要多上一个数量级。


下面是我在 Google 上搜索 Indeed(一家招聘网站)上的 “数据科学家” (Data Scientist)和 “软件工程师” (Software Engineer)岗位的截图。


Google 搜索美国 Indeed 数据科学家的结果截图


Google 搜索美国 Indeed 软件工程师的结果截图


从搜索结果来看,数据科学岗位有 7616 个,而软件工程的岗位有 538893 个!这还只是美国的就业情况,但其他国家也显示出类似的结果。


据 Glassdoor 的调查结果称,数据科学家的收入更高,但以我未经验证的假设是,数据科学领域的工作平均而言也更高级。


来源:www.glassdoor.ca


来源:www.glassdoor.ca


也就是说,如果你得到了 Open AI 给的 100 万美元薪水的工作机会,我会建议你要抓住这个机会。

2. “数据科学” 的含义还没有达成共识

管理层对 “数据科学” 的含义往往没有达成共识。也有可能是由于业务上的限制,他们没有办法生搬硬套一个角色框架。


这意味着 “数据科学家” 的职责因公司而异。


粗略描述


虽然从软件工程师到数据科学家之间的理想角色有可能存在,但在现实中却不大可能实现。这点对于那些仍在建设基础设施的初创公司来说尤为如此。


被录用的应聘者最终都是为了解决公司目前需要解决的问题,而不是他们可能被录用的 “角色” 。


来自该领域同事的轶事证据是,许多数据科学家发现,自己像软件工程师一样也要编写后端代码。我还认识其他所谓的 “数据科学家” ,他们是用 Excel 处理财务数据。


而这与参加过 Kaggle 的你的期望大相径庭。

3. 数据科学是孤军奋战的工作

大多数公司并不像软件工程师那样需要那么多的数据科学家。其他公司正在招聘他们的第一位数据科学家。


由于这个原因,许多数据科学家最终都将是孤军奋战,即使他们和开发人员在同一张桌子上工作,也是如此。


这可能会导致很难获得反馈和第二种意见。软件工程师要么不懂预测建模,要么忙于处理完全不同的问题。


相比之下,在软件工程团队的好处之一就是能够对同事们说: “我认为我们应该用 XYZ 的方式实现 ABC。你有什么看法?” 。


要从事数据科学的工作,请做好和你自己或者一只橡皮鸭进行这样的对话的准备。


4. 数据科学是探索性的工作

你要做好与管理层进行尴尬对话的准备,解释为什么你花了两个礼拜的时间做的东西还不能用。


致力于解决已解决的问题与未解决的问题,是软件开发与人工智能的根本区别之一。


撇开错误和约束不谈,在开始任何工作之前,你就应该知道大多数软件工程项目是否可行。但在机器学习领域就不能这样说了,因为你只有在构建模型之后才会知道模型是否有效。

5. 公司还没有为人工智能做好准备

即使在每家公司都是人工智能公司的时代,大多数公司也不具备支持人工智能的基础设施,甚至不需要它。


最近,一家快速扩张的初创公司的数据科学负责人在与我喝咖啡的时候分享了一些建议。


首先,要找出问题所在,然后构建基础设置,再引入数据科学家。这可不是一个快速的过程。(我的转述大意)


最近,另一家知名公司的从事数据科学的零号员工向我发泄。她吐槽称,她被迫在笔记本电脑上而不是在云端上的大数据训练人工智能模型。


如果你被录用后没有具体的问题需要解决,或者公司没有做好数据科学的准备,你可能会发现自己很难提升价值。

6. 软件工程传授通用技能

成为一名初级软件工程师就像获得了技术领域的 MBA,你所学到的东西都只不过是沧海一粟。


你要学习数据库、云技术、部署、安全性和编写简洁的代码。


你要通过观察 Scrum 领导、高级开发人员或项目经理来学习如何管理软件的开发。


你要通过代码审查来得到指导。


如果你进入的公司拥有一支成熟的工程团队,你几乎可以保证你会很快提升自己的技能,并打造出一个通才的背景。

7. 软件工程更具可转移性

通过提供更全面的技术体验,当你决定是时候改变时,软件工程提供了更好的退出机会。


DevOps、安全、前端、后端、分布式系统、商业智能、数据工程、数据科学……


我认识一些从软件行业改行到数据科学的开发人员。如果你浏览一下数据科学的岗位描述,你会立即注意到,岗位描述到处都是核心的软件开发技能。


来源:Indeed


如果你能构建端到端的项目,那么你还可以做更多的工作,而不仅仅是为 Kaggle 构建模型。你可以采用该模型,将其产品化,设置授权和条码,然后开始向用户收取访问费用。这就是你自己的初创公司。


我从来不认为数据科学是不可转移的。根据数据做出决策是一项杀手级技能。但随着我们变得越来越以数据为导向,这也将成为我们每一项工作的一部分。

8. 机器学习将成为软件工程师的工具

随着人工智能的产品化和易于使用,软件工程师将开始使用人工智能来解决他们的问题。


我可以用一下午的时间教会开发者如何构建 Sklearn 分类器。但这并不意味着他们可以构建下一个 AlphaGo,不过,这确实给了他们一个替代基于用户输入的硬编码条件逻辑的选择。


数据科学家有专业知识,比如统计学,以及对模型如何工作的直觉。但 DevOps 和安全工程师也有自己的专业知识。


我认为这些都是常见的,没有什么不同。 一个经验丰富的软件专业人员在不同专业之间的转换速度比一个新入行的人选择一个专业的速度要快一个数量级。


虽然我不认为我们会看到数据科学完全合并到软件工程中,但我确实感觉数据科学有可能会成为另一个软件工程专业。

9. 人工智能不会取代软件工程师

尽管这观点听起来很傻,但我在 2014 年进入了软件工程领域,因为我担心人工智能会让其他工作都被淘汰。


然而从那时起,这一状况就几乎没怎么变过。技术采用的速度很慢,人工智能的应用范围比媒体想象的要窄得多。


与其他专业相比,机器学习离自动化软件工程更远。虽然我们有初创公司在构建酷炫的产品,比如人工智能代码完成,但编写代码并不是真正的工作。这项工作是用技术来解决问题。


在奇点出现之前,软件工程仍然将是一项宝贵的高薪技能。

结 语

首先,本文所述都是轶事。其次,我意识到我将数据科学家、机器学习工程师和人工智能研究人员混为一谈了。但我认为,这些论点仍然值得考虑,因为这是你的职业。


我姑妄言之,你姑妄听之,不必太过当真。我希望你自己研究一下,然后再做决定。这毕竟是作为数据科学家的一部分。


说到底,我们的工作就是解决问题。


原文链接


https://towardsdatascience.com/dont-become-a-data-scientist-ee4769899025


公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2020-05-09 16:194843
用户头像
陈思 InfoQ编辑

发布了 576 篇内容, 共 261.1 次阅读, 收获喜欢 1293 次。

关注

评论

发布
暂无评论
发现更多内容

如何实现数据库读一致性

京东科技开发者

【深入挖掘Java技术】「源码原理体系」盲点问题解析之HashMap工作原理全揭秘(上)

洛神灬殇

Java 源码分析 hashmap 实现原理 2024年第十三篇文章

DxO PhotoLab 7 for Mac(专业照片编辑软件)v7.3.0.43激活版

影影绰绰一往直前

Docker安装RabbitMQ docker安装RabbitMQ完整详细教程

百度搜索:蓝易云

Docker Linux 运维 RabbitMQ 云服务器

高级SQL语句

百度搜索:蓝易云

sql 云计算 Linux 运维 云服务器

深入理解WebSocket ACK:关键技术提升数据传输的可靠性

Apifox

前端 后端 websocket 协议 WebSocket ACK

Navicat Charts Creator for Mac(Navicat图表创建器)v1.2.15激活版

影影绰绰一往直前

Pocket Yoga for mac(口袋瑜伽)v14.3.0激活版

影影绰绰一往直前

如何在苹果手机上进行文件管理

Meta Llama大模型:引领人工智能创新

百度开发者中心

人工智能 深度学习 大模型

软件研发过程中,项目管理工具应该如何选择?

极狐GitLab

Boxy SVG for Mac(矢量图编辑器)v4.21.2免激活版

影影绰绰一往直前

得物云原生容器技术探索与落地实践

得物技术

云原生 技术分享

全面了解网络性能监测:从哪些方面进行监测?

雪奈椰子

DxO ViewPoint 4 for Mac(照片修复校正工具)v4.13.0.282激活版

影影绰绰一往直前

Perfectly Clear Video for Mac(AI视频增强工具)v4.6.0.2632激活版

影影绰绰一往直前

FotoMagico for Mac(专业幻灯片制作软件)v6.5.4激活版

影影绰绰一往直前

IPQ9574: High-performance WiFi7 wireless network chip leading the future

wallysSK

Perfectly Clear Workbench for Mac 永久激活版下载

影影绰绰一往直前

4K Video Downloader Plus Pro for Mac(4K视频下载器)v1.4.0激活版下载

影影绰绰一往直前

DxO PureRAW for Mac(RAW照片处理器)v3.9.0中文激活版

影影绰绰一往直前

Video-LLaMA:为AI大模型注入视听觉

百度开发者中心

人工智能 大模型

为什么需要在 OpenShift 上部署企业级 Ingress Controller

NGINX开源社区

负载均衡 Kubernetes openshift Ingress Controller nginx 开源版

CNCF大使预测:2024年云原生面临倦怠、离职及云成本精简

SEAL安全

云原生 FinOps 开发人员

企业为什么要选择软件定制开发?

天津汇柏科技有限公司

软件定制 软件定制开发 软件开发定制

数字人源码独立部署的教程!

青否数字人

数字人

数据集成时表模型同步方法解析

KaiwuDB

数据库 数据同步 数据集成

活了三十多年终于知道单模光纤与多模光纤

小齐写代码

一文带你揭秘淘宝终端技术

阿里技术

基础设施 招聘 淘宝 终端技术

请用心对待面试机会

老张

面试经验 求职面试 求职技巧

喜讯!无垠智能模糊测试系统入选“2023软件供应链优秀成果”

云起无垠

为什么我劝你不要当数据科学家?_AI&大模型_Chris_InfoQ精选文章