武汉的开发者们注意啦!AI技术战略、框架以及最佳实战尽在Azure OpenAI Day 了解详情
写点什么

数据科学家与软件工程师能否一人兼顾?

  • 2019-11-05
  • 本文字数:1726 字

    阅读完需:约 6 分钟

数据科学家与软件工程师能否一人兼顾?

在这篇文章中,作者试图说明软件开发人员和数据科学家这两种角色所需要的技能并不像人们所说的那样,它们其实并没有相差得那么远。


因为我有软件开发背景,所以当一些同事说一个人不能同时兼顾数据科学家和软件开发人员这两种角色时,我会感到很惊讶。此外,有很多人说数据科学家所需要的技能与软件开发人员所需要的技能是不一样的。虽然这些说法在某种程度上可能是对的,但在这篇文章中,我将试图说明这两种角色所需要的技能并不像人们所说的差得那么远。它们看起来并不像这样:



而是像这样:



事实上,数据科学也可以从软件开发领域获取经验。在本文中,我将提到一些可能会有用的实践。我的观点是,一名优秀的具备一定机器学习和人工智能知识的软件开发人员可以为企业带来极大的价值。


可能会有人问我为什么要写这篇文章。好吧,我感觉我们的行业里存在一些不好的风气。我从来都不喜欢那些所谓的“精英”人士,我也花了很多时间与那种“高高在上”的态度作斗争。在我的一个有关如何对抗焦虑、小我和过度热衷某些事物的演讲中,我就讲到了这个话题。当然,这只是我的个人观点,是基于我个人经验得出的,如果你有任何不同的想法,请在评论区留言。

简洁的代码


数据科学家都是聪明人,他们的数学能力和从不同角度看待数据的能力令人叹服。但是,有时候阅读和理解数据科学家的代码可能会是巨大的痛苦。在团队中,这可能会是一个大问题。优秀的软件开发人员学会了如何用简洁的代码来表达复杂的思想和概念。但在我看来,数据科学家在这方面还差得比较远。


另一种观点认为,编码只是数据科学家的一个临时工具。在未来,工具将朝着可视化的方向发展。这种说法在某种程度上也是对的。但即使是这样,编码也仍然是数据科学家工具箱中的一个宝贵的工具。软件开发工具也会朝着这个方向发展。例如,现在有各种 CMS 和开箱即用的解决方案可以帮我们快速创建网站。


但我们需要注意的是,这些工具究竟可以帮助我们走多远?另外,请想一想 CMS 开发人员与精通某种 JavaScript 框架的开发人员之间的薪水差异。在我看来,编码技能是必不可少的,至少在很长一段时间内是这样。在编码方面精益求精对于个人和整个团队来说都有巨大的好处。

版本管理和自动化


机器学习模型和神经网络最终会被部署到某种应用中,但有时候它们也需要进行重新训练和维护,其中一些需要额外的人工输入。软件开发人员知道在部署过程中可能会出现哪些风险,他们还知道如何通过(模型的)版本控制来降低这些风险,以及如何对部署和训练进行自动化。

数 学


之前已经说过,数据科学家具有高超的数学能力,这是毫无疑问的。但软件开发人员通常也具有扎实的数学功底,特别是那些拥有计算机科学学位的人。当然,他们很可能会把线性代数和概率论忘掉,但这个问题很容易解决。


最重要的是,优秀的软件开发人员能够快速地吸收知识,并将其应用到不同的技术中。如果一个开发人员具备了数据科学知识,他可以很容易地从 Python 转到 R 语言。

数 据


除了统计学家和数据科学家,还有谁会天天与数据打交道?是的,你们都知道我想要说的是谁。从职业生涯的第一天开始,开发人员就要学习各种存储、读取和显示数据的方法。SQL,一种可能会一直存在下去的语言,还可以转移到其他技术,如 Pandas。


除此之外,懂得如何使用 NoSQL 数据库(如 MongoDB)在近几年来也成了一项必备技能。开发人员也因此具备了大量非结构化数据方面的经验。另外,大多数软件开发人员都知道如何开发 Web 爬虫。

面向客户和演示


数据科学家需要为客户找到最佳的解决方案,并帮助他们改进业务。数据可视化和说明某些业务决策的基本原理是他们工作的组成部分。软件开发人员通常不太熟悉业务流程,但他们能够理解需求,并知道需要做些什么。技术团队负责人和软件架构师通常具备这些技能,所以在与客户的初始研讨会中,他们会显得非常有用。除此之外,如果开发人员经历过敏捷开发,他们可能会习惯于定期向利益相关者展示软件的功能特性。

结 论

在这篇文章中,我试图说明为什么软件开发和数据科学所需要的技能其实并没有相差得那么远。从软件开发到数据科学,对于优秀的软件开发人员来说应该不是什么大问题。


英文原文:


[https://rubikscode.net/2019/10/07/can-you-be-data-scientist-and-software-developer-at-the-same-time/


公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2019-11-05 11:021336
用户头像
陈思 InfoQ编辑

发布了 576 篇内容, 共 261.0 次阅读, 收获喜欢 1293 次。

关注

评论

发布
暂无评论
发现更多内容

「Oracle」Oracle 数据库安装

恒生LIGHT云社区

数据库 oracle

搞定大厂算法面试之leetcode精讲4.贪心

全栈潇晨

LeetCode 算法面试

模块四作业

Geek_1d37ea

架构训练营

关于HTTPS认证,这里解决你所有疑惑

华为云开发者联盟

https 证书 数据加密 认证 签发证书

吐司盒子?芝士码?HarmonyOS创新音视频测试技术来啦|HDC2021技术分论坛

HarmonyOS开发者

HarmonyOS

“愚公移山”的方法解atoi,自以为巧妙!

老表

Python LeetCode 11月日更 算法与数据结构

Android C++系列:Linux进程(三)

轻口味

c++ android jni 11月日更

前端开发:数据处理方法分享(其一)

三掌柜

11月日更

dart系列之:在dart中使用数字和字符串

程序那些事

flutter dart 程序那些事 11月日更

数仓如何限制临时数据文件下盘量

华为云开发者联盟

sql 线程 GaussDB(DWS) 临时文件 落盘

HarmonyOS内核技术大揭秘|HDC2021技术分论坛

HarmonyOS开发者

HarmonyOS

linux下prometheus+grafana安装

小鲍侃java

11月日更

SAP Cloud for Customer Extensibility的设计与实现

Jerry Wang

SAP abap C4C 11月日更

筹备两年,60万字诚意续作《腾讯游戏开发精粹Ⅱ》正式发布

博文视点Broadview

IntelliJ IDEA 如何针对 Java 项目创建 H2 数据库连接

HoneyMoose

Junit 4 的 @Before 和 @BeforeClass 对比 Junit 5 @BeforeEach 和 @BeforeAll

HoneyMoose

填坑总结:python内存泄漏排查小技巧

华为云开发者联盟

Python 内存 内存泄漏 回收 全局变量

MySQL Workbench 使用教程 - 如何使用 Workbench 操作 MySQL / MariaDB 数据库中文指南

蒋川

MySQL MariaDB MySQL 数据库

Chrome 插件特性及实战场景案例分析

vivo互联网技术

大前端 插件设计 chrome扩展

应用不停机发布的思考与初识

陈俊

高可用 技术架构 不停机发布

创建第一个微信小程序

坚果

微信小程序 11月日更

奖金翻倍!Flink Forward Asia Hackathon 最新参赛指南请查收

Apache Flink

大数据 flink 编程 后端 hackathon

又添权威认定,旺链科技通过可信区块链专项认证!

旺链科技

区块链 产业区块链 技术测评 数字化经济

模块四学习总结

Geek_1d37ea

架构训练营

Sechunter移动应用隐私合规检测详解

华为云开发者联盟

移动应用 目标检测 隐私 Sechunter 隐私合规

有幸和美团大佬共同探讨单节点连接数超1.5W的问题

中间件兴趣圈

架构 微服务 11月日更

Hibernate H2 数据库连接配置 URL 解读

HoneyMoose

云原生社区上线了

云原生

开源 云原生 技术社区 社区

如何让 Sublime Text 编辑器支持新的 ABAP 关键字

Jerry Wang

SAP abap 11月日更 Sublime

OpenHarmony驱动框架解读和开发实践|HDC2021 技术分论坛

HarmonyOS开发者

HarmonyOS

一次谈不上有点内卷的美东某金融公司面试

HoneyMoose

数据科学家与软件工程师能否一人兼顾?_AI&大模型_Rubikscode_InfoQ精选文章