NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

通过自学数据科学和机器学习,我在一年内薪水增加了 40%

  • 2021-06-24
  • 本文字数:2714 字

    阅读完需:约 9 分钟

通过自学数据科学和机器学习,我在一年内薪水增加了40%

在不断扩大的数据领域,存在着许多职业机会。找到你自己的位置——找到你的薪水(水平)——很大程度上取决于你的付出、专注和学习的动力。如果你是一个有抱负的数据科学家或者已经开启你的职业生涯,有很多种策略可以最大化你的潜在收入。


首先声明,这篇文章只是更多地反映了我为达到今天的水平所做的一切。我并不是说你会通过同样的步骤来实现同样的目标,但我认为这可能会为你提供一个你之前没有想过的独特视角。


为了让我的收入翻番,我做了三件主要的事:


  1. 提升技能(在数据科学和机器学习方面)

  2. 写博客(关于数据科学和机器学习)

  3. 自由职业(数据科学和机器学习项目)

一、提升技能

如今,许多人倾向于寻找高风险高回报的投资,比如比特币,以期“快速致富”,但正如沃伦•巴菲特(Warren Buffett)所言,你所能做的最好投资就是投资你自己。对于那些没有钱但想要改善他们的财务状况的人来说更是如此。


通过简单的自我提升,学习数据科学和机器学习,我在一年内使薪水增加了 40%。


在过去一年中,我关注了 3 个主要领域:

数据操作 (SQL/Pandas)

在我看来,用 SQL 和 Pandas 进行数据操作是给我带来最大好处的最重要的领域。根据我的经验,大部分时间都是用来查询数据、探索数据和打包数据,所有这些都需要 SQL 和 Pandas。


在我的所有与数据有关的工作中(增长营销分析师、数据分析师、数据科学家),SQL 一直是共同所需的技能,可以说是数据专家最重要的技能。


下面是我自学 SQL 和 Pandas 的一些资源:


  • Mode的SQL教程:我总是推荐这个资源,因为它是一个用来了解要学习哪些概念的很好的指南,即使你不用它来实际学习概念。他们将概念拆分为不同的难度级别,这一点非常棒。

  • Mode的SQL案例研究:这些案例研究非常好,因为它们使你能够应用已经学到的知识,并批判性地思考如何处理现实场景。

  • LeetCode数据题:我总是将此作为资源使用,特别是在寻找新工作的时候。这是一个很好的方法来模拟涉及 SQL 的编码面试。

  • Pandas习题:Pandas 的语法不是很直观(至少不像 SQL),我一直记得不是很深刻,直到我做完这个 Pandas 习题库!

脚本 (Python)

我因为学校的原因开始使用 Python,我可能会在我的余生中一直坚持使用 Python。它在开源贡献方面遥遥领先,而且学习起来非常简单。


有两个主要资源我强烈推荐用来提高 Python 技能(除了做副业项目之外):


  • LeetCode算法题: 与 SQL 类似,我使用 LeetCode 来学习如何为各种问题编写(有点儿)高效的 Python 脚本。

  • Tech with Tim: Tech with Tim 是一个 YouTube 频道,这意味着它是免费的,但它比大多数付费课程和训练营要好。我强烈建议你看一下他的视频,并一直关注他。

机器学习

当然,作为一名数据科学家肯定是要学习机器学习的。下面是我在职业生涯开始时使用的两个最重要的资源。


  • Kaggle的机器学习简介:如果你像我一样,不太了解机器学习是如何工作的,或者你不知道机器学习使如何在代码中实现的,那么我强烈建议你看一看。

  • StatQuest: StatQuest 对于理解机器学习模型是如何工作的非常棒。一旦你理解了理论,用代码实现它就非常简单。


如果你想了解机器学习的各种算法,请查看我的文章


实际上,我写了一个 52 周的课程,涵盖 SQL、Pandas、Python 和机器学习,你可以在这里查看


既然我已经讲了我自己的技巧,你可能很想知道我是怎么做到的,而这正是我接下来要讲的。

二、数据科学和机器学习博客

你们中的一些人可能知道,我发起了一个名为“52 周的数据科学和机器学习”的个人计划,在这个计划中,我在一整年的每一周都学习、编码、撰写与数据科学和机器学习有关的东西。这主要是为了让我自己对不断学习新东西负责。


在写了 100 多篇文章并建立了超过 20,000 名读者的关注者群体之后,写作现在为我带来总收入的大约 25%。


下面是给我带来巨大成功的三个秘诀:

秘诀 1:找出你擅长写什么、喜欢写什么和人们喜欢读什么的交叉点。



这是我给有抱负的作家的第一个建议。理想情况下,你要找到一个满足所有这三点的合适的位置。


如果你发现一些你擅长写的东西,而且你也喜欢写,但是人们不喜欢读,那么你就不会建立一个关注者群体(假设你关心这点的话)。


如果你找到一个你擅长写的话题,而且人们也喜欢读,但是你并不喜欢写这个话题,那么你不会坚持多久,因为你会失去兴趣。


最后,如果你找到一个你喜欢写且人们喜欢读的话题,但是你并不擅长写这个话题(例如,因为你没有足够的专业知识),那么你可能就没有什么吸引力。


所以,在一开始的时候要找到你的定位。我将在秘诀 #3 中对此进行详细说明。

秘诀 2:理解你写作平台的机制

无论你是在使用 Medium、Substack、Patreon 还是其它平台写博客,请务必花时间了解该平台的运作机制。


关于这个,我也没法说的太详细,但是收益是如何计算的、这个平台如何帮你做广告,诸如此类的事情都是需要考虑的重要问题。


通过理解 Medium 的机制和运作方式,我能够最大限度地扩大我的影响力,并最终更快地扩大我的关注者群体。


下一个秘诀将帮助你实现秘诀 #1 和 #2:

秘诀 #3:在创建内容时,考虑“开发 vs. 探索”的概念。

为了找到秘诀 1 中三者的交叉点,并理解你正在写作的平台的机制,要考虑“开发 vs. 探索”的概念。


这个想法来自一个被称为“多臂老虎机问题”的统计学问题。我不想谈太多细节,但“探索和开发”背后的主要思想是决定探索和寻找新的潜在想法,还是利用你已经知道的有效的想法。


在你写作/写博客的职业生涯的初期,最好探索和尝试尽可能多的想法,看看什么是最适合你的。这意味着写作不同的主题,在不同的出版物上发表文章,并尽可能尝试新的写作风格。


当你在写作风格和偏好上越来越成熟时,你可能会偶然发现一个“秘方”,它能让你在写作中获得持续的成功。这时你就可以开始利用这一突破,并加倍利用你的秘诀。


总之,在早期尽可能多地探索,当你开始定义自己并找到成功时,开始利用那些让你成功的见解和想法。

三、自由职业项目

我剩下的一部分收入来自与数据科学和机器学习相关的自由职业项目。我承担的这些项目包括撰写技术论文、撰写营销内容和构建模型。


当我刚开始工作的时候,我只从自由职业项目中赚取几乎最低的薪水。这是有道理的,因为我没有太多的经验,我也不知道我的价值。但是,到了年底,我可以每小时收费 50 美元以上。


我的大部分收入来自科技行业的回头客。事实上,我也不需要接触任何人——我可以通过我的数据科学和机器学习博客来获取我的客户的注意,这也是本文的重点。


我的数据科学和机器学习博客不仅帮助我持续不断地学习,它还帮助我建立了自己的关注者群体,并帮助我获得了一些自由职业项目的客户。

作者介绍

Terence Shin 一位具有 3 年 SQL 经验和 2 年 Python 经验的数据爱好者,Towards Data Science 和 KDnuggets 的博主。


原文链接


https://www.kdnuggets.com/2021/06/double-income-data-science-machine-learning.html

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2021-06-24 09:004090
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 494.0 次阅读, 收获喜欢 1967 次。

关注

评论

发布
暂无评论
发现更多内容

Linux 中的文件锁定命令:flock、fcntl、lockfile、flockfile

wljslmz

Linux 三周年连更

监控服务与zabbix介绍

乌龟哥哥

三周年连更

项目管理系统Redmine怎么样

PingCode

项目管理 项目管理软件

Prometheus实战-从0构建高可用监控平台(三)

小毛驴的烂笔头

Linux Prometheus

毕业设计-100w秒杀设计

Sam

架构实战营

对比编程语言的四种错误处理方法,哪种才是最优方案?

Python猫

编程

Fabarta 与青岛市城阳区政府达成战略合作,共同推动区域数据要素市场建设

Fabarta

数据挖掘 数据要素 数据资产管理 图智能 数据要素流通

Flink数据流元素

阿泽🧸

flink 三周年连更

实现CyclicBarrier的原理和在Go中的应用

Jack

如何有效的向 AI 提问 ?

繁依Fanyi

人工智能

视频监控系统选择硬盘,绿盘、蓝盘、紫盘、黑盘、红盘到底选择哪个?

wljslmz

视频监控 三周年连更

所谓高手,就是跨过坑和大海| 社区征文

鸿蒙之旅

三周年征文

Shell语法之基本运算符

智趣匠

Shell 三周年连更 shell变量

程序员 35 岁危机的核心实质是什么?

海拥(haiyong.site)

三周年连更

数据脱敏技术

穿过生命散发芬芳

数据脱敏 三周年连更

如何安装OpenHarmony HAR

鸿蒙之旅

OpenHarmony 三周年连更

JMeter实时性能监控平台实战

测吧(北京)科技有限公司

测试

什么是点对点传输?什么是点对多传输

镭速

Prometheus实战-从0构建高可用监控平台(五)

小毛驴的烂笔头

Linux Prometheus

Django笔记二十五之数据库函数之日期函数

Hunter熊

Python django extract trunc

锐捷网络,无边光景一时新

脑极体

网络

pyFBI让Python运行的性能可视化

IT蜗壳-Tango

三周年连更

苹果Mac电脑安装AutoCAD 2024卡死无响应,怎么办

Rose

cad AutoCAD 2024 Mac版 AutoCAD 2024下载 无响应

Java 网络编程详解

timerring

Java

数据标注——数字世界的基石

来自四九城儿

Prometheus实战-从0构建高可用监控平台(四)

小毛驴的烂笔头

Linux Prometheus

【深入浅出Spring原理及实战】「缓存Cache开发系列」带你深入分析Spring所提供的缓存Cache功能的开发实战指南

洛神灬殇

spring 缓存服务 三周年征文 CacheManager 缓存系统

2023-05-08:我们定义了一个函数 countUniqueChars(s) 来统计字符串 s 中的唯一字符, 并返回唯一字符的个数。 例如:s = “LEETCODE“ ,则其中 “L“, “T

福大大架构师每日一题

Go 算法 rust 福大大

Django认证系统

测吧(北京)科技有限公司

测试

全新 – Amazon EC2 R6a 实例由第三代 AMD EPYC 处理器提供支持,适用于内存密集型工作负载

亚马逊云科技 (Amazon Web Services)

Amazon EC2

健康运动app(2)

鸿蒙之旅

OpenHarmony 三周年连更

通过自学数据科学和机器学习,我在一年内薪水增加了40%_AI&大模型_Terence Shin_InfoQ精选文章