写点什么

通过自学数据科学和机器学习,我在一年内薪水增加了 40%

  • 2021-06-24
  • 本文字数:2714 字

    阅读完需:约 9 分钟

通过自学数据科学和机器学习,我在一年内薪水增加了40%

AI 大模型超全落地场景&金融应用实践,8 月 16 - 19 日 FCon x AICon 大会联诀来袭、干货翻倍!

在不断扩大的数据领域,存在着许多职业机会。找到你自己的位置——找到你的薪水(水平)——很大程度上取决于你的付出、专注和学习的动力。如果你是一个有抱负的数据科学家或者已经开启你的职业生涯,有很多种策略可以最大化你的潜在收入。


首先声明,这篇文章只是更多地反映了我为达到今天的水平所做的一切。我并不是说你会通过同样的步骤来实现同样的目标,但我认为这可能会为你提供一个你之前没有想过的独特视角。


为了让我的收入翻番,我做了三件主要的事:


  1. 提升技能(在数据科学和机器学习方面)

  2. 写博客(关于数据科学和机器学习)

  3. 自由职业(数据科学和机器学习项目)

一、提升技能

如今,许多人倾向于寻找高风险高回报的投资,比如比特币,以期“快速致富”,但正如沃伦•巴菲特(Warren Buffett)所言,你所能做的最好投资就是投资你自己。对于那些没有钱但想要改善他们的财务状况的人来说更是如此。


通过简单的自我提升,学习数据科学和机器学习,我在一年内使薪水增加了 40%。


在过去一年中,我关注了 3 个主要领域:

数据操作 (SQL/Pandas)

在我看来,用 SQL 和 Pandas 进行数据操作是给我带来最大好处的最重要的领域。根据我的经验,大部分时间都是用来查询数据、探索数据和打包数据,所有这些都需要 SQL 和 Pandas。


在我的所有与数据有关的工作中(增长营销分析师、数据分析师、数据科学家),SQL 一直是共同所需的技能,可以说是数据专家最重要的技能。


下面是我自学 SQL 和 Pandas 的一些资源:


  • Mode的SQL教程:我总是推荐这个资源,因为它是一个用来了解要学习哪些概念的很好的指南,即使你不用它来实际学习概念。他们将概念拆分为不同的难度级别,这一点非常棒。

  • Mode的SQL案例研究:这些案例研究非常好,因为它们使你能够应用已经学到的知识,并批判性地思考如何处理现实场景。

  • LeetCode数据题:我总是将此作为资源使用,特别是在寻找新工作的时候。这是一个很好的方法来模拟涉及 SQL 的编码面试。

  • Pandas习题:Pandas 的语法不是很直观(至少不像 SQL),我一直记得不是很深刻,直到我做完这个 Pandas 习题库!

脚本 (Python)

我因为学校的原因开始使用 Python,我可能会在我的余生中一直坚持使用 Python。它在开源贡献方面遥遥领先,而且学习起来非常简单。


有两个主要资源我强烈推荐用来提高 Python 技能(除了做副业项目之外):


  • LeetCode算法题: 与 SQL 类似,我使用 LeetCode 来学习如何为各种问题编写(有点儿)高效的 Python 脚本。

  • Tech with Tim: Tech with Tim 是一个 YouTube 频道,这意味着它是免费的,但它比大多数付费课程和训练营要好。我强烈建议你看一下他的视频,并一直关注他。

机器学习

当然,作为一名数据科学家肯定是要学习机器学习的。下面是我在职业生涯开始时使用的两个最重要的资源。


  • Kaggle的机器学习简介:如果你像我一样,不太了解机器学习是如何工作的,或者你不知道机器学习使如何在代码中实现的,那么我强烈建议你看一看。

  • StatQuest: StatQuest 对于理解机器学习模型是如何工作的非常棒。一旦你理解了理论,用代码实现它就非常简单。


如果你想了解机器学习的各种算法,请查看我的文章


实际上,我写了一个 52 周的课程,涵盖 SQL、Pandas、Python 和机器学习,你可以在这里查看


既然我已经讲了我自己的技巧,你可能很想知道我是怎么做到的,而这正是我接下来要讲的。

二、数据科学和机器学习博客

你们中的一些人可能知道,我发起了一个名为“52 周的数据科学和机器学习”的个人计划,在这个计划中,我在一整年的每一周都学习、编码、撰写与数据科学和机器学习有关的东西。这主要是为了让我自己对不断学习新东西负责。


在写了 100 多篇文章并建立了超过 20,000 名读者的关注者群体之后,写作现在为我带来总收入的大约 25%。


下面是给我带来巨大成功的三个秘诀:

秘诀 1:找出你擅长写什么、喜欢写什么和人们喜欢读什么的交叉点。



这是我给有抱负的作家的第一个建议。理想情况下,你要找到一个满足所有这三点的合适的位置。


如果你发现一些你擅长写的东西,而且你也喜欢写,但是人们不喜欢读,那么你就不会建立一个关注者群体(假设你关心这点的话)。


如果你找到一个你擅长写的话题,而且人们也喜欢读,但是你并不喜欢写这个话题,那么你不会坚持多久,因为你会失去兴趣。


最后,如果你找到一个你喜欢写且人们喜欢读的话题,但是你并不擅长写这个话题(例如,因为你没有足够的专业知识),那么你可能就没有什么吸引力。


所以,在一开始的时候要找到你的定位。我将在秘诀 #3 中对此进行详细说明。

秘诀 2:理解你写作平台的机制

无论你是在使用 Medium、Substack、Patreon 还是其它平台写博客,请务必花时间了解该平台的运作机制。


关于这个,我也没法说的太详细,但是收益是如何计算的、这个平台如何帮你做广告,诸如此类的事情都是需要考虑的重要问题。


通过理解 Medium 的机制和运作方式,我能够最大限度地扩大我的影响力,并最终更快地扩大我的关注者群体。


下一个秘诀将帮助你实现秘诀 #1 和 #2:

秘诀 #3:在创建内容时,考虑“开发 vs. 探索”的概念。

为了找到秘诀 1 中三者的交叉点,并理解你正在写作的平台的机制,要考虑“开发 vs. 探索”的概念。


这个想法来自一个被称为“多臂老虎机问题”的统计学问题。我不想谈太多细节,但“探索和开发”背后的主要思想是决定探索和寻找新的潜在想法,还是利用你已经知道的有效的想法。


在你写作/写博客的职业生涯的初期,最好探索和尝试尽可能多的想法,看看什么是最适合你的。这意味着写作不同的主题,在不同的出版物上发表文章,并尽可能尝试新的写作风格。


当你在写作风格和偏好上越来越成熟时,你可能会偶然发现一个“秘方”,它能让你在写作中获得持续的成功。这时你就可以开始利用这一突破,并加倍利用你的秘诀。


总之,在早期尽可能多地探索,当你开始定义自己并找到成功时,开始利用那些让你成功的见解和想法。

三、自由职业项目

我剩下的一部分收入来自与数据科学和机器学习相关的自由职业项目。我承担的这些项目包括撰写技术论文、撰写营销内容和构建模型。


当我刚开始工作的时候,我只从自由职业项目中赚取几乎最低的薪水。这是有道理的,因为我没有太多的经验,我也不知道我的价值。但是,到了年底,我可以每小时收费 50 美元以上。


我的大部分收入来自科技行业的回头客。事实上,我也不需要接触任何人——我可以通过我的数据科学和机器学习博客来获取我的客户的注意,这也是本文的重点。


我的数据科学和机器学习博客不仅帮助我持续不断地学习,它还帮助我建立了自己的关注者群体,并帮助我获得了一些自由职业项目的客户。

作者介绍

Terence Shin 一位具有 3 年 SQL 经验和 2 年 Python 经验的数据爱好者,Towards Data Science 和 KDnuggets 的博主。


原文链接


https://www.kdnuggets.com/2021/06/double-income-data-science-machine-learning.html

公众号推荐:

AIGC 技术正以惊人的速度重塑着创新的边界,InfoQ 首期《大模型领航者AIGC实践案例集锦》电子书,深度对话 30 位国内顶尖大模型专家,洞悉大模型技术前沿与未来趋势,精选 10 余个行业一线实践案例,全面展示大模型在多个垂直行业的应用成果,同时,揭秘全球热门大模型效果,为创业者、开发者提供决策支持和选型参考。关注「AI前线」,回复「领航者」免费获取电子书。

2021-06-24 09:004132
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 505.9 次阅读, 收获喜欢 1970 次。

关注

评论

发布
暂无评论
发现更多内容

Web 键盘输入法应用开发指南 (2) —— 键盘事件

天择

JavaScript 键盘 输入法 3月月更

ironSource 新功能发布,开发者可在同一会话中实时调整广告策略

Geek_2d6073

与容器服务 ACK 发行版的深度对话第二弹:如何借助 hybridnet 构建混合云统一网络平面

阿里巴巴云原生

阿里云 云原生 ACK Distro

ToB月报丨二月融资总金额超152亿元;「东数西算」国家工程全面启动

ToB行业头条

活动预告 | DataOps + MLOps Meetup

第四范式开发者社区

人工智能 机器学习 开源 DevOps MLOps

阿里云智能编码插件,更Cosy的开发体验

阿里云云效

Java 阿里云 程序员 开发 研发

Serverless常见的应用设计模式

亚马逊云科技 (Amazon Web Services)

Serverless 架构

白话大数据 | 从买菜这件小事来聊聊数据仓库

星环科技

创建公司内部文档的入门指南

小炮

工作效率 企业管理 企业管理软件

布局说明 - 大屏云极简使用手册

shulinwu

可视化 数据可视化 大屏可视化 智慧大屏可视化 大屏

开讲了!龙蜥社区走进北大课堂

OpenAnolis小助手

开源 操作系统 龙蜥社区 北京大学 走进高校

HertzBeat赫兹跳动v1.0.beta.4 发布, 易用友好的高性能监控告警系统

TanCloud探云

开源 APM 监控 监控系统 监控告警

【BBC learningenglish】with Tango

IT蜗壳-Tango

IT蜗壳教学 3月月更 Tango English

Serverless 底座的持续创新

亚马逊云科技 (Amazon Web Services)

Serverless 架构

星环科技ArgoDB 3.2正式发布,全面升级易用性、性能和安全

星环科技

数据库

低代码平台设计探索,如何更好赋能开发者

雯雯写代码

低代码 开发平台 开发者,

2021 “科创中国”开源创新榜单公布,优麒麟荣登两榜!

优麒麟

Linux 开源 开源社区 优麒麟

【案例】基于星环科技数据云平台TDC为富国基金建设万能的数据湖

星环科技

数据库

实践GoF的23种设计模式:SOLID原则(上)

华为云开发者联盟

设计模式 GoF SOLID SOLID原则 分布式应用系统

前端架构三大巨头之一Angular | 深度讲解

云智慧AIOps社区

开源 前端 Web angular 数据源

易观分析对《关于银行业保险业数字化转型的指导意见》的解读

易观分析

银行 数字化

应用数仓ODBC前,这些问题你需要先了解一下

华为云开发者联盟

数据库 GaussDB(DWS) 驱动 ODBC 驱动管理器

新思科技最新报告显示97%的应用存在漏洞

InfoQ_434670063458

新思科技 应用安全

Nebula Graph 的 KV 存储分离原理和性能测评

NebulaGraph

图数据库 分布式图数据库

教你如何使用flask实现ajax数据入库

华为云开发者联盟

Python 数据库 flask 文件上传 ajax数据

墨天轮国产数据库沙龙 | 许力:阿里云原生Lindorm TSDB数据库,驱动工业IT&OT超融合数字化系统升级

墨天轮

数据库 阿里云 tsdb

融合通信常见问题2月刊 | 云信小课堂

网易云信

音视频 融合通信

【C语言】数据类型存储、原码,反码,补码

謓泽

C语言 补码 原码 反码 3月月更

组件简介 - 大屏云极简使用手册

shulinwu

数据可视化 大屏可视化 智慧大屏可视化 大屏

BFS/DFS/DP 算法案例 LeetCode题目:传递信息

OpenHacker

LeetCode 动态规划 深度优先搜索 算法解析 广度优先搜素

【技术分享】历经16年猪八戒网如何成功实现双活流量架构

八戒技术团队

架构

通过自学数据科学和机器学习,我在一年内薪水增加了40%_AI&大模型_Terence Shin_InfoQ精选文章