【AICon】AI 基础设施、LLM运维、大模型训练与推理,一场会议,全方位涵盖! >>> 了解详情
写点什么

机器学习,像极了一场足球比赛

  • 2021-03-04
  • 本文字数:2047 字

    阅读完需:约 7 分钟

机器学习,像极了一场足球比赛

本文最初发表于 Towards Data Science 博客,经原作者 Renato Boemer 授权,InfoQ 中文站翻译并分享。


如果向没有技术背景的人解释清楚机器学习,可能有些难度。


如果你是一名专业数据科学家,你会经常被问到一个问题 —“你这个工作是干什么的?”如果向没有技术背景的人解释清楚这个问题,可能有些难度。


卡内基梅隆大学著名计算机科学家 Tom Mitchell 教授给机器学习下的定义是


“一种计算机程序,它从经验 E 中学习某些类别的任务 T 和性能指标 P,如果它在任务 T 中的性能(用 P 来衡量) 随着经验 E 而提高。”


坦率地说,在任何非正式对话中,引用这种专业性很强的定义可能很难让对话继续下去。


而作为一个数据科学家,又经常需要向非技术性的受众解释技术术语。因此,每当我发现自己在解释自己的工作时,我就用到了我的哲学老师曾经用到的同样的技巧:足球类比。即便人们不喜欢足球,他们也可以以某种方式把机器学习和足球运动及规则联系在一起。


但愿足球的比喻有助于你理解或向其他人解释机器学习。

球员(数据)


显然,没有球员,就没有足球赛。无论你是在温布利球场进行职业级别的球赛,还是在街上和朋友们一起踢球,这都不重要。没有球员,那些地方只是一个空旷的足球场和街道。


对于机器学习来说,数据就像球员,没有数据,一切都无从下手。不过,并非所有数据集都是相同的,就像球员一样,C 罗和梅西是伟大的球员,他们超越了人们对于一场精彩的足球比赛的期待。但如果让我上场的话,这就不可能了。因此,优秀的球员才会有出色的表现。


类似地,数据科学中也有一句名言:“垃圾进,垃圾出”。无论你的编程技术多么精湛,或者你的数学知识多么渊博,但如果没有有用的数据集,你的机器学习项目很可能会使你的团队失望。

足球经理(数据准备)


一支足球队的成功离不开足球经理。即便拥有挑选顶级球员的豪华条件,英格兰国家足球队自 1966 年以来也再没有赢得过世界杯。足球经理负责决定谁将参加世界杯。同时,他也负责为球员提供指导,指导日常训练。这个过程很花时间,如果不能很好地完成,球队就不能为下届冠军做好准备。


据一份研究报告称,约 80% 的数据科学家会做数据准备和数据清理。数据专业人员必须将他们的数据集转化为机器学习模型可以学习的格式(例如,将数据归一化,处理空白值等)。不论对于数据科学家还是足球专业人士,这些都不是最令人兴奋的事情。

足球战术(机器学习模型)


球队要想夺冠,就必须根据每个对手的情况改变战术。举例来说,如果美国国家足球队面对四届世界冠军德国国家足球队,他们很有可能建立一个强大的防守体系。若美国队对阵冰岛足球队,则可采用强攻策略,采用不同的进攻战术。因此,一支经过良好训练的球队,只要做到战术合理,那么在 90 分钟内,很有可能进球并取得胜利。


机器学习从业者必须根据给定的特定数据集和期望的结果来决定要应用哪种算法或模型。举例来说,机器学习专业人员根据问题来选择预测模型:分类模型是关于预测标签的,而回归模型是关于预测数量的。因此,熟知哪些规则和技术是项目成功的关键。如,K- 最近邻、逻辑回归、朴素贝叶斯分类器和随机森林是一些常用的机器学习模型。

足球设备(硬件和软件)


足球在不同位置需要不同的装备和训练。举例来说,只有门将才能用手触球。因此,他们需要(特殊的)手套和独特的体能训练,而其他人则需要来回奔跑 90 分钟,并尝试用额头进球得分。另外,拥有强大赞助商的团队可以雇佣营养师、医学专家甚至数据科学家来分析表现数据。归根结底,设备和独特的专业人才能够帮助一支球队在世界杯上获得成功。


类似地,要处理一个很小的数据集(1000 行×5 列)来创建一些图形,这些图形可以在标准笔记本电脑上使用 Microsoft Excel 生成,但如果要从多个服务器上提取数据并处理数百万行的数据,就需要特定的编程语言 Python 和具有非凡计算能力的高性能设备。



不同联盟(领域专长)


不管你走到哪儿,可能总会有人在踢足球,可能是孩子 / 成人,男人 / 女人,室内 / 业余,线上 / 户外或业余 / 职业等。这都不重要,总有人在玩。另外,你会遇到技术水平的巨大差异。


足球不会因为不同的技术水平和比赛类型而存在缺陷,这正是足球运动的多样性和包容性。每种技术水平或竞赛类型都可以满足某种特殊的需求。有些人喜欢在户外的草地上踢球,而另一些人则喜欢在网上与朋友一起踢球。这也没关系,这些人专攻某一种类型的足球。


机器学习就像足球一样。不同的专业人员在各自的领域拥有不同的专长和工作,例如,商业和企业领域(金融市场);学术和技术领域(在大学研究开发新算法)。

总结


当你正在成为机器学习专家时,你必然会向来自不同背景的人解释你的工作。这个简单有效的类比可以帮助你让他们更容易理解机器学习。关注受众对足球的普遍印象,并与机器学习建立易于记忆的联系。但愿现在,你有了一个有趣的类比,来比喻和通俗解释那些日常生活中的复杂话题。


作者介绍:


Renato Boemer,企业家,毕业于剑桥大学。爱好数据科学和人工智能。


原文链接:


https://towardsdatascience.com/machine-learning-is-like-football-e3e3ace8ce7a

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2021-03-04 10:301590
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 495.5 次阅读, 收获喜欢 1968 次。

关注

评论

发布
暂无评论
发现更多内容

大数据培训在 Presto 中使用哈希改善动态集群缓存命中率

@零度

FlyFish|前端数据可视化开发避坑指南(一)

云智慧AIOps社区

JavaScript 前端 node,js 数据可视化工具

当姿态估计算法遇上《本草纲目》,看“刘畊宏男孩”如何驱动虚拟人

阿里云视频云

计算机视觉 虚拟人 人体姿态

Google Guava中EventBus使用不当会导致什么故障?

BUG侦探

kafka Guava EventBus

许北林:我为什么加入OpenHarmony生态?又为什么要做“启航KP”开发套件?

OpenHarmony开发者

OpenHarmony 开发者故事

比渗透测试更有用,红队演练该如何开展?

青藤云安全

业务逻辑的灵魂在哪里?

清林情报分析师

数据分析 数据建模 数据可视化 分析软件 分析思维

Niobe开发板:基于OpenHarmony操作系统进行多线程(多任务)开发

拓维信息

OpenHarmony

AgentTesla病毒解析:利用钓鱼邮件窃取终端隐私数据

火绒安全

数据 终端安全 病毒 隐私安全

使用 jMeter 对需要 User Authentication 的 Restful API 进行并发负载测试

Jerry Wang

Java Jmeter 性能测试 SAP 5月月更

AI简报-Image Colorization调研

AIWeker

深度学习 5月月更 AI简报 Image Colorization

Tech Talk 活动预告丨云原生 DevOps 的 Kubernetes 技巧

亚马逊云科技 (Amazon Web Services)

云原生

所谓测试报告

FunTester

不会这3个ChartBuilder使用技巧,怎么开发优秀的数字孪生可视化项目?

ThingJS数字孪生引擎

【小知识】云管理平台与一般管理系统有什么区别?

行云管家

云计算 云管理平台 云管理

如何在30分钟完成表格增删改查的前后端框架搭建

葡萄城技术团队

前端 前后端 系统搭建 表格系统

解读分布式调度平台Airflow在华为云MRS中的实践

华为云开发者联盟

Python spark airflow 华为云MRS 大数据集群

MySQL缓存策略分析

C++后台开发

MySQL 数据库 后端开发 Linux服务器开发 C++后台开发

涛思数据与中天钢铁签署战略合作协议,加速钢铁行业的数字化发展

TDengine

数据库 tdengine

2022年广州市等保测评公司新排名看这里!

行云管家

网络安全 等保 等保测评 广州 等保测评公司

音视频开发进阶课程|第一期:音频要素

ZEGO即构

RTC 音视频开发 音视频课程 音视频基础入门

跨平台应用开发进阶(八) :uni-app 实现Android原生APP-云打包集成极光推送(JG-JPUSH)详细教程

No Silver Bullet

uni-app 极光推送 5月月更 云打包

Authing 渠道合作伙伴火热招募中!

Authing

网络效应 Idaas 合作网络

架构实战营 第 6 期 模块六课后作业

火钳刘明

#架构实战营 「架构实战营」

数据分析软件有哪些分类?

清林情报分析师

数据分析 数据可视化 知识图谱 分析软件 分析工具

如何在 Web 应用里消费 SAP Leonardo 的机器学习 API

Jerry Wang

机器学习 前端开发 前端框架 SAP 5月月更

31点经验分享与吐槽

老白鹿

作为软件工程师,给年轻时的自己的建议(上)

禅道项目管理

程序员 工程师 职业成长

跨平台应用开发进阶(七) :uni-app 自定义 showToast

No Silver Bullet

uni-app 5月月更 吐司弹窗 跨终端

郑重声明

Authing

身份云 Idaas

科创人·智慧芽技术副总裁屠昶旸:技术之路是挑战之路,不愿在大厂空耗岁月

科创人

机器学习,像极了一场足球比赛_文化 & 方法_Renato Boemer_InfoQ精选文章