写点什么

如何检查你的项目是不是真的需要用到 AI?

  • 2018-11-23
  • 本文字数:2962 字

    阅读完需:约 10 分钟

如何检查你的项目是不是真的需要用到 AI?

AI 前线导读:


过去几年,机器学习和人工智能日新月异,在各行业都呈现火爆的态势。你是不是也跃跃欲试,想在自己的项目里也用上人工智能呢?且慢,让我们听听来自 Google 的首席决策情报工程师 Cassie Kozyrkov 的看法,她兴趣爱好广泛,涵盖了统计、机器学习 / 人工智能、数据、决策科学、艺术、戏剧等等,在自己的博客发表了大量的观点。今天 AI 前线翻译了她最新的博文 Is your AI project a nonstarter?(《如何检查你的项目是否需要人工智能?》),相信看完她的文章后,你就能够评估自己的项目,到底需不需要加上人工智能。


更多干货内容请关注微信公众号“AI 前线”(ID:ai-front)


这是一份现状核实清单,可以帮助你避免学习困难的痛苦。


如果你要深入研究机器学习或人工智能项目,在深入研究算法、数据和工程之前,你需要先参考这份清单。你可以把这份清单想象成盒子里友好的顾问。


AI 前线注:机器学习可参阅作者的另一篇文章:The simplest explanation of machine learning you’ll ever read(《机器学习极简解释》)(http://u6.gg/fpMkp)关于人工智能,可参阅作者的这篇文章:Are you using the term ‘AI’ incorrectly?(《你是否用错了“人工智能”这词?》) (http://u6.gg/fpMnU)


记住,千万不要浪费时间,不要为了 AI 而 AI。促使你想要应用人工智能的原因,应该是它能够为你做什么,而不是为了听上去有多么科幻。


本文是作者的博文 The ultimate guide to starting AI (《启动 AI 项目的终极指南》)(http://u6.gg/fpNnq)的超短版本。如果你准备使用机器学习或人工智能,我们希望,对于本文所列的所有问题,你的回答都是 “Yes”。


AI 前线注:为什么要使用机器学习或人工智能,作者写了一篇文章 Machine learning — Is the emperor wearing clothes? 《机器学习其实只是“皇帝的新衣”》娓娓道来,深入浅出,你可以看看。


如果这份清单里有任何一个问题你的回答是 No,那么你都不适合将 AI 用到你的项目中,否则你的项目就会像这幅图片里的牛一样被卡住。

开始机器学习 / 人工智能的第一步,共 22 部分:输出、目标和可行性。

  1. 把做决策的工作交给正确的人: 负责你的项目并完成这份清单的人员是否真正了解你的业务?


将决策权委托⁽¹⁾给精通业务的人员,而不是平庸的算法书呆子。


  1. 以输出为中心的构思:你是否能够解释你的系统输出⁽²⁾是什么,以及为什么这些输出是值得去做的?


首先关注你在做什么,而不是怎么做;不要把目标和手段混为一谈。


  1. 灵感来源:你是否至少考虑过将数据挖掘⁽³⁾作为从潜在的使用案例中获取灵感的一种方法?


虽然这不是强制性的要求,但是它可以有助于找到一个好的方向。


  1. 适合机器学习 / 人工智能的任务:你是否自动化了许多决策 / 标签?是否每次当你无法找到完美的答案时,都要使用机器学习 / 人工智能来帮忙?


如果你的答案是 “No”,那么这就是一个相当清晰的信号,表明机器学习 / 人工智能不适合你。


  1. 用户体验视角:你是否能够明确谁是你的目标用户?他们将如何使用你的输出?


如果你没有及早考虑用户,那么你将会受到低劣设计的影响。


  1. 伦理发展:你是否考虑过你创造出来的东西可能会影响到哪些人群?


这点对于具备快速扩展潜力的技术尤为重要。


  1. 合理预期:你是否理解你的系统可能非常出色,但它不会是完美无瑕的?你是否能够忍受你的系统偶尔会出错?


从伦理学的角度来看,你有没有想过这点意味着什么?


  1. 生产中可能的情况:无论这些决策 / 标签来自何处,你是否能够在生产中为其提供服务?你是否能够按照预期的规模来集中工程资源?

  2. 需要学习的数据:是否存在潜在有用的数据?你能获得它们的访问权限吗?


如果数据不存在,也没有关系,只要你有尽快获得数据的计划就好。


  1. 足够的样本:你是否咨询过统计学家或机器学习工程师⁽⁴⁾,你所拥有的数据量是否足够用来学习?


这里说的足够,不是以字节来衡量的,所以要与那些直觉良好的人多聊聊,由他们来操作。


  1. 计算机:你是否有足够的处理能力来处理数据集大小?


对于任何愿意考虑使用云技术的人来说,云技术都是自动的,无需考虑计算机处理能力的问题⁽⁵⁾。


  1. 团队:你是否有信心组件一支具备必要技能的团队?⁽⁶⁾

  2. 真相:除非你使用无监督学习⁽⁷⁾,否则,你是否能够获得输出?


如果不能,你是否愿意支付薪水,雇佣人员为你一遍又一遍地执行任务?


  1. 日志完整性:你是否可以判断哪些输入与哪些输出相匹配?

  2. 日志质量:你是否相信数据集实际上就是其提供者所声称的数据集?


要从样本中学习,你需要质量很好的样本来源。


  1. 无差异曲线:由于你的系统会出错,你是否考虑过一种错误相对于另一种错误更槽糕⁽⁸⁾?

  2. 模拟:你是否考虑过与模拟⁽⁹⁾专家合作,以帮助你将你所要求的的内容进行可视化?


这不是强制性的,但是很有用。


  1. 度量标准创建:你是否将单个输出的得分拼接为多个实例中系统业务性能的度量标准?⁽¹º⁾

  2. 度量评估:你的业务绩效是否经过评估,以确保不会以某种有悖常理和有害的方式⁽¹¹⁾获得良好的得分?

  3. 度量损失比较:(可选)你的业务绩效是否与标准损失函数⁽¹²⁾相关⁽¹³⁾?


如果不相关,你的要求可能会很难达成。


  1. 总体:你是否仔细考虑过你的系统正常工作需要包含哪些实例⁽¹⁴⁾?


被测量的总体⁽¹⁵⁾定义了系统性能测试将涵盖的广泛实例集合。


  1. 最低性能:你是否为测试定义了严格的最低性能标准⁽¹⁶⁾,如果你的系统没有达到这个标准,你就会摧毁这个系统。


如果上面所有的这 22 个问题,你的回答都是 “Yes”,那么,你就可以开始机器学习 / 人工智能的下一步了!这将涉及到数据和硬件(还有工程师)。我很快就会发布后续步骤的指南,敬请期待。


如果你觉得这个极简版的指南不够过瘾,那么启动人工智能项目的完整指南的网址是:http://bit.ly/quaesita_dmguide 你大可以尽情阅读。


[1]: The first step in AI might surprise you


https://hackernoon.com/the-first-step-in-ai-might-surprise-you-cbd17a35708a


[2]: Imagine a drunk island… Advice for finding AI use cases


https://hackernoon.com/imagine-a-drunk-island-advice-for-finding-ai-use-cases-8d47495d4c3f


[3]: What on earth is data science?


https://hackernoon.com/what-on-earth-is-data-science-eb1237d8cb37


[4][6]: Top 10 roles in AI and data science


https://hackernoon.com/top-10-roles-for-your-data-science-team-e7f05d90d961


[5]: Getting Started with Google Cloud Platform


https://cloud.google.com/getting-started/


[7]: Unsupervised learning demystified


https://hackernoon.com/unsupervised-learning-demystified-4060eecedeaf


[8][9][10][11][13][16]: Getting started with AI? Start here!


https://hackernoon.com/the-decision-makers-guide-to-starting-ai-72ee0d7044df


[12]: Machine learning — Is the emperor wearing clothes?


https://hackernoon.com/machine-learning-is-the-emperor-wearing-clothes-59933d12a3cc


[14][15]: Populations — You’re doing it wrong


https://hackernoon.com/populations-youre-doing-it-wrong-820ae76beb95


原文链接:


https://hackernoon.com/ai-reality-checklist-be34e2fdab9

会议推荐

12 月 20-21,AICon将于北京开幕,在这里可以学习来自 Google、微软、BAT、360、京东、美团等 40+AI 落地案例,与国内外一线技术大咖面对面交流。


2018-11-23 19:141340
用户头像

发布了 376 篇内容, 共 201.1 次阅读, 收获喜欢 949 次。

关注

评论 1 条评论

发布
暂无评论
发现更多内容

聚焦技术,锐意创新,GaussDB给世界一个更优选择

华为云开发者联盟

数据库 后端 华为云 12 月 PK 榜

震惊,WSL2居然可以挂载USB

吴脑的键客

WSL2 usb

云原生 AI 的资源调度和 AI 工作流引擎设计分享

Baidu AICLOUD

AI工程化 异构计算 云原生AI 百度百舸

大数据培训工作就业前景怎么样

小谷哥

浪潮 KaiwuDB 陈磊:布局数字能源,创新助力 “双碳”

KaiwuDB

cdr2023断网离线激活下载教程

茶色酒

cdr2023

系统的混乱并非业务本身之复杂,我们并不擅长处理『简单』

阿里技术

软件工程 复杂度

PreSTU:一个专门为场景文本理解而设计的简单预训练模型

华为云开发者联盟

人工智能 华为云 OCR 12 月 PK 榜

直播继续!华为云Solution as Code一键高效上云,解决方案开箱即用

科技怪授

华为云

openGemini v0.2.0版本正式发布:5大特性全面增强

华为云开发者联盟

数据库 后端 华为云 12 月 PK 榜

骨灰级精品,京东百万架构师亲码的MySQL内部笔记太硬核了

小小怪下士

Java MySQL 程序员

面了40+岁的大叔,没有录用,并不是因为年龄

产品运营心经

工作经历 面试‘ 职场发展 大龄求职

AlibabaP8,耗时182天肝出来1015页分布式全栈手册

程序知音

Java 分布式 后端 java架构

大数据培训出来就业前景如何

小谷哥

华为云12·12直播EI专场即将开始,满足电商行业全场景搜索需求

科技怪授

华为云

guitar pro2023下载官方版app

茶色酒

Guitar Pro guitar pro2023

一文带你快速上手云日志服务

云计算 运维 日志管理

如何合并Excel文档

Geek_249eec

C# Excel VB.NET

AngularJS进阶(四十)创建模块、服务

No Silver Bullet

服务 模块 AngularJS 12月月更

几种数据库jar包获取方式

华为云开发者联盟

数据库 华为云 12 月 PK 榜 jar包

【计算讲谈社】第十五讲|云端即时渲染:下一代互联网的算力基座?

大咖说

数字人 云游戏

终于被我发现了这个推特视频下载的方法!超级简单!支持苹果安卓双系统!

frank

推特视频下载

java自学好还是培训好?

小谷哥

哪篇论文宣布了 HTAP 数据库的诞生?解读《A Common Database Approach for OLTP and OLAP Using an In-Memory Column DataBase》

StoneDB

MySQL HTAP 数据库· StoneDB 12 月 PK 榜

Sovit3D引擎快速构建智慧变电站三维可视化系统

2D3D前端可视化开发

物联网 智慧变电站 智能变电站 数字孪生变电站 变电站可视化

AngularJS进阶(四十一)AngularJS中使用Chart.js制折线图与饼图实例

No Silver Bullet

AngularJS 12月月更 Chart.js 折线图与饼图

喜报 | Bonree ONE 2.0荣获信通院“2022IT新治理年度明星产品”

博睿数据

可观测性 博睿数据 荣誉 ONE平台

什么样的web前端培训靠谱?

小谷哥

关于K8s集群环境工作组隔离配置多集群切换的一些笔记

山河已无恙

k8s管理 K8s 多集群管理 12月月更

AngularJS进阶(三十九)基于项目实战解析ng启动加载过程

No Silver Bullet

项目实战 AngularJS 12月月更 启动加载

上海靠谱的前端培训机构有没有推荐

小谷哥

如何检查你的项目是不是真的需要用到 AI?_AI&大模型_Cassie Kozyrkov_InfoQ精选文章