NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

如何检查你的项目是不是真的需要用到 AI?

  • 2018-11-23
  • 本文字数:2962 字

    阅读完需:约 10 分钟

如何检查你的项目是不是真的需要用到 AI?

AI 前线导读:


过去几年,机器学习和人工智能日新月异,在各行业都呈现火爆的态势。你是不是也跃跃欲试,想在自己的项目里也用上人工智能呢?且慢,让我们听听来自 Google 的首席决策情报工程师 Cassie Kozyrkov 的看法,她兴趣爱好广泛,涵盖了统计、机器学习 / 人工智能、数据、决策科学、艺术、戏剧等等,在自己的博客发表了大量的观点。今天 AI 前线翻译了她最新的博文 Is your AI project a nonstarter?(《如何检查你的项目是否需要人工智能?》),相信看完她的文章后,你就能够评估自己的项目,到底需不需要加上人工智能。


更多干货内容请关注微信公众号“AI 前线”(ID:ai-front)


这是一份现状核实清单,可以帮助你避免学习困难的痛苦。


如果你要深入研究机器学习或人工智能项目,在深入研究算法、数据和工程之前,你需要先参考这份清单。你可以把这份清单想象成盒子里友好的顾问。


AI 前线注:机器学习可参阅作者的另一篇文章:The simplest explanation of machine learning you’ll ever read(《机器学习极简解释》)(http://u6.gg/fpMkp)关于人工智能,可参阅作者的这篇文章:Are you using the term ‘AI’ incorrectly?(《你是否用错了“人工智能”这词?》) (http://u6.gg/fpMnU)


记住,千万不要浪费时间,不要为了 AI 而 AI。促使你想要应用人工智能的原因,应该是它能够为你做什么,而不是为了听上去有多么科幻。


本文是作者的博文 The ultimate guide to starting AI (《启动 AI 项目的终极指南》)(http://u6.gg/fpNnq)的超短版本。如果你准备使用机器学习或人工智能,我们希望,对于本文所列的所有问题,你的回答都是 “Yes”。


AI 前线注:为什么要使用机器学习或人工智能,作者写了一篇文章 Machine learning — Is the emperor wearing clothes? 《机器学习其实只是“皇帝的新衣”》娓娓道来,深入浅出,你可以看看。


如果这份清单里有任何一个问题你的回答是 No,那么你都不适合将 AI 用到你的项目中,否则你的项目就会像这幅图片里的牛一样被卡住。

开始机器学习 / 人工智能的第一步,共 22 部分:输出、目标和可行性。

  1. 把做决策的工作交给正确的人: 负责你的项目并完成这份清单的人员是否真正了解你的业务?


将决策权委托⁽¹⁾给精通业务的人员,而不是平庸的算法书呆子。


  1. 以输出为中心的构思:你是否能够解释你的系统输出⁽²⁾是什么,以及为什么这些输出是值得去做的?


首先关注你在做什么,而不是怎么做;不要把目标和手段混为一谈。


  1. 灵感来源:你是否至少考虑过将数据挖掘⁽³⁾作为从潜在的使用案例中获取灵感的一种方法?


虽然这不是强制性的要求,但是它可以有助于找到一个好的方向。


  1. 适合机器学习 / 人工智能的任务:你是否自动化了许多决策 / 标签?是否每次当你无法找到完美的答案时,都要使用机器学习 / 人工智能来帮忙?


如果你的答案是 “No”,那么这就是一个相当清晰的信号,表明机器学习 / 人工智能不适合你。


  1. 用户体验视角:你是否能够明确谁是你的目标用户?他们将如何使用你的输出?


如果你没有及早考虑用户,那么你将会受到低劣设计的影响。


  1. 伦理发展:你是否考虑过你创造出来的东西可能会影响到哪些人群?


这点对于具备快速扩展潜力的技术尤为重要。


  1. 合理预期:你是否理解你的系统可能非常出色,但它不会是完美无瑕的?你是否能够忍受你的系统偶尔会出错?


从伦理学的角度来看,你有没有想过这点意味着什么?


  1. 生产中可能的情况:无论这些决策 / 标签来自何处,你是否能够在生产中为其提供服务?你是否能够按照预期的规模来集中工程资源?

  2. 需要学习的数据:是否存在潜在有用的数据?你能获得它们的访问权限吗?


如果数据不存在,也没有关系,只要你有尽快获得数据的计划就好。


  1. 足够的样本:你是否咨询过统计学家或机器学习工程师⁽⁴⁾,你所拥有的数据量是否足够用来学习?


这里说的足够,不是以字节来衡量的,所以要与那些直觉良好的人多聊聊,由他们来操作。


  1. 计算机:你是否有足够的处理能力来处理数据集大小?


对于任何愿意考虑使用云技术的人来说,云技术都是自动的,无需考虑计算机处理能力的问题⁽⁵⁾。


  1. 团队:你是否有信心组件一支具备必要技能的团队?⁽⁶⁾

  2. 真相:除非你使用无监督学习⁽⁷⁾,否则,你是否能够获得输出?


如果不能,你是否愿意支付薪水,雇佣人员为你一遍又一遍地执行任务?


  1. 日志完整性:你是否可以判断哪些输入与哪些输出相匹配?

  2. 日志质量:你是否相信数据集实际上就是其提供者所声称的数据集?


要从样本中学习,你需要质量很好的样本来源。


  1. 无差异曲线:由于你的系统会出错,你是否考虑过一种错误相对于另一种错误更槽糕⁽⁸⁾?

  2. 模拟:你是否考虑过与模拟⁽⁹⁾专家合作,以帮助你将你所要求的的内容进行可视化?


这不是强制性的,但是很有用。


  1. 度量标准创建:你是否将单个输出的得分拼接为多个实例中系统业务性能的度量标准?⁽¹º⁾

  2. 度量评估:你的业务绩效是否经过评估,以确保不会以某种有悖常理和有害的方式⁽¹¹⁾获得良好的得分?

  3. 度量损失比较:(可选)你的业务绩效是否与标准损失函数⁽¹²⁾相关⁽¹³⁾?


如果不相关,你的要求可能会很难达成。


  1. 总体:你是否仔细考虑过你的系统正常工作需要包含哪些实例⁽¹⁴⁾?


被测量的总体⁽¹⁵⁾定义了系统性能测试将涵盖的广泛实例集合。


  1. 最低性能:你是否为测试定义了严格的最低性能标准⁽¹⁶⁾,如果你的系统没有达到这个标准,你就会摧毁这个系统。


如果上面所有的这 22 个问题,你的回答都是 “Yes”,那么,你就可以开始机器学习 / 人工智能的下一步了!这将涉及到数据和硬件(还有工程师)。我很快就会发布后续步骤的指南,敬请期待。


如果你觉得这个极简版的指南不够过瘾,那么启动人工智能项目的完整指南的网址是:http://bit.ly/quaesita_dmguide 你大可以尽情阅读。


[1]: The first step in AI might surprise you


https://hackernoon.com/the-first-step-in-ai-might-surprise-you-cbd17a35708a


[2]: Imagine a drunk island… Advice for finding AI use cases


https://hackernoon.com/imagine-a-drunk-island-advice-for-finding-ai-use-cases-8d47495d4c3f


[3]: What on earth is data science?


https://hackernoon.com/what-on-earth-is-data-science-eb1237d8cb37


[4][6]: Top 10 roles in AI and data science


https://hackernoon.com/top-10-roles-for-your-data-science-team-e7f05d90d961


[5]: Getting Started with Google Cloud Platform


https://cloud.google.com/getting-started/


[7]: Unsupervised learning demystified


https://hackernoon.com/unsupervised-learning-demystified-4060eecedeaf


[8][9][10][11][13][16]: Getting started with AI? Start here!


https://hackernoon.com/the-decision-makers-guide-to-starting-ai-72ee0d7044df


[12]: Machine learning — Is the emperor wearing clothes?


https://hackernoon.com/machine-learning-is-the-emperor-wearing-clothes-59933d12a3cc


[14][15]: Populations — You’re doing it wrong


https://hackernoon.com/populations-youre-doing-it-wrong-820ae76beb95


原文链接:


https://hackernoon.com/ai-reality-checklist-be34e2fdab9

会议推荐

12 月 20-21,AICon将于北京开幕,在这里可以学习来自 Google、微软、BAT、360、京东、美团等 40+AI 落地案例,与国内外一线技术大咖面对面交流。


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2018-11-23 19:141117
用户头像

发布了 370 篇内容, 共 170.5 次阅读, 收获喜欢 939 次。

关注

评论 1 条评论

发布
暂无评论
发现更多内容

从 Node.js(JavaScript) 到 Golang,我的开发体验

Garfield

node.js Go 语言

某程序员毕业进UC,被阿里收购!跳去优酷土豆,又被阿里收购!再跳去饿了么,还被阿里收购!难道阿里想收购的是他?

程序员生活志

职场 阿里

2020-08-29-第十二周作业

路易斯李李李

关于显性知识和隐性知识

Tanmer

知识管理 知识产权

Week 12 命题作业

Jeremy

凡泰极客与Rancher达成深度战略合作,加速企业构建私有化小程序生态

FinClip

kubernetes node affinity 写法

Geek_f24c45

Kubernetes

42图揭秘,「后端技术学些啥」

我是程序员小贱

你问我答:现有的应用有必要做微服务改造吗?

BoCloud博云

容器 DevOps 微服务 云平台 博云

融云Geek Online 2020 编程挑战赛重磅来袭

InfoQ_967a83c6d0d7

读懂k8s 容器编排控制器 Deployment

Garfield

k8s pod k8s入门

数字资产钱包开发,数字加密货币app搭建

13530558032

区块链支付新模式开发,USDT支付系统搭建

13530558032

【Spring Boot系列】之多种依赖集成方式

语霖

云算力挖矿平台APP,算力挖矿建设开发

13530558032

架构师训练营 -- 第 12 周作业

stardust20

Spring Bean处理器

语霖

Spring Framework

3种双集群系统方案设计模式详解

华为云开发者联盟

数据库 数据仓库 数据 双集群系统 双ETL模式

大数据应用场景

dongge

LeetCode题解:155. 最小栈,单个栈存储入栈元素与最小值之差,JavaScript,详细注释

Lee Chen

大前端 LeetCode

案例分享丨红外自动感应门设计与实现详解

华为云开发者联盟

物联网 传感器 感应探测器 SMT32处理器 感应门

华为云FusionInsight大数据技术普惠创新,释放千行百业数据价值

数据湖洞见

大数据 FusionInsight 华为云

深圳泰利能源有限公司涉嫌传销 共计2.7亿元

CECBC

区块链 基金

人的转型才是关键 数字化时代你具备数字领导力么

CECBC

区块链 数字化时代

数字货币交易平台源码,数字货币交易所开发核心功能

13530558032

FlinkX 如何读取和写入 Clickhouse?

Apache Flink

flink

技术分享:即构互动白板音视频同步、多端有序协作技术实践

ZEGO即构

音视频 在线教育 SVG

XSKY对象存储获全球备份领域领导者Commvault官方认证

XSKY星辰天合

区块链助力军事人力资源配置

CECBC

区块链 军事

架构设计开学第一天

escray

学习 从零开始学架构 架构师预科班

2020-08-29-第十二周学习总结

路易斯李李李

如何检查你的项目是不是真的需要用到 AI?_AI&大模型_Cassie Kozyrkov_InfoQ精选文章