写点什么

如何检查你的项目是不是真的需要用到 AI?

  • 2018-11-23
  • 本文字数:2962 字

    阅读完需:约 10 分钟

如何检查你的项目是不是真的需要用到 AI?

AI 前线导读:


过去几年,机器学习和人工智能日新月异,在各行业都呈现火爆的态势。你是不是也跃跃欲试,想在自己的项目里也用上人工智能呢?且慢,让我们听听来自 Google 的首席决策情报工程师 Cassie Kozyrkov 的看法,她兴趣爱好广泛,涵盖了统计、机器学习 / 人工智能、数据、决策科学、艺术、戏剧等等,在自己的博客发表了大量的观点。今天 AI 前线翻译了她最新的博文 Is your AI project a nonstarter?(《如何检查你的项目是否需要人工智能?》),相信看完她的文章后,你就能够评估自己的项目,到底需不需要加上人工智能。


更多干货内容请关注微信公众号“AI 前线”(ID:ai-front)


这是一份现状核实清单,可以帮助你避免学习困难的痛苦。


如果你要深入研究机器学习或人工智能项目,在深入研究算法、数据和工程之前,你需要先参考这份清单。你可以把这份清单想象成盒子里友好的顾问。


AI 前线注:机器学习可参阅作者的另一篇文章:The simplest explanation of machine learning you’ll ever read(《机器学习极简解释》)(http://u6.gg/fpMkp)关于人工智能,可参阅作者的这篇文章:Are you using the term ‘AI’ incorrectly?(《你是否用错了“人工智能”这词?》) (http://u6.gg/fpMnU)


记住,千万不要浪费时间,不要为了 AI 而 AI。促使你想要应用人工智能的原因,应该是它能够为你做什么,而不是为了听上去有多么科幻。


本文是作者的博文 The ultimate guide to starting AI (《启动 AI 项目的终极指南》)(http://u6.gg/fpNnq)的超短版本。如果你准备使用机器学习或人工智能,我们希望,对于本文所列的所有问题,你的回答都是 “Yes”。


AI 前线注:为什么要使用机器学习或人工智能,作者写了一篇文章 Machine learning — Is the emperor wearing clothes? 《机器学习其实只是“皇帝的新衣”》娓娓道来,深入浅出,你可以看看。


如果这份清单里有任何一个问题你的回答是 No,那么你都不适合将 AI 用到你的项目中,否则你的项目就会像这幅图片里的牛一样被卡住。

开始机器学习 / 人工智能的第一步,共 22 部分:输出、目标和可行性。

  1. 把做决策的工作交给正确的人: 负责你的项目并完成这份清单的人员是否真正了解你的业务?


将决策权委托⁽¹⁾给精通业务的人员,而不是平庸的算法书呆子。


  1. 以输出为中心的构思:你是否能够解释你的系统输出⁽²⁾是什么,以及为什么这些输出是值得去做的?


首先关注你在做什么,而不是怎么做;不要把目标和手段混为一谈。


  1. 灵感来源:你是否至少考虑过将数据挖掘⁽³⁾作为从潜在的使用案例中获取灵感的一种方法?


虽然这不是强制性的要求,但是它可以有助于找到一个好的方向。


  1. 适合机器学习 / 人工智能的任务:你是否自动化了许多决策 / 标签?是否每次当你无法找到完美的答案时,都要使用机器学习 / 人工智能来帮忙?


如果你的答案是 “No”,那么这就是一个相当清晰的信号,表明机器学习 / 人工智能不适合你。


  1. 用户体验视角:你是否能够明确谁是你的目标用户?他们将如何使用你的输出?


如果你没有及早考虑用户,那么你将会受到低劣设计的影响。


  1. 伦理发展:你是否考虑过你创造出来的东西可能会影响到哪些人群?


这点对于具备快速扩展潜力的技术尤为重要。


  1. 合理预期:你是否理解你的系统可能非常出色,但它不会是完美无瑕的?你是否能够忍受你的系统偶尔会出错?


从伦理学的角度来看,你有没有想过这点意味着什么?


  1. 生产中可能的情况:无论这些决策 / 标签来自何处,你是否能够在生产中为其提供服务?你是否能够按照预期的规模来集中工程资源?

  2. 需要学习的数据:是否存在潜在有用的数据?你能获得它们的访问权限吗?


如果数据不存在,也没有关系,只要你有尽快获得数据的计划就好。


  1. 足够的样本:你是否咨询过统计学家或机器学习工程师⁽⁴⁾,你所拥有的数据量是否足够用来学习?


这里说的足够,不是以字节来衡量的,所以要与那些直觉良好的人多聊聊,由他们来操作。


  1. 计算机:你是否有足够的处理能力来处理数据集大小?


对于任何愿意考虑使用云技术的人来说,云技术都是自动的,无需考虑计算机处理能力的问题⁽⁵⁾。


  1. 团队:你是否有信心组件一支具备必要技能的团队?⁽⁶⁾

  2. 真相:除非你使用无监督学习⁽⁷⁾,否则,你是否能够获得输出?


如果不能,你是否愿意支付薪水,雇佣人员为你一遍又一遍地执行任务?


  1. 日志完整性:你是否可以判断哪些输入与哪些输出相匹配?

  2. 日志质量:你是否相信数据集实际上就是其提供者所声称的数据集?


要从样本中学习,你需要质量很好的样本来源。


  1. 无差异曲线:由于你的系统会出错,你是否考虑过一种错误相对于另一种错误更槽糕⁽⁸⁾?

  2. 模拟:你是否考虑过与模拟⁽⁹⁾专家合作,以帮助你将你所要求的的内容进行可视化?


这不是强制性的,但是很有用。


  1. 度量标准创建:你是否将单个输出的得分拼接为多个实例中系统业务性能的度量标准?⁽¹º⁾

  2. 度量评估:你的业务绩效是否经过评估,以确保不会以某种有悖常理和有害的方式⁽¹¹⁾获得良好的得分?

  3. 度量损失比较:(可选)你的业务绩效是否与标准损失函数⁽¹²⁾相关⁽¹³⁾?


如果不相关,你的要求可能会很难达成。


  1. 总体:你是否仔细考虑过你的系统正常工作需要包含哪些实例⁽¹⁴⁾?


被测量的总体⁽¹⁵⁾定义了系统性能测试将涵盖的广泛实例集合。


  1. 最低性能:你是否为测试定义了严格的最低性能标准⁽¹⁶⁾,如果你的系统没有达到这个标准,你就会摧毁这个系统。


如果上面所有的这 22 个问题,你的回答都是 “Yes”,那么,你就可以开始机器学习 / 人工智能的下一步了!这将涉及到数据和硬件(还有工程师)。我很快就会发布后续步骤的指南,敬请期待。


如果你觉得这个极简版的指南不够过瘾,那么启动人工智能项目的完整指南的网址是:http://bit.ly/quaesita_dmguide 你大可以尽情阅读。


[1]: The first step in AI might surprise you


https://hackernoon.com/the-first-step-in-ai-might-surprise-you-cbd17a35708a


[2]: Imagine a drunk island… Advice for finding AI use cases


https://hackernoon.com/imagine-a-drunk-island-advice-for-finding-ai-use-cases-8d47495d4c3f


[3]: What on earth is data science?


https://hackernoon.com/what-on-earth-is-data-science-eb1237d8cb37


[4][6]: Top 10 roles in AI and data science


https://hackernoon.com/top-10-roles-for-your-data-science-team-e7f05d90d961


[5]: Getting Started with Google Cloud Platform


https://cloud.google.com/getting-started/


[7]: Unsupervised learning demystified


https://hackernoon.com/unsupervised-learning-demystified-4060eecedeaf


[8][9][10][11][13][16]: Getting started with AI? Start here!


https://hackernoon.com/the-decision-makers-guide-to-starting-ai-72ee0d7044df


[12]: Machine learning — Is the emperor wearing clothes?


https://hackernoon.com/machine-learning-is-the-emperor-wearing-clothes-59933d12a3cc


[14][15]: Populations — You’re doing it wrong


https://hackernoon.com/populations-youre-doing-it-wrong-820ae76beb95


原文链接:


https://hackernoon.com/ai-reality-checklist-be34e2fdab9

会议推荐

12 月 20-21,AICon将于北京开幕,在这里可以学习来自 Google、微软、BAT、360、京东、美团等 40+AI 落地案例,与国内外一线技术大咖面对面交流。


2018-11-23 19:141430
用户头像

发布了 376 篇内容, 共 210.8 次阅读, 收获喜欢 949 次。

关注

评论 1 条评论

发布
暂无评论
发现更多内容

架构实战营模块三作业 - 外包学生管理系统的架构文档

李焕之

《鸿蒙理论知识01》HarmonyOS概述之技术特性

孙叫兽

鸿蒙 鸿蒙开发 引航计划

《鸿蒙理论知识03》HarmonyOS概述之系统安全

孙叫兽

鸿蒙 鸿蒙开发 鸿蒙系统 引航计划

28分钟完成一款Python游戏,《客服戏翻总裁牌》

梦想橡皮擦

9月日更

外包学生管理系统架构文档

看,有只猪

我理想中的任务调度系统

分布式 任务调度 scheduler

如何对技术视频转换文章投稿进行二次创作

孙叫兽

技术社区 投稿 引航计划

【LeetCode】链表中的下一个更大节点Java题解

Albert

算法 LeetCode 9月日更

疯狂复习半个月,三面蚂蚁金服(交叉面)定级阿里P6

Java 程序员 后端

架构实战营 模块八 作业

一雄

作业 架构实战营 模块八

手撸二叉树之恢复二叉树

HelloWorld杰少

9月日更

疯狂复习半个月,全栈系统化的学习路线

Java 程序员 后端

《鸿蒙理论知识06》HarmonyOS概述之应用开发基础知识

孙叫兽

鸿蒙 HarmonyOS 鸿蒙系统 引航计划 领航计划

Vue进阶(幺幺玖):element-ui table组件适应性问题(横向滚动条)

No Silver Bullet

Vue 9月日更

系统的可靠性 Reliability

BlockQuant

MySQL 稳定性 可用性 可靠性

疯狂复习20天卷土从来,tomcat原理及优化

Java 程序员 后端

边缘计算如何实现海量IoT数据就地处理

孙叫兽

物联网 边缘计算 引航计划

疯狂复习半个月,rocketmq原理面试题

Java 程序员 后端

Apache APISIX 社区周报 | 2021 8.30-9.12

API7.ai 技术团队

Apache 开源 API网关 APISIX 社区周报

《鸿蒙理论知识04》HarmonyOS概述之系统定义

孙叫兽

鸿蒙 鸿蒙系统 引航计划

架构实战课程 模块三作业

Frank

疯狂涨知识,spring全方位深入探索,

Java 程序员 后端

netty系列之:在netty中处理CORS

程序那些事

Java Netty 程序那些事 响应式系统

再见了,我的散装研发管理平台;再见了,4台ECS!

阿里巴巴云原生

云计算 阿里云

【Flutter 专题】44 图解矩阵变换 Transform 类 (一)

阿策小和尚

Flutter 小菜 0 基础学习 Flutter Android 小菜鸟 9月日更

《鸿蒙理论知识02》HarmonyOS开发平台和工具

孙叫兽

鸿蒙 HarmonyOS 鸿蒙系统 引航计划

疯狂复习20天卷土从来,2021Java笔试题总结

Java 程序员 后端

疯狂复习20天卷土从来,Java面试真题解析火爆全网

Java 程序员 后端

乘着汽车智能化的浪潮,“汽车人”职业方向的选择(一)

SOA开发者

软件 职业成长 汽车

架构设计系列三 详细架构设计文档编写

nydia

详细架构设计文档 架构设计文档

《鸿蒙理论知识05》HarmonyOS概述之下载与安装软件

孙叫兽

鸿蒙 鸿蒙系统 引航计划

如何检查你的项目是不是真的需要用到 AI?_AI&大模型_Cassie Kozyrkov_InfoQ精选文章