写点什么

如何检查你的项目是不是真的需要用到 AI?

  • 2018-11-23
  • 本文字数:2962 字

    阅读完需:约 10 分钟

如何检查你的项目是不是真的需要用到 AI?

AI 前线导读:


过去几年,机器学习和人工智能日新月异,在各行业都呈现火爆的态势。你是不是也跃跃欲试,想在自己的项目里也用上人工智能呢?且慢,让我们听听来自 Google 的首席决策情报工程师 Cassie Kozyrkov 的看法,她兴趣爱好广泛,涵盖了统计、机器学习 / 人工智能、数据、决策科学、艺术、戏剧等等,在自己的博客发表了大量的观点。今天 AI 前线翻译了她最新的博文 Is your AI project a nonstarter?(《如何检查你的项目是否需要人工智能?》),相信看完她的文章后,你就能够评估自己的项目,到底需不需要加上人工智能。


更多干货内容请关注微信公众号“AI 前线”(ID:ai-front)


这是一份现状核实清单,可以帮助你避免学习困难的痛苦。


如果你要深入研究机器学习或人工智能项目,在深入研究算法、数据和工程之前,你需要先参考这份清单。你可以把这份清单想象成盒子里友好的顾问。


AI 前线注:机器学习可参阅作者的另一篇文章:The simplest explanation of machine learning you’ll ever read(《机器学习极简解释》)(http://u6.gg/fpMkp)关于人工智能,可参阅作者的这篇文章:Are you using the term ‘AI’ incorrectly?(《你是否用错了“人工智能”这词?》) (http://u6.gg/fpMnU)


记住,千万不要浪费时间,不要为了 AI 而 AI。促使你想要应用人工智能的原因,应该是它能够为你做什么,而不是为了听上去有多么科幻。


本文是作者的博文 The ultimate guide to starting AI (《启动 AI 项目的终极指南》)(http://u6.gg/fpNnq)的超短版本。如果你准备使用机器学习或人工智能,我们希望,对于本文所列的所有问题,你的回答都是 “Yes”。


AI 前线注:为什么要使用机器学习或人工智能,作者写了一篇文章 Machine learning — Is the emperor wearing clothes? 《机器学习其实只是“皇帝的新衣”》娓娓道来,深入浅出,你可以看看。


如果这份清单里有任何一个问题你的回答是 No,那么你都不适合将 AI 用到你的项目中,否则你的项目就会像这幅图片里的牛一样被卡住。

开始机器学习 / 人工智能的第一步,共 22 部分:输出、目标和可行性。

  1. 把做决策的工作交给正确的人: 负责你的项目并完成这份清单的人员是否真正了解你的业务?


将决策权委托⁽¹⁾给精通业务的人员,而不是平庸的算法书呆子。


  1. 以输出为中心的构思:你是否能够解释你的系统输出⁽²⁾是什么,以及为什么这些输出是值得去做的?


首先关注你在做什么,而不是怎么做;不要把目标和手段混为一谈。


  1. 灵感来源:你是否至少考虑过将数据挖掘⁽³⁾作为从潜在的使用案例中获取灵感的一种方法?


虽然这不是强制性的要求,但是它可以有助于找到一个好的方向。


  1. 适合机器学习 / 人工智能的任务:你是否自动化了许多决策 / 标签?是否每次当你无法找到完美的答案时,都要使用机器学习 / 人工智能来帮忙?


如果你的答案是 “No”,那么这就是一个相当清晰的信号,表明机器学习 / 人工智能不适合你。


  1. 用户体验视角:你是否能够明确谁是你的目标用户?他们将如何使用你的输出?


如果你没有及早考虑用户,那么你将会受到低劣设计的影响。


  1. 伦理发展:你是否考虑过你创造出来的东西可能会影响到哪些人群?


这点对于具备快速扩展潜力的技术尤为重要。


  1. 合理预期:你是否理解你的系统可能非常出色,但它不会是完美无瑕的?你是否能够忍受你的系统偶尔会出错?


从伦理学的角度来看,你有没有想过这点意味着什么?


  1. 生产中可能的情况:无论这些决策 / 标签来自何处,你是否能够在生产中为其提供服务?你是否能够按照预期的规模来集中工程资源?

  2. 需要学习的数据:是否存在潜在有用的数据?你能获得它们的访问权限吗?


如果数据不存在,也没有关系,只要你有尽快获得数据的计划就好。


  1. 足够的样本:你是否咨询过统计学家或机器学习工程师⁽⁴⁾,你所拥有的数据量是否足够用来学习?


这里说的足够,不是以字节来衡量的,所以要与那些直觉良好的人多聊聊,由他们来操作。


  1. 计算机:你是否有足够的处理能力来处理数据集大小?


对于任何愿意考虑使用云技术的人来说,云技术都是自动的,无需考虑计算机处理能力的问题⁽⁵⁾。


  1. 团队:你是否有信心组件一支具备必要技能的团队?⁽⁶⁾

  2. 真相:除非你使用无监督学习⁽⁷⁾,否则,你是否能够获得输出?


如果不能,你是否愿意支付薪水,雇佣人员为你一遍又一遍地执行任务?


  1. 日志完整性:你是否可以判断哪些输入与哪些输出相匹配?

  2. 日志质量:你是否相信数据集实际上就是其提供者所声称的数据集?


要从样本中学习,你需要质量很好的样本来源。


  1. 无差异曲线:由于你的系统会出错,你是否考虑过一种错误相对于另一种错误更槽糕⁽⁸⁾?

  2. 模拟:你是否考虑过与模拟⁽⁹⁾专家合作,以帮助你将你所要求的的内容进行可视化?


这不是强制性的,但是很有用。


  1. 度量标准创建:你是否将单个输出的得分拼接为多个实例中系统业务性能的度量标准?⁽¹º⁾

  2. 度量评估:你的业务绩效是否经过评估,以确保不会以某种有悖常理和有害的方式⁽¹¹⁾获得良好的得分?

  3. 度量损失比较:(可选)你的业务绩效是否与标准损失函数⁽¹²⁾相关⁽¹³⁾?


如果不相关,你的要求可能会很难达成。


  1. 总体:你是否仔细考虑过你的系统正常工作需要包含哪些实例⁽¹⁴⁾?


被测量的总体⁽¹⁵⁾定义了系统性能测试将涵盖的广泛实例集合。


  1. 最低性能:你是否为测试定义了严格的最低性能标准⁽¹⁶⁾,如果你的系统没有达到这个标准,你就会摧毁这个系统。


如果上面所有的这 22 个问题,你的回答都是 “Yes”,那么,你就可以开始机器学习 / 人工智能的下一步了!这将涉及到数据和硬件(还有工程师)。我很快就会发布后续步骤的指南,敬请期待。


如果你觉得这个极简版的指南不够过瘾,那么启动人工智能项目的完整指南的网址是:http://bit.ly/quaesita_dmguide 你大可以尽情阅读。


[1]: The first step in AI might surprise you


https://hackernoon.com/the-first-step-in-ai-might-surprise-you-cbd17a35708a


[2]: Imagine a drunk island… Advice for finding AI use cases


https://hackernoon.com/imagine-a-drunk-island-advice-for-finding-ai-use-cases-8d47495d4c3f


[3]: What on earth is data science?


https://hackernoon.com/what-on-earth-is-data-science-eb1237d8cb37


[4][6]: Top 10 roles in AI and data science


https://hackernoon.com/top-10-roles-for-your-data-science-team-e7f05d90d961


[5]: Getting Started with Google Cloud Platform


https://cloud.google.com/getting-started/


[7]: Unsupervised learning demystified


https://hackernoon.com/unsupervised-learning-demystified-4060eecedeaf


[8][9][10][11][13][16]: Getting started with AI? Start here!


https://hackernoon.com/the-decision-makers-guide-to-starting-ai-72ee0d7044df


[12]: Machine learning — Is the emperor wearing clothes?


https://hackernoon.com/machine-learning-is-the-emperor-wearing-clothes-59933d12a3cc


[14][15]: Populations — You’re doing it wrong


https://hackernoon.com/populations-youre-doing-it-wrong-820ae76beb95


原文链接:


https://hackernoon.com/ai-reality-checklist-be34e2fdab9

会议推荐

12 月 20-21,AICon将于北京开幕,在这里可以学习来自 Google、微软、BAT、360、京东、美团等 40+AI 落地案例,与国内外一线技术大咖面对面交流。


2018-11-23 19:141246
用户头像

发布了 375 篇内容, 共 190.3 次阅读, 收获喜欢 946 次。

关注

评论 1 条评论

发布
暂无评论
发现更多内容

加速未来!汽车之家App应用性能优化总结与后续展望

之家技术

前端 性能 App 质量 质量赋能

仪表板修改优化实操案例

搞大屏的小北

数据看板 大屏布局 大屏设计 大屏设计优化 数据看板优化

5个高并发场景优化的衡量指标

华为云开发者联盟

开发 华为云 华为云开发者联盟 企业号 8 月 PK 榜

基于YonGPT 的智能大搜,让知识赋能业务和组织!

用友BIP

企业服务大模型 YonGPT

MTK 2.9.2 迁移Oracle 11g 至 openGauss 5.0.0操作指南

daydayup

汽车之家APP端到端全链路治理最佳技术实践

之家技术

质量 质量赋能 端到端 质量监控 质量指标

大语言模型推理性能优化之七策

Baihai IDP

人工智能 大模型 白海科技 推理优化 大模型推理

Spring高手之路11——BeanDefinition解密:构建和管理Spring Beans的基石

砖业洋__

spring BeanDefinition Bean配置

汽车之家页面性能监控建设实践

之家技术

质量 质量赋能 质量监控 质量指标 质量检测

【我和openGauss的故事】带有out参数的存储过程及自定义函数的重载测试

daydayup

倒计时2天 | 第六届openGauss技术文章征集活动最新初审合格名单(截至8.3)

daydayup

山东布谷科技详解Android端直播应用源码保持优质直播质量的技术(三):可变比特率

山东布谷科技

android 软件开发 源码搭建 直播应用源码 可变比特率

父子线程共用线程池

soap said

【我和openGauss的故事】为集群增加VIP

daydayup

如何用IoT边缘连接器实现云端应用控制PLC?

华为云开发者联盟

云计算 后端 华为云 华为云开发者联盟 企业号 8 月 PK 榜

详细的Java学习路线+Java每个阶段核心知识点+Java工作就业方向

java易二三

Java 编程 程序员 计算机 基础

openGauss数据库源码解析系列文章—安全管理源码解析(五)

daydayup

如何在短视频中合成“虚拟数字人”?

阿里云CloudImagine

云计算 剪辑 视频云 数字人

openGauss数据库源码解析系列文章—安全管理源码解析(五)

daydayup

小模型赋能大电网,手机拍照来建档

飞桨PaddlePaddle

人工智能 百度 paddle 飞桨 百度飞桨

Spring Boot 最佳实践

越长大越悲伤

Java spring Spring Boot

学生管理系统架构设计文档

艾瑾行

JDV背后的技术-助力618 | 京东云技术团队

京东科技开发者

数据化 可视化软件 可视化展示 企业号 8 月 PK 榜

【我和openGauss的故事】 openGauss 5.0.0 事务相关语法

daydayup

【我和openGauss的故事】可视化运维平台openGauss Datakit带你轻松玩转openGauss 5.0

daydayup

【开源三方库】Aki:一行代码极简体验JS&C++跨语言交互

OpenHarmony开发者

OpenHarmony

MaxCompute发布按量付费闲时版,计算成本最高节省66.66%!

阿里云大数据AI技术

MaxCompute

汽车之家铸精品工程

之家技术

质量 质量赋能 质量监控 质量指标

Studio One 6 for mac(音乐制作工具) v6.2.0中文特别版

mac

Studio One 音乐制作软件 苹果mac

【我和openGauss的故事】使用Ora2Pg迁移oracle数据到openGauss

daydayup

【我和openGauss的故事】openGauss 5.0.0企业版x86单机安装

daydayup

如何检查你的项目是不是真的需要用到 AI?_AI&大模型_Cassie Kozyrkov_InfoQ精选文章