对话业界大咖：人工智能高速发展背后的原因到底是什么？_服务革新_华为云产品与解决方案

面向未来企业进行数字化转型，积极拥抱万物互联、万物智能的新时代已经成为众多企业的共识。

但是谈到目前最为火爆的人工智能技术在工业界的应用，依然有很多不一样的观点。那么人工智能技术在工业界应用的时机是否成熟，工业界在应用人工智能时又要遵循什么原则呢？

近日，小编有幸采访到美国罗切斯特大学（University of Rochester，USA）计算机科学系的罗杰波教授。接下来，让小编带大家一起来了解下人工智能高速发展背后的原因以及在工业界应用的建议吧~

美国罗切斯特大学（University of Rochester，USA）计算机科学系的罗杰波教授

罗杰波教授简介：

罗杰波教授是 IEEE、SPIE 和 IAPR 等国际著名学会会士（Fellow），研究涉及图像处理、计算机视觉、自然语言理解，机器学习、数据挖掘等多个前沿领域。罗教授曾在“柯达实验室”从事研究工作多年，并担任首席科学家。罗教授还是多个国际顶级会议的主席，并在多个国际顶尖学术期刊担任职务，发表超过 350 篇学术论文，持有超过 90 项美国专利。近年来，罗杰波教授在社交多媒体研究及其社会应用中做出了开创性贡献。

首先，您能结合自身的研究谈谈，为什么近些年 AI 领域能获得如此迅猛的发展吗？是哪些关键要素促成了这样一个可喜的结果？

罗教授：

为什么 AI 这两年这么火，我认为有四个原因。

首先，是 Sensor Technology 的发展带动了图像采集的便利，使得图像处理的前期资源有了保证。

其次，是 Big Data 数据量上来了，可以用数据驱动模型来做这个事情。从前我们做这些事情是模型驱动的，不是数据驱动的。很多人都能认识到，我们有了很多数据，但是计算力不够也做不到。

第三，为 GPU、云计算领域技术的快速发展，促进了计算力的明显提升。在这样的时代背景下，人人都可以做这件事。我们早年开始做图像处理的时候内存就只有几兆，图像就只能一点点读，很多事情做不了，但是现在都可以做了。

第四，就是人力。有人说，人工智能是有多少人工就有多少智能，这个事情其实一点都不假。一方面，研究人员多了，比如人脸检测，很多人在做，数据集是开放的，大家都可以不停地刷数据。另一方面，就是标数据的人力数量的提升。比如，你有个想法要做一个手势识别，会有几十个人专门来标数据，一星期就标出很多数据，然后拿去训练，就可以很快实现。

我认为，是以上四个原因让人工智能飞速发展。上述原因主要是基于计算机视觉这个领域来分析，其实语音也是一样的，都是先标数据，然后经过大量的机器训练，最后到功能的实现。

您认为 AI 技术已经相对成熟，可以在工业界逐步走向商用了吗？

罗教授：

我先讲视觉领域，无论看国内还是美国，国内其实更明显，真正成熟的技术主要是围绕从检测到识别的人脸相关技术。为什么成熟呢？因为人脸技术虽然不是刚体，但是接近于刚体，变化比较小，不同的人种差异不大，即使带有表情也都可以识别。另一个我觉得比较成熟的 AI 技术是车辆识别，车辆虽然每年在更新，其实外观都差的不多。

因为有了斯坦福大学公开的图像识别数据集 ImageNet，才有了深度学习，其实一般物体的检测准确率已经大大提升。拿椅子举例，我们当年认为椅子是不可解的，是找不出来的。因为椅子不是一个视觉概念而是一个功能概念（人可以坐），椅子的形状材质各种各样，视觉上变数太大。现在为什么可以找出来呢，还是因为数据量大了，把所有椅子，从各种角度看的椅子都拿来训练，最终识别率就提升了。

工业界在应用 AI 时有几点要注意。关于 AI 技术从工业界到商用，我有一个 70-90-99.5 的经验公式。分为三个阶段：

第一个阶段的门槛是 70%。如果一个技术方向在实验室，在适量的数据集上能达到 70%准确，那么证明这个方向是可行的。

第二阶段是走出实验室到真实世界，用真实世界的数据把它推向更高的层次，目标是 90%。当准确性达到 90%大概率而且不出错时，可以去找一个垂直的场景，这个场景需要达到能够预估到剩下 10%的错误不是灾难性的，或者让它在有限的范围内准确性高于 90%，这样我们的产品就可以推广上市。

第三阶段的门槛我认为是 99.5%。我认为 100%可能性不大，但让机器做到 99.5%，就能达到超过人的程度，这个时候说明它已经走向产业化了。

其实到了 90%的时候就应该开始做，不要等到 99.5%再做。你在做的同时可以考虑和你应用有关的东西，同时学术界也会继续把它往前推，等你把这边工作做好了，学术界的研究也跟上来了。

您认为工业界在应用 AI 技术时，除了 AI 自身还需要关注哪些问题，或者需要避免哪些误区？

罗教授：

谈到误区有几个事情我想说明一下。我以前在柯达的时候，他们有一个做事的理念：事情没有做到完美就不能拿到市场上去。其实 AI 用这种理念来做是会受到影响的，我们到了 90%就可以推出去，这样我们就能在实践中找到缺陷在哪里。另外，是目前在中国看到的一个误区,事情还没有谱，就去大肆宣传，就去卖理念，最后造成大家很失望。因为之前 AI 好几次都是这样的，大家都认为 AI 要改变人类、改变生活，结果没有付诸行动实现，信心就撤掉了。要警惕这种过度承诺，要做到适度，既不要太激进也不要太保守，更不能被人忽悠。

还有一个注意要点跟安全、隐私有关，其中包括视觉和大数据用户画像，这个在一定程度上涉及了人的隐私边界。安全和隐私，企业还是要注意，哪些能用哪些不能用，要做到心中有数。用的时候，有一个方式就是把个体信息脱敏，聚合到群体信息中，这样没有针对某一个人，但是实际上是了解了一类人的行为，进而洞察出有价值的信息。

前些年，工业界大数据技术非常火爆，最近 AI 又在兴起，您怎么理解工业大数据和 AI 的关系？

罗教授：

这个事情我是比较有发言权，我发现有一些公司，他们经常把大数据和 AI 割裂开，或者成立两个部门管理，我认为这个做法是错误的。大数据如果不用 AI，大数据的价值是出不来的，因为数据多了以后，人是没有能力去分析这么多数据的，必须靠 AI。用 AI 去发现人不容易一眼就能看出来的东西，一个是数据量大，维度高的时候，人是没法想象的，这个东西只能靠 AI 来做，所以我认为大数据离不开 AI。反过来 AI 也离不开大数据，特别是现在数据驱动的一些模型，没有大数据寸步难行。

我不是说，AI 离开大数据什么都不能干。因为 AI 现在更多强调的也是如何运用数据来创造价值，AI 还是非常需要大数据的。我认为在学术界只想研究大数据或只想研究 AI 是可行的，但是在工业界两边都要看，不能隔绝开。而且只有当两个放在一起的时候，你才能实现价值的最大化。

最后请您判断一下，未来几年 AI 技术的主要发展方向和趋势。

罗教授：

我先讲一个我不是太熟悉的方向，我觉得硬件上肯定是会继续发展的。NVIDIA 现在其实也在推动一些把计算从云端往移动端或边缘端转移的事情，也有一些移动的芯片，我觉得端与云的协同会继续发展，这是一种趋势。

朱松纯的那篇《浅谈人工智能》内容很好，讲的就是大 AI。最早 AI 是一个领域方向，后来细分为视觉、语音、文本理解、机器学习、机器人等等若干领域。这是因为每个小领域的人认为，我们其实可以在这个领域里面率先取得突破。

现在大家在各自领域发展一段时间，已经取得了一些成绩，分享的意识就提高了，希望得到更多的关注与聆听。实际上，应该是 AI 所有的子领域在一起汇合，才会产生聚合效应。所谓“大 AI”，就是各个领域的成果互通，经验共享，这非常有意义。

拿机器人举例分析，实际上人和机器人最快捷的感知就是视觉，但是要给它命令需要语言，用语言去驱动它，而不是按个什么键。AI 有一个领域被大家遗忘了，Scheduling Planning（调度与规划）就是怎么去做一个计划。

Scheduling Planning 的典范就是导航 GPS，我要从 A 去 B 有这么多条路，我该怎么找出最佳的路线，这就是规划的问题，搜索在有一个目标函数的情况下找出最佳的结果。目前这个变成冷门了，但实际上，在机器人这个领域里面是绝对有用的。机器人要做一个事情，它在想我的任务是从这搬到那，我怎么去越过这些障碍，这就是 Schedule Planning 的问题，它得知道自己的位置，然后把这个环境映射到地图中。

机器人这个应用实际上会涉及到视觉、语音，然后你给他发号指令，并且不局限于简单的指令，NLP 也得有，它自己还得有 Schedule Planning ，而且好多东西都要机器去学习，所以在这个例子里， AI 最后起作用的是，AI 多分支整合产生的最大效应，这个我认为是接下来几年的发展方向。

实际上，特别是从工业界的角度，把这些最新的 AI 技术结合起来然后在一个场景下就可以爆发出最大的效应。客户不看你用的什么方法，无论是视觉还是语音，每一个领域都不是百分百对的，这个时候要采用多模态、多方式的思路，会让系统更加稳健。

本文转载自华为云产品与解决方案公众号。

原文链接：https://mp.weixin.qq.com/s/aZI5L28Z6mzenALerWKcLg

发布

暂无评论

创作场景

对话业界大咖：人工智能高速发展背后的原因到底是什么？

评论

3DCAT实时云渲染助力广府庙会元宇宙焕新亮相，开启线上奇趣之旅！

如何使用 Linux find 命令查找文件？

易观千帆 | 2023年3月银行APP月活跃用户规模盘点

华为，找寻科技秋天里的春光

Groovy as关键字性能测试

浪潮海岳低代码平台inBuilder开源社区版正式发布

图数据库 NebulaGraph 的 Java 数据解析实践与指导

CloudQuery 社区版回归直播即将开启

devops如何使用chatgpt提高工作效率

Linux内核中的C语言宏：常见用法和最佳实践

软件测试/测试开发丨接口测试配置的数据驱动

TikTok视频怎么无水印保存到相册？这有啥难的，跟我学轻松变大神~

【Python 实战】Python 采集二手车数据——超详细讲解

算法题每日一练---组合总和

免费，无需魔法，媲美ChatGPT4

玩转AIGC，5分钟 Serverless 部署 Stable Diffustion 服务

测试用例该如何编写？

Vue3 内置组件

【JVM故障问题排查心得】「GC内存诊断」一文教你如何打印及分析JVM的GC日志（实战分析上篇）

《嗨，城市猎人》首播，揭秘猎头行业职场真实状态

selenium源码通读·8 |webdriver/common/keys.py-Keys类分析

火爆的低代码开发具有哪些技术特点？

OMG！这个Ins快拍保存到相册的办法绝了！还在犹豫什么，都给我冲！

ChatGPT：改变未来沟通方式的人工智能语言模型

ShareSDK Android SDK API

数据生产压力突增23倍，平台“可观测性”如何帮这家制造集团排忧解难？ | 奇点云技术分享

CSA GCR大会正式发布全球首个云渗透测试认证专家课程，腾讯安全获评“特别贡献单位”

国家工信安全中心权威认证！

一文初探 Go reflect 反射包

创作场景

对话业界大咖：人工智能高速发展背后的原因到底是什么？

评论

更多内容推荐

推荐阅读

电子书

大厂实战PPT下载