写点什么

对话业界大咖:人工智能高速发展背后的原因到底是什么?

  • 2020-04-07
  • 本文字数:3497 字

    阅读完需:约 11 分钟

对话业界大咖:人工智能高速发展背后的原因到底是什么?

面向未来企业进行数字化转型,积极拥抱万物互联、万物智能的新时代已经成为众多企业的共识。


但是谈到目前最为火爆的人工智能技术在工业界的应用,依然有很多不一样的观点。那么人工智能技术在工业界应用的时机是否成熟,工业界在应用人工智能时又要遵循什么原则呢?


近日,小编有幸采访到美国罗切斯特大学(University of Rochester,USA)计算机科学系的罗杰波教授。接下来,让小编带大家一起来了解下人工智能高速发展背后的原因以及在工业界应用的建议吧~



美国罗切斯特大学(University of Rochester,USA)计算机科学系的罗杰波教授


罗杰波教授简介:


罗杰波教授是 IEEE、SPIE 和 IAPR 等国际著名学会会士(Fellow),研究涉及图像处理、计算机视觉、自然语言理解,机器学习、数据挖掘等多个前沿领域。罗教授曾在“柯达实验室”从事研究工作多年,并担任首席科学家。罗教授还是多个国际顶级会议的主席,并在多个国际顶尖学术期刊担任职务,发表超过 350 篇学术论文,持有超过 90 项美国专利。近年来,罗杰波教授在社交多媒体研究及其社会应用中做出了开创性贡献。


首先,您能结合自身的研究谈谈,为什么近些年 AI 领域能获得如此迅猛的发展吗? 是哪些关键要素促成了这样一个可喜的结果?


罗教授:


为什么 AI 这两年这么火,我认为有四个原因。


首先,是 Sensor Technology 的发展带动了图像采集的便利,使得图像处理的前期资源有了保证。


其次,是 Big Data 数据量上来了,可以用数据驱动模型来做这个事情。从前我们做这些事情是模型驱动的,不是数据驱动的。很多人都能认识到,我们有了很多数据,但是计算力不够也做不到。


第三,为 GPU、云计算领域技术的快速发展,促进了计算力的明显提升。在这样的时代背景下,人人都可以做这件事。我们早年开始做图像处理的时候内存就只有几兆,图像就只能一点点读,很多事情做不了,但是现在都可以做了。


第四,就是人力。有人说,人工智能是有多少人工就有多少智能,这个事情其实一点都不假。一方面,研究人员多了,比如人脸检测,很多人在做,数据集是开放的,大家都可以不停地刷数据。另一方面,就是标数据的人力数量的提升。比如,你有个想法要做一个手势识别,会有几十个人专门来标数据,一星期就标出很多数据,然后拿去训练,就可以很快实现。


我认为,是以上四个原因让人工智能飞速发展。上述原因主要是基于计算机视觉这个领域来分析,其实语音也是一样的,都是先标数据,然后经过大量的机器训练,最后到功能的实现。


您认为 AI 技术已经相对成熟,可以在工业界逐步走向商用了吗?


罗教授:


我先讲视觉领域,无论看国内还是美国,国内其实更明显,真正成熟的技术主要是围绕从检测到识别的人脸相关技术。为什么成熟呢?因为人脸技术虽然不是刚体,但是接近于刚体,变化比较小,不同的人种差异不大,即使带有表情也都可以识别。另一个我觉得比较成熟的 AI 技术是车辆识别,车辆虽然每年在更新,其实外观都差的不多。


因为有了斯坦福大学公开的图像识别数据集 ImageNet,才有了深度学习,其实一般物体的检测准确率已经大大提升。拿椅子举例,我们当年认为椅子是不可解的,是找不出来的。因为椅子不是一个视觉概念而是一个功能概念(人可以坐),椅子的形状材质各种各样,视觉上变数太大。现在为什么可以找出来呢,还是因为数据量大了,把所有椅子,从各种角度看的椅子都拿来训练,最终识别率就提升了。


工业界在应用 AI 时有几点要注意。关于 AI 技术从工业界到商用,我有一个 70-90-99.5 的经验公式。分为三个阶段:


第一个阶段的门槛是 70%。如果一个技术方向在实验室,在适量的数据集上能达到 70%准确,那么证明这个方向是可行的。


第二阶段是走出实验室到真实世界,用真实世界的数据把它推向更高的层次,目标是 90%。当准确性达到 90%大概率而且不出错时,可以去找一个垂直的场景,这个场景需要达到能够预估到剩下 10%的错误不是灾难性的,或者让它在有限的范围内准确性高于 90%,这样我们的产品就可以推广上市。


第三阶段的门槛我认为是 99.5%。我认为 100%可能性不大,但让机器做到 99.5%,就能达到超过人的程度,这个时候说明它已经走向产业化了。


其实到了 90%的时候就应该开始做,不要等到 99.5%再做。你在做的同时可以考虑和你应用有关的东西,同时学术界也会继续把它往前推,等你把这边工作做好了,学术界的研究也跟上来了。


您认为工业界在应用 AI 技术时,除了 AI 自身还需要关注哪些问题,或者需要避免哪些误区?


罗教授:


谈到误区有几个事情我想说明一下。我以前在柯达的时候,他们有一个做事的理念:事情没有做到完美就不能拿到市场上去。其实 AI 用这种理念来做是会受到影响的,我们到了 90%就可以推出去,这样我们就能在实践中找到缺陷在哪里。另外,是目前在中国看到的一个误区,事情还没有谱,就去大肆宣传,就去卖理念,最后造成大家很失望。因为之前 AI 好几次都是这样的,大家都认为 AI 要改变人类、改变生活,结果没有付诸行动实现,信心就撤掉了。要警惕这种过度承诺,要做到适度,既不要太激进也不要太保守,更不能被人忽悠。


还有一个注意要点跟安全、隐私有关,其中包括视觉和大数据用户画像,这个在一定程度上涉及了人的隐私边界。安全和隐私,企业还是要注意,哪些能用哪些不能用,要做到心中有数。用的时候,有一个方式就是把个体信息脱敏,聚合到群体信息中,这样没有针对某一个人,但是实际上是了解了一类人的行为,进而洞察出有价值的信息。


前些年,工业界大数据技术非常火爆,最近 AI 又在兴起,您怎么理解工业大数据和 AI 的关系?


罗教授:


这个事情我是比较有发言权,我发现有一些公司,他们经常把大数据和 AI 割裂开,或者成立两个部门管理,我认为这个做法是错误的。大数据如果不用 AI,大数据的价值是出不来的,因为数据多了以后,人是没有能力去分析这么多数据的,必须靠 AI。用 AI 去发现人不容易一眼就能看出来的东西,一个是数据量大,维度高的时候,人是没法想象的,这个东西只能靠 AI 来做,所以我认为大数据离不开 AI。反过来 AI 也离不开大数据,特别是现在数据驱动的一些模型,没有大数据寸步难行。


我不是说,AI 离开大数据什么都不能干。因为 AI 现在更多强调的也是如何运用数据来创造价值,AI 还是非常需要大数据的。我认为在学术界只想研究大数据或只想研究 AI 是可行的,但是在工业界两边都要看,不能隔绝开。而且只有当两个放在一起的时候,你才能实现价值的最大化。


最后请您判断一下,未来几年 AI 技术的主要发展方向和趋势。


罗教授:


我先讲一个我不是太熟悉的方向,我觉得硬件上肯定是会继续发展的。NVIDIA 现在其实也在推动一些把计算从云端往移动端或边缘端转移的事情,也有一些移动的芯片,我觉得端与云的协同会继续发展,这是一种趋势。


朱松纯的那篇《浅谈人工智能》内容很好,讲的就是大 AI。最早 AI 是一个领域方向,后来细分为视觉、语音、文本理解、机器学习、机器人等等若干领域。这是因为每个小领域的人认为,我们其实可以在这个领域里面率先取得突破。


现在大家在各自领域发展一段时间,已经取得了一些成绩,分享的意识就提高了,希望得到更多的关注与聆听。实际上,应该是 AI 所有的子领域在一起汇合,才会产生聚合效应。所谓“大 AI”,就是各个领域的成果互通,经验共享,这非常有意义。


拿机器人举例分析,实际上人和机器人最快捷的感知就是视觉,但是要给它命令需要语言,用语言去驱动它,而不是按个什么键。AI 有一个领域被大家遗忘了,Scheduling Planning(调度与规划)就是怎么去做一个计划。


Scheduling Planning 的典范就是导航 GPS,我要从 A 去 B 有这么多条路,我该怎么找出最佳的路线,这就是规划的问题,搜索在有一个目标函数的情况下找出最佳的结果。目前这个变成冷门了,但实际上,在机器人这个领域里面是绝对有用的。机器人要做一个事情,它在想我的任务是从这搬到那,我怎么去越过这些障碍,这就是 Schedule Planning 的问题,它得知道自己的位置,然后把这个环境映射到地图中。


机器人这个应用实际上会涉及到视觉、语音,然后你给他发号指令,并且不局限于简单的指令,NLP 也得有,它自己还得有 Schedule Planning ,而且好多东西都要机器去学习,所以在这个例子里, AI 最后起作用的是,AI 多分支整合产生的最大效应,这个我认为是接下来几年的发展方向。


实际上,特别是从工业界的角度,把这些最新的 AI 技术结合起来然后在一个场景下就可以爆发出最大的效应。客户不看你用的什么方法,无论是视觉还是语音,每一个领域都不是百分百对的,这个时候要采用多模态、多方式的思路,会让系统更加稳健。


本文转载自华为云产品与解决方案公众号。


原文链接:https://mp.weixin.qq.com/s/aZI5L28Z6mzenALerWKcLg


2020-04-07 17:192052

评论

发布
暂无评论
发现更多内容

Druid连接池源码阅读07

石小天

使用 nginx 配置项的好习惯

liuzhen007

nginx 5月月更

有了这10个GitHub仓库,开发者如同buff加持

华为云开发者联盟

GitHub 开源 Web 软件开发

druid源码学习七

Nick

网站开发进阶(七十一):css伪元素::before和::after用法详解

No Silver Bullet

css3 5月月更 伪元素 伪类

苹果 AppStore 财年和账单那些趣事

37手游iOS技术运营团队

apple appstore App生态

FFmpeg安装

Loken

音视频

springboot启动失败的问题('hibernate.dialect' not set)

程序员欣宸

Java 5月月更

区块链有什么价值?

CECBC

【C 语言】指针 Three 之 [赋值语句的方法、指针变量的大小、上述总结、 * 和 & 认识、对解引用(*)认识]

謓泽

5月月更

Go 语言入门很简单:AES加密和解密

宇宙之一粟

AES Go 语言 5月月更

C语言打印程序行号、日期方便调试程序

DS小龙哥

5月月更

7件大事回顾加密史上最疯狂一周

CECBC

MAE自监督算法介绍和基于EasyCV的复现

阿里云大数据AI技术

深度学习 算法 自监督学习

Wallys-AR9582 /2x2 MIMO /Industrial-grade/ 902-928Mhz

wallys-wifi6

架构实战营模块一作业

融冰

架构训练营第一次作业

地下地上

比特币跌破27000美元!币圈大佬损失惨重,最高身价缩水近9成

CECBC

揭秘华为云GaussDB(for Influx):数据直方图

华为云开发者联盟

数据库 华为云 GaussDB(for Influx) 数据直方图 直方图

极狐GitLab yum/apt repo正式开放,更顺畅的极狐GitLab安装升级体验

极狐GitLab

极狐GitLab 安装源

如何给 kitex 贡献单元测试

baiyutang

开源 字节跳动 微服务 5月月更 kitex

5.17电信日 | 融云积极消除数字鸿沟 助力打造数字化新基建

融云 RongCloud

设计模式之观察者模式

乌龟哥哥

5月月更

Apache Kafka 分层存储(Tiered Storage)技术解析

移动云大数据

kafka

Flutter StatefulBuilder 示例

坚果

5月月更

融云 x Zervo:打造欧美 Z 世代社交的「主题幻想世界」

融云 RongCloud

听说你在写Python爬虫,你对浏览器的开发者工具了解多少?【多图预警】

梦想橡皮擦

5月月更

WorkPlus IM即时通讯:快速集成、私有化部署、安全加密

BeeWorks

ffmpeg封装格式转换

Loken

音视频 5月月更

直播预告丨OpenHarmony标准系统多媒体子系统之视频解读

OpenHarmony开发者

OpenHarmony 多媒体

你说写代码,最常用的3个设计模式是啥?

小傅哥

设计模式 小傅哥 架构设计 代码优化 设计原则

对话业界大咖:人工智能高速发展背后的原因到底是什么?_服务革新_华为云产品与解决方案_InfoQ精选文章