写点什么

浙大吴飞“舌战”阿里贾扬清:AI 内卷与年薪百万,哪个才是真实?

  • 2021-05-12
  • 本文字数:5585 字

    阅读完需:约 18 分钟

浙大吴飞“舌战”阿里贾扬清:AI内卷与年薪百万,哪个才是真实?

十四五规划提出,把科技自立自强作为国家发展的战略支撑,瞄准人工智能、量子信息、生物医药等前沿领域,实施一批具有前瞻性、战略性的国家重大科技项目。


人工智能将引领新一轮的技术变革与数智化浪潮,与此同时,外界对于人工智能的隐忧与质疑也从未中断。


哪一面,才是人工智能的真实?


为了推动 AI 技术的应用创新,促进人工智能领域的学术交流、人才培养,中国人工智能学会联合杭州市余杭区政府发起首届全球人工智能技术创新大赛,阿里云天池平台为本次大赛提供平台和算力支撑。


作为大赛的预热节目,“AI 青年说”近期邀请到浙江大学求是特聘教授、人工智能研究所所长吴飞与阿里云计算平台负责人贾扬清,交流人工智能技术与应用的发展趋势,更重要的是,聊聊“AI 内卷与年薪百万,哪个才是真实?”


(以下为对话节选)

如何与人工智能结缘?


吴飞:我是 2009 年的时候开始对人工智能产生兴趣,当时我对自己的研究方向产生了深深的焦虑,觉得自己当时研究所写的东西“面目可憎,言语无味”。这个时候,我得到去美国加州大学伯克利分校统计系郁彬教授课题组做访问学者的机会,深入学习很多有关机器学习模型理论和算法的知识。


原来在冰冷的机器后面,有这么多深奥的模型、算法和这么新鲜的理论来支持。一年之后,我回到浙大,从此走上了人工智能的学术道路。


贾扬清: 我最开始是学习自动化的。以前,我们开玩笑说,自动化主要做两件事情,一个是烧锅炉的,一个是开电梯的。


后来在研究生期间,我就对于人工智能和统计机器学习产生了更多的兴趣,当时人工智能并没有那么热,有一句流行的话,“人工智能是在 80%的时间里,以 80%的正确率,解决 80%的问题。” 但是我们也不知道,那 80%的时间解决了哪些 80%的问题,大家一直处于相对低谷的状态。


2006 年的时候, Geoffrey Hinton 在《Science》发表了一篇讲受限玻尔兹曼机(restricted Boltzmann machine)的文章,我开始对人工神经网络等基础理论以及大规模训练产生兴趣。我是 2009 年去了加州大学伯克利分校,也有幸跟吴老师在伯克利相处了一年多的时间。


攻读博士期间,我们发现神经网络、深度学习的方法变得越来越重要,我们最开始从稀疏编码(Sparse Coding)等方面入手,构建一系列的软件栈以及相应的科学研究,来把基于深度学习的算法做得越来越好。


2012 年,AlexNet 的出现让全世界都突然意识到深度学习的重要,在此之前,2010 年左右,在语音领域 RNN 等方法已经开始被应用起来。当时我发现大家都在纷纷涌向深度学习算法,相应的软件工具平台却比较匮乏的,所以我们在伯克利就开始做 Caffe 以及后来一系列的深度学习框架。


在接下来的几年,我们见证了深度学习算法的大规模应用,无论是算法创新方面,还是方法的落地方面,都开始有了非常大的市场。


无论是阿里的城市大脑算法,还是达摩院的很多新型算法模型,很荣幸我的研究能够成为一个底座,支持大家在 AI 技术及应用上有进一步的创新和发展。


十四五规划把人工智能列为前沿科技领域的“最高优先级”。这对人工智能专业而言,意味着什么?


吴飞:2017 年,国务院公布了中国新一代人工智能发展规划,规划明确指出:人工智能是引领未来的战略性技术,必将推动人类社会和生活模式以及学习方式的巨大改变。


我想对年轻人而言,人工智能就意味着未来,因为它本身是一个使能技术,不断推动着社会的快速前进。规划还指出,高校要设置人工智能本科专业。2018 年,教育部批准了 35 所高校设置人工智能本科专业。到现在为止,全国一共有 345 所高校设置了人工智能本科专业。


图灵在 1949 年谈及图灵机时表示,“(图灵机模型的提出)这不过是将来之事的前奏,也是将来之事的影子。”


因此,对年轻人而言,无论是基础研究、关键核心技术的突破,还是赋能场景的实现,人工智能已经悄然地走进社会,像水和电一样的不断赋能社会的发展。

未来 AI 有哪些值得关注的趋势?


贾扬清: 在 2012 年以前,要做一个计算机视觉的识别系统,基本上就要去读一个博士,才能做出来,而且效果还不一定好。今天我们发现,从 0 到 1 的积累差不多已经完成了,或者说已经比较成熟。算法的标准化和应用化会变成趋势。


今天如果我想做一个无人驾驶的 demo,就并不需要去学计算机视觉的博士。因为今天有非常多开源的模型,让我们能够非常迅速地把算法能力给补齐。算法的标准化、工程化,以及怎样迅速地把标准算法和特定的业务场景结合起来,是我们今天在计算机视觉、语音、自然语言理解等领域的大趋势。


当然科研还在继续往前走,我们在寻找新的高精尖方向。但同时我认为,怎样把现有结果大规模应用到不同场景中去,是一个非常大的趋势。


另外,我们会发现,以前单纯的垂直场景,比如像计算机视觉、语音、自然语言处理等已经开始逐渐融合,变得共通,这就需要用到大规模、多模态模型。如我们所见,谷歌、OpenAI、DeepMind 等公司都在这方面做出非常多的探索。


前段时间 OpenAI 推出 GPT-3 模型,这带来的启发是:我们需要有一个通用、多模态的模型,来统一理解各种形态的数据和各种形态的输入。


我觉得这代表了另外一个趋势。一方面是现有结果的工程化和规模化,另一方面是各子领域之间的相互贯通,以及做到更加深入、更加本质的理解。


吴飞: 我补充一下,有两个方向的趋势值得关注。


第一个是从 0 到 1,按照朱松纯教授的说法,现在的机器智能是“大数据小任务”,比如 GPT-3 有 1750 亿的参数,并且使用上千 GB 的训练数据把它训练出来。 但如何让人工智能或机器智能具有人脑小样本学习的能力、动物的直觉能力以及举一反三的能力,这是我们面临的巨大挑战。


第二个我觉得是从 1 到 N,人工智能已经是一门使能技术。就像我们徐匡迪院士所言,“人工智能需要数学家参与进来。”


人工智能取得突破性的领域方向,一定是从脑科学、材料学等领域得到了启发,所以 AI 接下来的突破,一定是基于大数据、多学科交叉下的领域突破。


贾扬清:我也补充一点。今天的人工智能系统,特别是在感知领域,无论是计算机视觉还是语音,都存在一种“一揽子买卖”的状态。例如有一个输入和一个输出,标注是人或者车,这就是一个所谓的“one shot”过程,目标集有时是手工指定的。


怎样从单点的目标或者单点的预测(prediction)到更加完整的知识体系,即所谓的大知识。正如吴老师刚提到的“大数据小任务”,“大数据大知识”是我们今天需要打通的一件事情:在简单标签的基础上再构建一个知识体系,无论是逻辑关系还是其他关系。


传统的专家系统,更多的是通过人工手写的方式来做的,很难规模化。传统的机器学习方法还是小任务单点预测的状态。怎样能够让机器学习系统更加自动、规模化地生成结构化的知识和结构化的体系,我觉得,在接下来几年,这方面可能产生最大的突破,或者至少是需求最大的方面。


同时它也引出了另外一点,就是吴老师刚才提到的:人工智能怎样赋能行业,例如制药业的数据是非常少的,对于逻辑推理和知识抽象的要求非常高。因为它没有办法像图像识别一样能使用几百万张图片作为数据。


简而言之,未来有两个趋势:一个是从大数据到大知识,另一个是怎样通过抽象出来的知识体系,来赋能其他领域,以更好地使用 AI 技术。

人工智能目前存在的障碍与问题


吴飞: 发展人工智能一定要有丰沃的土壤,也就是人工智能发展的生态。今天要支撑起中国人工智能的发展,一定要依靠底层的算力、底层的软硬件以及中间算法和上层的应用软件。从底到高支撑起中国人工智能的发展,就是它的技术生态。


可能是之前我们忙于搞模型、搞算法、搞应用。而现在已经到了一个关口,需要阿里巴巴等企业的投入,需要浙江大学、清华大学、北京大学等高校的投入,需要政府的关切以及各行各业人才的投入,同频共振、相向而行,建设一个良好的生态。


贾扬清: 今天谈论得非常不足的一点是,怎样让所有人都能用到人工智能的技术。


此前我们更关注的是怎样发展高精尖的技术。纵观历史,我们说人工智能是通用化的技术,或者我们相信未来它将是技术发展的核心点,这就需要让所有人都能更容易地接触到人工智能。


几十年前,英语专业有一个专门的职业叫翻译,而在国际化的影响下,如今很多人自身就能掌握中英双语。我们以前说:“计算机要从娃娃抓起。”而今天我们几乎每个人都有使用计算机或操作计算机的能力,无论是电脑还是手机。只有达到这种普惠程度的时候,我们才能够把一个技术称为通用的、普惠的技术。


今天人们要触达 AI 技术还是相对困难的。无论是在硬件上(搭一个带有 GPU 的机器),还是在软件上(安装一套人工智能框架以及底层数据的软件等),都还比较困难。


设想一下,如果任何一个懂电脑的人都可以在 5 秒钟之内开始尝试写 AI 算法的代码,并且很快能识别一张图像的内容。他也许并不懂底层的技术是怎样实现的,但创造性的火花很容易就此迸发。


高精尖的技术往往是比较抓眼球,容易被大家接受。而从长远角度看,这种潜移默化的普惠化、润物细无声的过程会收获更好的效果。

读博对于人工智能意味着什么?


贾扬清: 学习人工智能与是否读博的关系并不是很大,每一个行业都会对博士有特别定义。在 AI 领域有非常多优秀的本科生和硕士生,他们并不比博士的能力差。


从个人经历来看,我的博士生涯教会我的最重要一点不是“怎样做一件事情”,而是让我更多地思考“我们应该解决什么样的问题”。


博士更多的是要定义问题,需要从特别复杂的场景中抽象出要解决的问题的定义。然后第二位的才是「怎样解决这个问题」,这是博士生涯对我帮助最大的一点。


从培养的角度讲,如果大家希望培养一下自己定义问题的能力,我觉得博士还是很值得读的。5 年的时间不长也不短,但能力的提升是终身获益的事。


吴飞: 我完全同意扬清的观点。**读博的问题要辩证看待。**如果同学们渴望充电,有渴望学习的饥饿感,通过职业培训或者通过工作环境中的积累无法解决,那就去读博士。并且读博期间一定要注意,学习目的不只是获得文凭,也不只是发表文章,而是为了培养能力。


刚才扬清也讲了,这是一个终身的事情,人们常说读完博士之后,他能不能发展好要再看 5 年,5 年之后如果继续往前发展,就说明他已经走上了人生不断向前发展的轨道。

排除疫情的因素,出国深造还有没有必要?


贾扬清: 这个问题没有非黑即白的答案。首先,现在国际交流越来越多,线上会议只有时差问题,就像看世界杯一样,出国可能没有 10 年前或 20 年前那么必要了。


另一方面,我一直相信不同文化、不同思想的融会贯通是创造新的思想和方法的丰沃土壤。如果有机会的话,我也建议大家出国去看一看,无论是参加一个学术会议,还是访学计划,或者投资更长的时间去读博。更加重要的是,从自己出发,打开心扉,去了解不同的文化与技术氛围


吴飞: 我是 2009 年 10 月份从北京首都机场出发,飞往美国旧金山。当时我已经 36 岁了,那是我第一次出国。在伯克利的时光,我基本是两点一线,从宿舍到伯克利的实验室。一年到头,我只有春节期间休息了几天,记得除夕约了扬清吃了顿饺子,那也是我没去实验室的仅有的一两天。


很多人都有出国的经历,但并不是所有出国的人都抓住了机会,也并不是每个人都能完成自己的志向。在美国高水平的大学里,如果能够把自己全部的精力都用于学习,是非常好的人生体验。


从伯克利回来之后,我的大脑里面会经常浮想起美国西海岸蔚蓝的天空以及宿舍夜里火车经过的鸣笛声。这不是在回忆美国的生活,而是在回忆当时的奋斗。

AI 内卷与年薪百万,哪个才是真实?


贾扬清: 内卷是一个很有意思的概念,包括大家逛知乎常看到一个词语,叫调参侠。


在 AI 领域,有很多创新的事情可以做。内卷与否,是我们自己内心的表现。如果觉得自己做不出新的东西,只能调调参数,做一些增量工作,这肯定是内卷的。


容易的地方就会内卷的,难的领域往往会有突破。


应该给自己更多的信心与勇气。AI 已经是个日新月异的领域了,广泛应用到互联网、交通、电力、航空等领域,每年都有新的突破,何不去做创新呢。


吴飞:扬清有意避开了“年薪百万不是梦”,但对高校老师而言“年薪百万就是梦”。教师的工资明显没有学生高,这是人工智能领域的实际情况。我们培养了很多的学生,现在已是年薪百万。这说明人工智能专业的职业发展前景非常好。


未来的发展趋势不会改变,整个国家把人工智能作为一种战略性技术进行发展的大方针不变,各行各业都会对人工智能有极大热情。


为什么会内卷,是因为大家都跑到一条赛道上去了,比如都挤到“大数据小任务”的赛道,变成了所谓的“调参侠”。于是没人做农业、司法、环境等更具开创性的场景应用,就发生了内卷。


想象一下,你读完人工智能的博士或者研究生,如果进入一个稀缺人工智能的行业,那么你就是这个行业的 AI 之王,哪里会有内卷。


贾扬清:我也顺便谈下“年薪百万”这个事。像我今天早餐是自己做的,午饭是在食堂解决的,平时真的花不了多少。其实真让自己开心的事并不是年薪百万,而是我们做的东西有人用,大家都喜欢。我特别崇敬吴老师这些学校里面的老师。第一,他们在探索前沿研究;第二,他们在培养 AI 以及各个技术领域的人才。

全球人工智能技术创新大赛,对学界与业界的意义


吴飞: 中国人工智能学会从为国家培养人才的角度来举办大赛,赛题也来自于产业界的需求,这非常好。人工智能最贵重的一点就是贵其能用,赋能社会,每个赛题都来自产业的需求。同学们用在高校学习得到的知识和技术,来解决产业的问题,就打破了学科的壁垒,达到产教融合的效果。同学借此了解到业界解决问题的一些方法与思路,相信以后回到高校,可以更高屋建瓴地看待学习的内容。所以全球人工智能技术创新大赛是高等学校和产业界携手,面向人工智能应用进行人才培养的好方式。


贾扬清: 竞赛一直是推动创新的好机制,以前在读书的时候有挑战杯这样的比赛,这对我们在课程之外尝试一些新的东西是非常有用的。比如 Facebook 等公司也有黑客马拉松的机制,某程度上可以让大家跳出本职工作,尝试新的点子,产出新的技术或者产品。借着吴老师刚才说的“随心所欲,随遇而安”,我觉得这个比赛大家可以“生死看淡,不服就干”。相信大家都能够从比赛中体会到快乐,收获到知识。

2021-05-12 13:355200

评论 1 条评论

发布
用户头像
这也算舌战?老UCer了
2021-05-24 09:11
回复
没有更多了
发现更多内容

关于热力图数据上报清洗,我们做了一个有意思的尝试

阿里巴巴中间件

MindSpore实践:对篮球运动员目标的检测

华为云开发者联盟

深度学习 mindspore 图像检测 yolo 篮球运动

EGG Network阿凡提的模式是怎么样的?早点了解别错失这个机会!

币圈那点事

区块链

区块链电子合同签署平台,助力企业数字化转型

13828808769

区块链+ #区块链#

未来几年,低代码开发平台会如何发展?

优秀

低代码

策略枚举:消除在项目里大批量使用if-else的正确姿势

朱季谦

枚举 策略模式

web前端面试题详细解析

yumibgt

面试

基于深度学习的端到端通信系统模型

华为云开发者联盟

深度学习 端到端 编码器 通信系统 信道模型

是谁拖(慢)了 Redis 的后腿?

escray

redis 学习 极客时间 3月日更 Redis 核心技术与实战

spark性能调优之JVN调优

大数据技术指南

spark 3月日更

Activiti工作流自动生成28张数据库表的底层原理分析

朱季谦

Activity 工作流引擎

Kylin安装部署

五分钟学大数据

kylin 3月日更

金三银四,冰河为你整理了这份20万字134页的面试圣经!!

冰河

面试 面经 offer 金三银四 我要进大厂

Knativa 基于流量的灰度发布和自动弹性实践

Serverless Devs

Serverless Kubernetes 运维 云原生 Knative

Rust从0到1-基础概念-函数

rust 函数

vue项目中使用tinymce富文本编辑器实现图片上传/粘贴格式

yumibgt

tinymce

云端数智新引擎,腾讯云原生数据湖计算重磅发布

腾讯云大数据

大数据 数据湖

Python OpenCV 图像平移,取经之旅第 10 天

梦想橡皮擦

3月日更

v01.12 鸿蒙内核源码分析(双向链表) | 谁是内核最重要结构体 | 百篇博客分析 HarmonyOS 源码

鸿蒙研究站

鸿蒙 HarmonyOS 鸿蒙内核源码分析 百篇博客分析鸿蒙 百万汉字注解鸿蒙

模仿Activiti工作流自动建表机制,实现Springboot项目启动后自动创建多表关联的数据库与表的方案

朱季谦

建表

visualvm工具远程对linux服务器上的JVM虚拟机进行监控与调优

朱季谦

JVM GC 调优

微信扫码登录技术实现的简单思考

朱季谦

redis

近万字原创长文,以追忆2020年:《请回答,2020》

朱季谦

随笔杂谈

压抑了五个月的我终于可以放声呐喊了!阿里是真的难进,Java四面面经+面试题

Java架构追梦

Java 阿里巴巴 架构 面试 金三银四

数字化进入深水区

鲸品堂

方法论 数字化 企业数字化转型

智能安防监控系统的发展与应用

anyRTC开发者

android 监控 音视频 WebRTC RTC

6大创新技术及2亿美元投入计划,这个活动有点料

华为云开发者联盟

人工智能 数据库 华为 云原生 HDC.Cloud

基于NB-IoT的智慧路灯监控系统(NB-IoT专栏—实战篇5:手机应用开发)

不脱发的程序猿

物联网 28天写作 3月日更 NB-IoT智慧路灯 手机应用开发

关于企业容器安全问题的思考

阿里巴巴中间件

降维打击:数据可视化降本增效,传统制造业价值即将扭转!

一只数据鲸鱼

物联网 数据可视化 工业物联网 数字化运维 3D

大“食”代来临,后厨重地可以更“聪明”点儿

IoT云工坊

人工智能 物联网 PaaS 智慧厨房 智慧餐饮

浙大吴飞“舌战”阿里贾扬清:AI内卷与年薪百万,哪个才是真实?_AI&大模型_中国人工智能学会_InfoQ精选文章