【ArchSummit架构师峰会】探讨数据与人工智能相互驱动的关系>>> 了解详情
写点什么

特斯拉 AI 主管说深度学习是软件 2.0,第二天他就被人怼了

  • 2017-11-16
  • 本文字数:2270 字

    阅读完需:约 7 分钟

“有时候,我会听见有些人仅把神经网络视为机器学习的工具。但是我并不认同这个观点。“双十一”当天,特斯拉 AI 主管 Andrej Karpathy 在一篇文章中发表了他的观点。他认为深度学习是软件 2.0,然而第二天,他在文章中关于深度学习的看法就被人怼了。提出反对观点的人为 Carlos E. Perez,曾著有《Deep Learning AI Playbook》一书。

Andrej Karpathy 曾在 OpenAI 公司(计算机视觉深度学习、生成建模和强化学习研究)担任研究员,获得多伦多大学计算机科学与物理双学位,斯坦福大学计算机科学专业博士学位。博士在读期间,他曾在谷歌实习,学习 YouTube 视频大规模特征,并在 DeepMind 进行深度强化学习。他还与李飞飞合作研究卷积 / 回归神经网络架构及其在计算机视觉、自然语言处理以及两者重叠领域的应用,并在斯坦福大学首开深度学习课程——视觉识别的卷积神经网络 (CS231n)。此外, Andrej 还用脚本语言创办深度学习图书馆 arxiv-sanity.com,用户可在该网站查到近三年来关于深度学习的 30000 多篇论文。

软件 2.0

在他看来,神经网络不仅是一个分类器,更意味着编程基础开始发生变化。神经网络有滋生的优势和缺点,应用范围广泛,甚至有时候还能凭此赢得 Kaggle 大赛的胜利。这就是软件 2.0。

大家所熟知的 软件 1.0,是程序员通过 Python, C++ 等编程程序指令组成,每一行代码赋予程序特定的功能。

而软件 2.0 与软件 1.0 不同,前者是通过神经网络权值进行编程。

Karpathy 表示,软件 2.0 的应用范围广泛,在视觉识别、语音识别、语音合成、机器翻译、机器人、游戏中的应用,将展现其不同于软件 1.0 的优势。

例如,软件 2.0 在机器学习方面的应用。以前,视觉识别由设定程序和一些机器学习组成。此后,机器学习发展成能够发现具有更强大图像分析功能的程序,最近机器学习已经能够完成在架构内搜索了。

软件 2.0 在机器翻译方面的应用也快速发展。机器翻译通常通过以词组为基础的数据技术实现,但神经网络很快将成为主流。比如,架构可以设定为弱指导(或完全无监管)多语言,一个模型就可以搞定所有语言翻译。

软件 2.0 不会替代软件 1.0(事实上,训练和推理编辑 2.0 代码需要大量 1.0 架构),但是会逐渐蚕食软件 1.0 目前所应用的领域。

然而,Carlos E. Perez 却对他提出的软件 2.0 存在的一些优势并不认同,认为 Andrej 的文章缺乏支持性的观点,有些他提到的优势并不能判断其真实性。

** 同态计算(**在计算上等同)

神经网络的最典型特征,就是通过矩阵乘法(matrix multiplication )和线性整流函数(ReLU) 进行操作,而传统软件与之相比更有异质性、更复杂。

对此,反对的观点则认为,这种观点虽然有趣,但却是不成立的。虽然神经网络看起来是均匀计算,但这是因为其仍处于早期发展阶段。多样化将朝着专业化和模块化的方向发展,这是自然发展的规律。以大脑为例,我们的大脑是非同态的,因为大脑由不同的若干部分和多种神经网络组成。

更易烧录

在 Karpathy 看来,因为神经网络的指令集更加简短,因此会更加方便地传到专用集成电路、神经形态芯片等组件上。

但 Carlos E. Perez 认为这不现实。硬件是机器学习的关键组成部分,但这个领域变化太快,这也是可编程 GPU 比专用集成电路价值更大的原因。

持续运行

典型的神经网络每一次传输都会花费等量的每秒浮点计算。基于不同的执行路径,代码可以通过一些庞大的 C++ 代码库来实现,几乎可以保证我们永远不会陷入无意的无限循环中。

然而,Carlos E. Perez 认为,这仅适用于简单的网络,但对于更复杂的条件遍历网络却是不一定正确;在运行时间有所差异的迭代组件上,这却完全有可能实现。

常量存储

因为不存在动态分配存储,存储泄露,需要在代码中搜索的可能性极小。

而反对的观点则认为,这对于不断快速写入的网络并不适用。

运算高效

由于连续的矩阵乘法序列,深度学习在任意计算机设备上运算比二进制更加简单。

而反对的观点则认为,深度学习比传统的 ML 更加便携和模块化,但是却忽略了模块化系统的固有特点。

十分 **** 敏捷

软件 2.0 能够减少计算步骤,计算速度可以加快 2 倍,但效率会略差。因此,在计算量较大和需要快速计算时,这一点有非常重要的意义。

此外,Andrej 认为软件 2.0 还具有模块融合最优化、简单易学等特点,但同时也存在数据偏差等不可忽视的缺陷。

软件 2.0 不会超越物理定律

而对于 Andrej 认为软件 2.0 的编程更加进步这一说法,Carlos E. Perez 则表示同意,并称许多伟大的发现都是通过无理论的方式得到的,深度学习或将成为“人类最近的创新”。

具有争议性的是,这个系统是否和其他普遍使用的系统有所不同。软件 2.0 所用的材料、信息处理方式与软件 1. 0 相同,不同的是核心、计算和存储。深度学习同样支持图灵机,并且可以从归纳中进行学习。这意味着,这种模块性的系统有别于一般的编程。但不同的模块性并不意味着基础的硬件特征会消失——软件 2.0 永远不会超越物理定律。因此,从物理层面为深度学习建模时(而不是数学),就会发现机器学习的缺陷。

关于软件深度学习的问题有哪些?考虑到深度学习系统本质上为“直觉机器”,它的行为会和软件 1.0 大为不同。

我们还处于深度学习开发的初始阶段,在这种具有软件 1.0 的功能,但性能优于软件 1.0 的新型计算系统得到应用的过程中,还有很多问题亟待解决。虽然谷歌和优步正致力于这一领域的研究,但还有很多问题仍然存在。

深度学习将会逐渐变成软件 2.0,但还需要一些时间。


感谢杜小芳对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2017-11-16 18:002254
用户头像

发布了 42 篇内容, 共 13.6 次阅读, 收获喜欢 53 次。

关注

评论

发布
暂无评论
发现更多内容

Selenium 自动化前的补充知识,Frame操作、多窗口切换、模糊定位、复合定位

梦想橡皮擦

Python 28天写作 2月春节不断更

28天瞎写的第二百四十四天:冥想的种类

树上

冥想 28天写作 正念

敏捷业务实践之计划游戏

Teobler

项目管理 敏捷 敏捷开发 敏捷开发管理

爬虫知识记录之一

头号摄影师

爬虫

使用 Tye 辅助开发 k8s 应用竟如此简单(六)

newbe36524

Docker Kubernetes 微服务 dotnet

基于WASM的无侵入式全链路A/B Test实践

韩陆

【科技改变生活,区块链改变世界】欧科云链徐明星的区块链密码朋克世界

CECBC

区块链

“定义”

Nydia

一名叫谙忆的程序员在2021年的具体安排《打工人的那些事》

谙忆

敏捷团队实践

Teobler

项目管理 敏捷 敏捷开发 工程实践 敏捷开发管理

山东区块链赋能农产品溯源平台解决方案

源中瑞-龙先生

视频号直播和 PageRank 算法 [待完善]

小匚

机器学习

产业数字金融的数字化与生态化

CECBC

金融

敏捷技术实践之TDD

Teobler

敏捷 敏捷开发 TDD 极限编程 测试驱动开发

我凭借这份“2021全网最全Java面试清单”彻底征服阿里面试官

比伯

Java 编程 程序员 架构 面试

滴滴开源 LogicFlow:专注流程可视化的前端框架

滴滴技术

基于SpringBoot实现文件的上传下载

Java鱼仔

springboot

让听见炮火的人来做决策,做决策的要好好听听炮火

数列科技杨德华

28天写作

泰康和百度智能云为何相互需要?

吴俊宇

百度 保险数字化 泰康

1.2 Go语言从入门到精通:编写第一个Go程序

xcbeyond

28天写作 Go 语言

为您收录的操作系统系列 - 线程小常识

鲁米

线程

首全网发!2021最新版美团面经刷题笔记,已霸榜GitHub

比伯

Java 编程 架构 面试 程序人生

备战金三银四,阿里,腾讯春招面试题解析,含Java岗988道题分享

Java 架构 面试

【Python】关于 Type Hints 你应该知道这些

zhujun

Python

微信小程序开发笔记(一)

陈飞

小程序

Elasticsearch 一个 field 两个索引

escray

elastic 七日更 28天写作 死磕Elasticsearch 60天通过Elastic认证考试 2月春节不断更

关于个人认知的一些碎碎念「Day 6」

道伟

心理学 认知 28天写作

(28DW-S8-Day6)区块链如何解决双重支付及防篡改

mtfelix

比特币 区块链 防篡改 28天写作 双重支付

区块链技术在各国政府管理中的运用

CECBC

区块链

又长又细,万字长文带你解读Redisson分布式锁的源码

数据库 redis 架构

小步发布、验收测试和完整团队

Teobler

项目管理 敏捷 敏捷开发 工程实践 敏捷开发管理

特斯拉AI主管说深度学习是软件2.0,第二天他就被人怼了_语言 & 开发_陈利鑫_InfoQ精选文章