阿里云「飞天发布时刻」2024来啦!新产品、新特性、新能力、新方案,等你来探~ 了解详情
写点什么

ODE 网络:一场颠覆 RNN 的革命即将到来

  • 2019-03-30
  • 本文字数:1836 字

    阅读完需:约 6 分钟

ODE网络:一场颠覆RNN的革命即将到来

递归神经网络是当今最常见的人工智能应用程序的核心,但我们很快就发现,它们并不适合用来解决广义时间序列问题。现在已经有几个在使用中的替代解决方案,其中有一个是刚刚出现的——ODE 网络,它与我们思考解决方案的方式截然不同。


递归神经网络及其近亲 LSTM 是人工智能自然语言处理应用程序的核心。与其他形式的人工智能相比,RNN-NLP 在现实世界中的应用要多得多,包括使用卷积神经网络识别和处理图像。


从某种意义上说,数据科学家的队伍已经分成了两组,每一组都在追求使用这两种技术开发独立的应用。从应用角度来看,这两种技术基本上不会发生重叠,因为图像处理处理的是静态数据,而 RNN-NLP 是将语音和文本解释为时间序列数据。


虽然 RNN/LSTM 仍然是大多数 NLP 的首选技术,但我们越是试图扩展时间序列应用,遇到的麻烦就越多。即将出现的技术可能不只是 RNN 的修改版本,而是对其他几种创新人工智能方法的硬分支。

第一个分支:将 CNN 与 RNN 组合使用

第一个分支是我们去年提出的将 CNN 和 RNN 结合在一个神经网络中(详见《将CNN与RNN组合使用,天才还是错乱?》)。需要解决的问题与时间序列上的图像有关,即视频,而最常见的任务是视频场景标记。事实证明,这种技术对于识别和标记视频中的情感以及根据之前在视频中见过的人来识别某些类型的人也很有用。

第二个分支:时间卷积神经网络 TCN

去年,谷歌和 Facebook 都解决了 RNN 的第二类问题。因为要分析的数据扩展到 DNN 中的多个层,所以,在开始计算之前必须等待所有这些层都完成。这也意味着 MPP 实际上并不可行。虽然这个过程仍然很快,但不足以快到可以让实时语言翻译应用程序避免明显的延迟。


第二个分支导致这两家公司放弃了 RNN,转而采用一种他们称之为时间卷积神经网络(TCN)的 CNN 变体来进行实时翻译。这看起来很像添加了“Attention”功能的 CNN。因为它们的结构与 CNN 类似,所以可以应用 MPP,于是延迟就消失了。

第三个分支:不规则时间序列

还有一些其他类型的时间序列问题是 RNN 无法完美解决的。它们的主要是具有连续值或者希望将具有不同频率、持续时间和起始点的时间序列数据组合在一起系统。


最后这一个分支看起来并没有那么神秘。它描述的是这样的一种情况,在你去看不同的医生时,你会看到自己的医疗记录,你有不同的预约时间间隔,有不同剂量和时间间隔的用药情况,对这些药品等有不同的身体反应,并且你的身体在以某种可测量的方式变老、变强、变好或变坏。


这就是为什么人工智能的绝大多数医疗应用都只与图像识别有关。我们在使用不规则时序 AI 能力方面确实存在不足,无法很好地基于不规则时间序列数据得出预测结果。


一种解决方案是将并行的医疗记录分为几星期、几天甚至是几小时的离散步骤。理论上,这样可以满足 RNN 所要求的离散化。但问题是,为了获得最大的收益,你必须使用非常合适的时间桶,这样会增加计算成本和复杂性。还有一个问题,那就是很多时间桶可能不包含任何数据。


因此,预测社区和医疗社区都需要一个人工智能解决方案,其性能要优于目前的 RNN。

ODE 网络

去年 12 月在蒙特利尔举行的神经信息处理系统(NIPS)大会上,来自加拿大向量研究所的研究人员提出了人工智能时间序列建模的全新概念,并被评为大会四篇最佳论文之一。


他们的系统的名字叫作“ODE 网络”,是 Ordinary Differential Equation Net(常微分方程网络)的缩写。但不要被误导了,ODE 网络看起来一点也不像 DNN,它没有节点、层或互连。这是一种使用带有反向传播的黑盒微分方程解算器的方法,在连续和离散时间序列问题上都优于 RNN。换句话说,它更像是一个坚实的计算板,而不是可以被可视化为神经网络的东西。


这种方法带来了思维方式上的几个有趣的变化。例如,在使用 RNN 时,你可以指定层和其他超参数,然后运行实验,并查看所获得的准确性。


而在使用 ODE 网络时,在准确性和训练时间之间存在一个权衡。你指定了准确性级别,ODE 网络将会找到实现这一目标的最佳方法,但训练时间是变化的。如果训练时间长得让人无法接受,可以指定一个较低的准确性,以便加快训练过程。一个有趣的结果可能是在训练时指定高准确性,但在测试时可以指定较低的准确性。


这篇论文(https://arxiv.org/abs/1806.07366)的内容非常全面,并提供了几个实验的结果,其中的结果明显优于RNN。但它仍处于研究阶段,但与数据科学中的大多数东西一样,这并不需要很长时间就能走向应用。


英文原文:


https://www.datasciencecentral.com/profiles/blogs/the-coming-revolution-in-recurrent-neural-nets-rnns



公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2019-03-30 08:003539
用户头像

发布了 38 篇内容, 共 30.6 次阅读, 收获喜欢 206 次。

关注

评论

发布
暂无评论
发现更多内容

React循环DOM时为什么需要添加key

beifeng1996

React

【Nacos源码之配置管理 一】阅读源码第一步,本地启动Nacos

石臻臻的杂货铺

10月月更 nacso

基于kube-scheduler-simulator编写自己的调度程序

琦彦

k8s 调度 kube-scheduler 10月月更

Docker下的Nacos环境开发

程序员欣宸

Docker nacos spring cloud alibaba 10月月更

几个常见的js手写题,你能写出来几道

helloworld1024fd

JavaScript

java开发技术培训应该怎么学习呢

小谷哥

【Nacos源码之配置管理 二】Nacos中的事件发布与订阅--观察者模式

石臻臻的杂货铺

nacos 10月月更

你是怎样解决跨域问题的?-面试必问

loveX001

JavaScript

【SSM】SpringMVC系列——SpringMVC概述

胖虎不秃头

spring ssm 10月月更

2022前端培训学习过程中需要掌握哪些技术点?

小谷哥

手写现代前端框架diff算法-前端面试进阶

helloworld1024fd

JavaScript

React源码解读之任务调度

flyzz177

React

Goland嗖嗖的: 快捷键,自动生成代码等效率小技巧

琦彦

Go goland 10月月更 live template

Collections之Arraylist源码解读(四)

知识浅谈

ArrayList 10月月更

同事嫌我改Bug慢,原来是没掌握这些代码Debug技巧

慕枫技术笔记

debug 后端 10月月更

深入React源码揭开渲染更新流程的面纱

goClient1992

React

Vue.$nextTick的原理是什么-vue面试进阶

bb_xiaxia1998

Vue

【SSM】Spring系列——Spring集成MyBatis

胖虎不秃头

spring ssm 10月月更

前端培训怎么系统学习开发技术呢?

小谷哥

vue为什么v-for的优先级比v-if的高?

bb_xiaxia1998

Vue

Angular 内容投影出现 No provider for TemplateRef found 错误的单步调试

Jerry Wang

typescript Web 前端开发 angular 10月月更

react的useState源码分析

flyzz177

React

Baklib知识分享|企业文档管理的一些策略

Baklib

从React源码来学hooks是不是更香呢

goClient1992

React

react源码中的hooks

flyzz177

React

React的useLayoutEffect和useEffect执行时机有什么不同

beifeng1996

React

vue面试之Composition-API响应式包装对象原理

bb_xiaxia1998

Vue

【LeetCode】使括号有效的最少添加Java题解

Albert

LeetCode 10月月更

【SSM】Spring系列——AOP面向切面编程

胖虎不秃头

spring ssm 10月月更

web前端开发技术培训机构怎么选

小谷哥

大数据培训靠谱吗?

小谷哥

ODE网络:一场颠覆RNN的革命即将到来_AI&大模型_William Vorhies_InfoQ精选文章