10 月 23 - 25 日,QCon 上海站即将召开,现在大会已开始正式报名,可以享受 8 折优惠 了解详情
写点什么

ODE 网络:一场颠覆 RNN 的革命即将到来

  • 2019-03-30
  • 本文字数:1836 字

    阅读完需:约 6 分钟

ODE网络:一场颠覆RNN的革命即将到来

递归神经网络是当今最常见的人工智能应用程序的核心,但我们很快就发现,它们并不适合用来解决广义时间序列问题。现在已经有几个在使用中的替代解决方案,其中有一个是刚刚出现的——ODE 网络,它与我们思考解决方案的方式截然不同。


递归神经网络及其近亲 LSTM 是人工智能自然语言处理应用程序的核心。与其他形式的人工智能相比,RNN-NLP 在现实世界中的应用要多得多,包括使用卷积神经网络识别和处理图像。


从某种意义上说,数据科学家的队伍已经分成了两组,每一组都在追求使用这两种技术开发独立的应用。从应用角度来看,这两种技术基本上不会发生重叠,因为图像处理处理的是静态数据,而 RNN-NLP 是将语音和文本解释为时间序列数据。


虽然 RNN/LSTM 仍然是大多数 NLP 的首选技术,但我们越是试图扩展时间序列应用,遇到的麻烦就越多。即将出现的技术可能不只是 RNN 的修改版本,而是对其他几种创新人工智能方法的硬分支。

第一个分支:将 CNN 与 RNN 组合使用

第一个分支是我们去年提出的将 CNN 和 RNN 结合在一个神经网络中(详见《将CNN与RNN组合使用,天才还是错乱?》)。需要解决的问题与时间序列上的图像有关,即视频,而最常见的任务是视频场景标记。事实证明,这种技术对于识别和标记视频中的情感以及根据之前在视频中见过的人来识别某些类型的人也很有用。

第二个分支:时间卷积神经网络 TCN

去年,谷歌和 Facebook 都解决了 RNN 的第二类问题。因为要分析的数据扩展到 DNN 中的多个层,所以,在开始计算之前必须等待所有这些层都完成。这也意味着 MPP 实际上并不可行。虽然这个过程仍然很快,但不足以快到可以让实时语言翻译应用程序避免明显的延迟。


第二个分支导致这两家公司放弃了 RNN,转而采用一种他们称之为时间卷积神经网络(TCN)的 CNN 变体来进行实时翻译。这看起来很像添加了“Attention”功能的 CNN。因为它们的结构与 CNN 类似,所以可以应用 MPP,于是延迟就消失了。

第三个分支:不规则时间序列

还有一些其他类型的时间序列问题是 RNN 无法完美解决的。它们的主要是具有连续值或者希望将具有不同频率、持续时间和起始点的时间序列数据组合在一起系统。


最后这一个分支看起来并没有那么神秘。它描述的是这样的一种情况,在你去看不同的医生时,你会看到自己的医疗记录,你有不同的预约时间间隔,有不同剂量和时间间隔的用药情况,对这些药品等有不同的身体反应,并且你的身体在以某种可测量的方式变老、变强、变好或变坏。


这就是为什么人工智能的绝大多数医疗应用都只与图像识别有关。我们在使用不规则时序 AI 能力方面确实存在不足,无法很好地基于不规则时间序列数据得出预测结果。


一种解决方案是将并行的医疗记录分为几星期、几天甚至是几小时的离散步骤。理论上,这样可以满足 RNN 所要求的离散化。但问题是,为了获得最大的收益,你必须使用非常合适的时间桶,这样会增加计算成本和复杂性。还有一个问题,那就是很多时间桶可能不包含任何数据。


因此,预测社区和医疗社区都需要一个人工智能解决方案,其性能要优于目前的 RNN。

ODE 网络

去年 12 月在蒙特利尔举行的神经信息处理系统(NIPS)大会上,来自加拿大向量研究所的研究人员提出了人工智能时间序列建模的全新概念,并被评为大会四篇最佳论文之一。


他们的系统的名字叫作“ODE 网络”,是 Ordinary Differential Equation Net(常微分方程网络)的缩写。但不要被误导了,ODE 网络看起来一点也不像 DNN,它没有节点、层或互连。这是一种使用带有反向传播的黑盒微分方程解算器的方法,在连续和离散时间序列问题上都优于 RNN。换句话说,它更像是一个坚实的计算板,而不是可以被可视化为神经网络的东西。


这种方法带来了思维方式上的几个有趣的变化。例如,在使用 RNN 时,你可以指定层和其他超参数,然后运行实验,并查看所获得的准确性。


而在使用 ODE 网络时,在准确性和训练时间之间存在一个权衡。你指定了准确性级别,ODE 网络将会找到实现这一目标的最佳方法,但训练时间是变化的。如果训练时间长得让人无法接受,可以指定一个较低的准确性,以便加快训练过程。一个有趣的结果可能是在训练时指定高准确性,但在测试时可以指定较低的准确性。


这篇论文(https://arxiv.org/abs/1806.07366)的内容非常全面,并提供了几个实验的结果,其中的结果明显优于RNN。但它仍处于研究阶段,但与数据科学中的大多数东西一样,这并不需要很长时间就能走向应用。


英文原文:


https://www.datasciencecentral.com/profiles/blogs/the-coming-revolution-in-recurrent-neural-nets-rnns



2019-03-30 08:004312
用户头像

发布了 38 篇内容, 共 32.5 次阅读, 收获喜欢 209 次。

关注

评论

发布
暂无评论
发现更多内容

千行万业的数智化,将在全闪普惠的土壤上开出新花

Alter

将大模型装进PC和手机,需要怎样的底层创“芯”?

脑极体

AI

再获殊荣!嘉为蓝鲸携手电力公司入选工信部信创典型解决方案

嘉为蓝鲸

运维 数字化转型 信创

解锁携程美食与景点数据接口:打造个性化旅行体验的秘密武器

tbapi

携程API 携程景点列表接口 携程酒店API 携程美食列表API

DARPA计划“消灭”C语言代码

我再BUG界嘎嘎乱杀

网络安全 编程语言 C语言 内存安全 DARPA

涨姿势啦!Go语言中正则表达式初始化的最佳实践

左诗右码

Go

30% 代码由 AI 生成,单测准确率达到 90%,我在阿里巴巴国际站推广通义灵码

阿里云云效

阿里云 云原生 通义灵码

未来已来:阿里巴巴商品搜索API返回值的智能化展望

技术冰糖葫芦

api 货币化 API 接口 API 文档 API 测试

嘉为蓝鲸WeOps上新:新增机房机柜视图,集中管理IT设备

嘉为蓝鲸

运维 weops IT资产管理

30% 代码由 AI 生成,单测准确率达到 90%,我在阿里巴巴国际站推广通义灵码

阿里巴巴云原生

阿里云 云原生 通义灵码

顺应数字化浪潮,华为云Flexus X实例助力中小企业破局崛起

轶天下事

如何用 CocosCreator 对接抖音小游戏的侧边栏复访

北桥苏

小游戏 小游戏开发 CocosCreator

可观测产品剖析——日志统一管理

嘉为蓝鲸

日志监控 日志管理 日志采集

开发者生产力提升的API终极指南

幂简集成

API

自动化业务状态码设计

三七互娱后端技术团队

效率 自动化 状态码

生成式 AI 时代数据库与大模型的融合探索

编程猫

开启DevOps+AI智能新时代,嘉为蓝鲸智能AI助手CAssist全新上线!

嘉为蓝鲸

DevOps 生成式AI

可观测产品剖析——硬件监控

嘉为蓝鲸

运维 监控 数据监测 数据接入

SpringBoot项目中HTTP请求体只能读一次?试试这方案

小明同学的学长

springboot java

通义灵码代码大模型应用实践访谈

阿里云云效

阿里云 云原生 通义灵码

文旅科技公司:云管高效赋能,加速云上业务蓬勃发展

嘉为蓝鲸

运维 多云管理平台 云管理

论如何利用仿真技术轻松攻克电子产品热流体仿真难题

Altair RapidMiner

设计 汽车 电子产品 仿真 altair

双倍性能、跃级体验!华为云Flexus X实例助力企业轻松上云

轶天下事

充分发挥数字经济赋能效应,Flexus X实例协助企业高效转型

轶天下事

通义灵码代码大模型应用实践访谈

阿里巴巴云原生

阿里云 云原生 通义灵码

GitHub星标4000!清华大牛的CTF竞赛入门指南,真的太香了!

我再BUG界嘎嘎乱杀

黑客 网络安全 信息安全 PWN CTF竞赛

数字化转型正当时!华为云Flexus X实例助力中小企业高效便捷上云

轶天下事

顺应数字化趋势!Flexus X实例助力中小企业开启数字转型“必修课”

轶天下事

ODE网络:一场颠覆RNN的革命即将到来_AI&大模型_William Vorhies_InfoQ精选文章