NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

Alexa 的研究论文为神经网络优化提供了最佳解决方案

  • 2019-12-01
  • 本文字数:1103 字

    阅读完需:约 4 分钟

Alexa的研究论文为神经网络优化提供了最佳解决方案

亚马逊的Alexa科研人员发表了一篇论文,为神经网络优化提供了理论基础。虽然该文指出,很难通过计算找到一个完美的解决方案,但它提供了一个公式“近似结构搜索问题(a-ASP)”,可以用遗传算法解决。


在最近的一篇博文中,研究工程师 Adrian de Wynter 把神经网络架构选择问题转换成了函数逼近;在这个公式中,函数是输入数据到输出的“真”映射,而近似是通过训练形成的神经网络模型。网络架构的选择通常基于直觉或反复试验,但是 de Wynter 认为,这种“任意选择的神经架构不太可能提供最佳解决方案”。相反,给定一组神经网络组件,如卷积最大池化层,自动优化架构搜索将找到这些组件的组合,以最小的误差逼近函数,而 de Wynter 的工作提供了“计算准确性的理论保证”。他证明了一般架构搜索问题(ASP)难以解决——也就是说,它不能保证在多项式时间内运行完。因此,他针对这个问题提出了一个“宽松”的公式“近似 ASP(a-ASP)”,可以在多项式时间内使用共同进化遗传算法解决。


机器学习系统的自动优化是一个活跃的研究领域。许多主要的云平台都提供AutoML系统,并且提供多个开源选项。大多数 AutoML 解决方案都处理 ML 管道的所有部分,包括数据清理、超参数优化和模型选择。相比之下,de Wynter 的研究主要集中在最佳神经网络模型结构的选择上。虽然一些研究人员使用贝叶斯优化等技术解决了这个问题,但 de Wynter 的论文称,遗传算法“在一般环境中比其他算法表现得更好”。


遗传算法是一种基于生物进化概念“适者生存”的优化技术。每个问题的潜在解决方案都有一个适应度评分,表明它解决问题的程度,以及一个遗传表示。其主要思想是,一个解决方案必须以一种允许随机突变以及与其他解决方案交叉的方式表示。遗传算法运行数代,尝试各种解决方案,应用突变,并保持最适合的结果。在 de Wynter 的公式中,遗传算法搜索神经网络组件的组合,如卷积层,那些组件属于一个组件集,其表现就相当于一个图灵机。遗传算法必须找到这些组件的一个序列,该序列生成的网络最好地近似于所需要的输入数据到输出的映射,但受到最大序列长度的限制。


其他研究团队已经应用遗传或进化算法来优化深度学习系统。谷歌去年发布了开源的AdaNet,这是一个基于TensorFlow的框架,用于基于进化的 AutoML。最近,Uber 开源了EvoGrad,这是一个进化算法的PyTorch库,它将种群视为一个抽象的概率分布。根据 Wynter 的说法:


[M]任何研究人员都得出了这样的结论:共同进化算法为构建机器学习系统提供了最佳途径。但本文提出的函数近似框架为他们提供了直觉上更可靠的理论基础。


原文链接


Alexa Research Paper Shows Genetic Algorithms Offer Best Solution for Neural Network Optimization


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2019-12-01 08:001578

评论

发布
暂无评论
发现更多内容

Arthas-技术专题-使用指南

洛神灬殇

Arthas 5月日更

Golang 工作区和 GOPATH

escray

学习 极客时间 Go 语言 5月日更

cri-o 技术探秘2

xumc

找Matlab代码,看这一篇就够了

攻城先森

matlab 工具分享 5月日更

「学习笔记」《02 | 第一个程序:教你输出彩色的文字》之二

Nydia

学习

kotlin基础

ES_her0

5月日更

鬼知道发生了什么?痛述阿里Java岗5轮技术面经历,险幸上岸

Java 编程 程序员 架构 面试

OLAP计算引擎怎么选?

数据社

大数据 OLAP 5月日更

算法训练营 - 学习笔记 - 第六周

心在飞

零基础学习 NLP-DAY3

Qien Z.

动态规划 nlp 5月日更

百度助力智慧丽江“数智”管理 丽江城市大脑正式上线

百度大脑

百度 大脑 丽江

深入浅出c++协程丨C++协程实现

Linux服务器开发

c++ 后端 协程 Linux服务器开发 协程原理

无常中的僵硬与柔软

zhoo299

随笔杂谈 教育 生命 5月日更

不忘过去,不畏将来

小天同学

5月日更 汶川地震 不忘过去

精选面试题教你应对高级iOS开发面试官(提供底层进阶规划蓝图)

程序员 移动开发 ios开发

VMWare中Ubuntu网络配置

进击的梦清

Linux 运维 vmware 网络配置

最近又有出什么新电影,要不要停泊片刻,与好友相约一起来去看呢?

叶小鍵

如何让消息队列达到最大吞吐量?

万俊峰Kevin

微服务 消息队列 Queue Go 语言

鸿蒙系统之Codelab布局组件尝鲜

liuzhen007

华为 鸿蒙 5月日更

追寻软件定义的梦想汽车

车骑

自动驾驶 智能汽车 软件定义汽车 汽车制造

Python自动打印文件

IT蜗壳-Tango

IT蜗壳教学 5月日更

作为最好用的可观测平台,如何监控 Grafana

耳东@Erdong

Grafana Prometheus 5月日更

怎样做好服务提供方

程序员架构进阶

架构设计原则 服务化 28天写作 5月日更

一文带你读懂PyQt:用Python做出与C++一样的GUI界面应用程序

老猿Python

乡村的振兴之始,5G的均衡之道

脑极体

Python 包管理

若尘

Package Python编程 5月日更

网络攻防学习笔记 Day12

穿过生命散发芬芳

5月日更 网络攻防

xSocket框架接入需实现的接口

风翱

xSocket 5月日更

架构概述之架构演化、模式与核心要素

xcbeyond

架构 架构演进 5月日更

Dubbo 本地调用

青年IT男

dubbo

ThreadLocal不好用?那是你没用对!

王磊

Java 后端 多线程 ThreadLocal 5月日更

Alexa的研究论文为神经网络优化提供了最佳解决方案_AI&大模型_Anthony Alford_InfoQ精选文章