Alexa的研究论文为神经网络优化提供了最佳解决方案_AI&大模型_Anthony Alford_InfoQ精选文章

速来报名！AICon北京站鸿蒙专场~ 了解详情 



 写点什么

登录/注册

Alexa的研究论文为神经网络优化提供了最佳解决方案

亚马逊的Alexa科研人员发表了一篇论文，为神经网络优化提供了理论基础。虽然该文指出，很难通过计算找到一个完美的解决方案，但它提供了一个公式“近似结构搜索问题（a-ASP）”，可以用遗传算法解决。

在最近的一篇博文中，研究工程师 Adrian de Wynter 把神经网络架构选择问题转换成了函数逼近；在这个公式中，函数是输入数据到输出的“真”映射，而近似是通过训练形成的神经网络模型。网络架构的选择通常基于直觉或反复试验，但是 de Wynter 认为，这种“任意选择的神经架构不太可能提供最佳解决方案”。相反，给定一组神经网络组件，如卷积或最大池化层，自动优化架构搜索将找到这些组件的组合，以最小的误差逼近函数，而 de Wynter 的工作提供了“计算准确性的理论保证”。他证明了一般架构搜索问题（ASP）难以解决——也就是说，它不能保证在多项式时间内运行完。因此，他针对这个问题提出了一个“宽松”的公式“近似 ASP（a-ASP）”，可以在多项式时间内使用共同进化遗传算法解决。

机器学习系统的自动优化是一个活跃的研究领域。许多主要的云平台都提供AutoML系统，并且提供多个开源选项。大多数 AutoML 解决方案都处理 ML 管道的所有部分，包括数据清理、超参数优化和模型选择。相比之下，de Wynter 的研究主要集中在最佳神经网络模型结构的选择上。虽然一些研究人员使用贝叶斯优化等技术解决了这个问题，但 de Wynter 的论文称，遗传算法“在一般环境中比其他算法表现得更好”。

遗传算法是一种基于生物进化概念“适者生存”的优化技术。每个问题的潜在解决方案都有一个适应度评分，表明它解决问题的程度，以及一个遗传表示。其主要思想是，一个解决方案必须以一种允许随机突变以及与其他解决方案交叉的方式表示。遗传算法运行数代，尝试各种解决方案，应用突变，并保持最适合的结果。在 de Wynter 的公式中，遗传算法搜索神经网络组件的组合，如卷积层，那些组件属于一个组件集，其表现就相当于一个图灵机。遗传算法必须找到这些组件的一个序列，该序列生成的网络最好地近似于所需要的输入数据到输出的映射，但受到最大序列长度的限制。

其他研究团队已经应用遗传或进化算法来优化深度学习系统。谷歌去年发布了开源的AdaNet，这是一个基于TensorFlow的框架，用于基于进化的 AutoML。最近，Uber 开源了EvoGrad，这是一个进化算法的PyTorch库，它将种群视为一个抽象的概率分布。根据 Wynter 的说法：

[M]任何研究人员都得出了这样的结论：共同进化算法为构建机器学习系统提供了最佳途径。但本文提出的函数近似框架为他们提供了直觉上更可靠的理论基础。

原文链接：

Alexa Research Paper Shows Genetic Algorithms Offer Best Solution for Neural Network Optimization

评论

发布

暂无评论

想拿到10k-40k的offer，这些技能必不可少！作为程序员的你了解吗？

Java架构师迁哥

四面拿到京东Java岗 30K offer 全过程分享

Java架构师迁哥

2个月从0到1，一年5次迭代，百度“量桨”效率喷涌背后的工作秘诀

你的故事，触动了我的心

读后感读书总结 4月日更皮囊

【go专题】Context的理解

Go 语言 4月日更

150页的剑指Offer解答PDF，它来了！！！

秦怀杂货店

当我看技术文章的时候，我在想什么？

一场关于演讲的演讲

当时尚撞上区块链，为潮酷创意赋予专属

安卓rxjava使用，4面字节跳动拿到Offer，面试必问

欢喜学安卓

android 程序员面试移动开发

如何减少管理层级？

团队建设 28天写作职场经验管理经验 4月日更

【Node专题】Node 与 Go 的认识

后端 Node 4月日更

区块链如何推动数字化转型？

解决方案的设计与积累——课程总结

BUG！从编写 Loader 到窥探大佬 Debug 全过程

小程序 webpack 构建工具

安卓rxjava面试，面试一路绿灯Offer拿到手软，吊打面试官系列！

欢喜学安卓

android 程序员面试移动开发

MBP恢复记(体验rm -rf /*)

翻译：《实用的Python编程》InstructorNotes

Java虚拟机原理

2021|南吕

生活随想 4月日更

图算法系列之深度优先搜索（一）

Java 深度优先搜索图算法

怎么做到的？3个月入职蚂蚁金服（Java岗）从年薪10W到年薪30W

Java架构师迁哥

Redis的常见问题

c++ redis Linux 后端

网络协议学习笔记Day3

穿过生命散发芬芳

网络协议 4月日更

容器 & 服务: 扩容

程序员架构进阶

容器 k8s 28天写作弹性扩容 4月日更

Vue源码思想在工作中的应用

聪明人的训练（二十四）

读《小岛经济学有感》

读书笔记 4月日更

深入理解Spring框架之AOP子框架

aop 动态代理 cglib ProxyConfig AspectJ

比微信文件传输助手更好用的传输工具｜Telegram

微信效率文件传输 4月日更 Telegram

小米java社招面试记录，带备战思路

Java架构师迁哥