生成式AI领域的最新成果都在这里!抢 QCon 展区门票 了解详情
写点什么

Alexa 的研究论文为神经网络优化提供了最佳解决方案

  • 2019-12-01
  • 本文字数:1103 字

    阅读完需:约 4 分钟

Alexa的研究论文为神经网络优化提供了最佳解决方案

亚马逊的Alexa科研人员发表了一篇论文,为神经网络优化提供了理论基础。虽然该文指出,很难通过计算找到一个完美的解决方案,但它提供了一个公式“近似结构搜索问题(a-ASP)”,可以用遗传算法解决。


在最近的一篇博文中,研究工程师 Adrian de Wynter 把神经网络架构选择问题转换成了函数逼近;在这个公式中,函数是输入数据到输出的“真”映射,而近似是通过训练形成的神经网络模型。网络架构的选择通常基于直觉或反复试验,但是 de Wynter 认为,这种“任意选择的神经架构不太可能提供最佳解决方案”。相反,给定一组神经网络组件,如卷积最大池化层,自动优化架构搜索将找到这些组件的组合,以最小的误差逼近函数,而 de Wynter 的工作提供了“计算准确性的理论保证”。他证明了一般架构搜索问题(ASP)难以解决——也就是说,它不能保证在多项式时间内运行完。因此,他针对这个问题提出了一个“宽松”的公式“近似 ASP(a-ASP)”,可以在多项式时间内使用共同进化遗传算法解决。


机器学习系统的自动优化是一个活跃的研究领域。许多主要的云平台都提供AutoML系统,并且提供多个开源选项。大多数 AutoML 解决方案都处理 ML 管道的所有部分,包括数据清理、超参数优化和模型选择。相比之下,de Wynter 的研究主要集中在最佳神经网络模型结构的选择上。虽然一些研究人员使用贝叶斯优化等技术解决了这个问题,但 de Wynter 的论文称,遗传算法“在一般环境中比其他算法表现得更好”。


遗传算法是一种基于生物进化概念“适者生存”的优化技术。每个问题的潜在解决方案都有一个适应度评分,表明它解决问题的程度,以及一个遗传表示。其主要思想是,一个解决方案必须以一种允许随机突变以及与其他解决方案交叉的方式表示。遗传算法运行数代,尝试各种解决方案,应用突变,并保持最适合的结果。在 de Wynter 的公式中,遗传算法搜索神经网络组件的组合,如卷积层,那些组件属于一个组件集,其表现就相当于一个图灵机。遗传算法必须找到这些组件的一个序列,该序列生成的网络最好地近似于所需要的输入数据到输出的映射,但受到最大序列长度的限制。


其他研究团队已经应用遗传或进化算法来优化深度学习系统。谷歌去年发布了开源的AdaNet,这是一个基于TensorFlow的框架,用于基于进化的 AutoML。最近,Uber 开源了EvoGrad,这是一个进化算法的PyTorch库,它将种群视为一个抽象的概率分布。根据 Wynter 的说法:


[M]任何研究人员都得出了这样的结论:共同进化算法为构建机器学习系统提供了最佳途径。但本文提出的函数近似框架为他们提供了直觉上更可靠的理论基础。


原文链接


Alexa Research Paper Shows Genetic Algorithms Offer Best Solution for Neural Network Optimization


公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2019-12-01 08:001574

评论

发布
暂无评论
发现更多内容

阿里首本凤凰架构竟要付费,构建大型分布式系统的指南这么宝贵吗

Java~~~

Java 架构 面试 分布式 高并发

了,来了!Nacos 2.0的Spring Boot Starter终于来了

Summer

Java 学习 程序员 架构 springboot

在线IP地址查询工具

入门小站

工具

出自清华大神之手的JVM实战手册,刚上架GitHub点赞就达到85k

Java~~~

Java 架构 面试 JVM 多线程

JDK从8升级到11,使用 G1 GC,HBase性能下降20%。JDK 到底干了什么

Summer

Java 学习 程序员 架构 jdk

红黑树的理解与 Java 实现

编程菌

Java 编程 程序员 计算机 技术宅

低耦合、高内聚?

escray

学习 极客时间 如何落地业务建模 8月日更

Django QuerySet 就学那么一点点,一点点就够了

梦想橡皮擦

8月日更

终于有人把操作系统、网络系统、线程进程、IO模型全部总结出来了

Java~~~

Java 架构 面试 TCP 网络

你的孩子爱读书吗

箭上有毒

8月日更

聊聊Java数据类型的那些事

Bob

Java 后端 8月日更

QDS06 Iperf 测网速

耳东@Erdong

8月日更 qds iperf

前端之算法(三)归并排序

Augus

数据结构与算法 8月日更

Web框架Gin | Gin 路由

xcbeyond

Go 语言 路由 gin 8月日更

让GitHub炸锅的深入理解MySQL实战手册,竟出自阿里云“藏经阁”

Java~~~

Java MySQL 数据库 架构 面试

GitHub上火了这份堪称神级的SpringBoot手册,竟出自滴滴之手

Java~~~

Java 架构 面试 微服务 Spring Boot

爆赞!GitHub上首本IntelliJ IDEA操作手册,标星果然百万名不虚传

Java~~~

Java 架构 面试 IDEA 架构师

【前端 · 面试 】JavaScript 之你不一定会的基础题(二)

编程三昧

JavaScript 面试 大前端 事件 8月日更

面向用户的产品进度汇报会

boshi

项目管理 客户

网络攻防学习笔记 Day104

穿过生命散发芬芳

态势感知 网络攻防 8月日更

腾讯三面落马+拒网易、CVTE后,字节四面成功拿下offer

编程菌

Java 编程 程序员 面试 计算机

SQL的执行计划-->explain

卢卡多多

sql 8月日更

与外部系统的读写交互(八)

数据与智能

flink kafka Cassandra

使用Golang上传文件到MinIO对象存储(一)

liuzhen007

8月日更

Linux之telnet命令

入门小站

Linux

飞书 + Lua 实现企业级组织架构登录认证

K8sCat

lua openresty 网关 飞书 组织架构

架构实战营毕业总结

9527

#架构实战营

腾讯三面:哨兵挂了,Redis还能正常工作吗?

Summer

Java redis 学习 程序员 架构

在科技圈流行的冥想,为什么没有全民推广?

脑极体

ReentrantLock 中的 4 个坑!

王磊

Java 并发 lock 8月日更

360搜索宣布下线“明星人气排行榜”:饭圈文化不是洪水猛兽

石头IT视角

Alexa的研究论文为神经网络优化提供了最佳解决方案_AI&大模型_Anthony Alford_InfoQ精选文章