【ArchSummit】如何通过AIOps推动可量化的业务价值增长和效率提升?>>> 了解详情
写点什么

Alexa 的研究论文为神经网络优化提供了最佳解决方案

  • 2019-12-01
  • 本文字数:1103 字

    阅读完需:约 4 分钟

Alexa的研究论文为神经网络优化提供了最佳解决方案

亚马逊的Alexa科研人员发表了一篇论文,为神经网络优化提供了理论基础。虽然该文指出,很难通过计算找到一个完美的解决方案,但它提供了一个公式“近似结构搜索问题(a-ASP)”,可以用遗传算法解决。


在最近的一篇博文中,研究工程师 Adrian de Wynter 把神经网络架构选择问题转换成了函数逼近;在这个公式中,函数是输入数据到输出的“真”映射,而近似是通过训练形成的神经网络模型。网络架构的选择通常基于直觉或反复试验,但是 de Wynter 认为,这种“任意选择的神经架构不太可能提供最佳解决方案”。相反,给定一组神经网络组件,如卷积最大池化层,自动优化架构搜索将找到这些组件的组合,以最小的误差逼近函数,而 de Wynter 的工作提供了“计算准确性的理论保证”。他证明了一般架构搜索问题(ASP)难以解决——也就是说,它不能保证在多项式时间内运行完。因此,他针对这个问题提出了一个“宽松”的公式“近似 ASP(a-ASP)”,可以在多项式时间内使用共同进化遗传算法解决。


机器学习系统的自动优化是一个活跃的研究领域。许多主要的云平台都提供AutoML系统,并且提供多个开源选项。大多数 AutoML 解决方案都处理 ML 管道的所有部分,包括数据清理、超参数优化和模型选择。相比之下,de Wynter 的研究主要集中在最佳神经网络模型结构的选择上。虽然一些研究人员使用贝叶斯优化等技术解决了这个问题,但 de Wynter 的论文称,遗传算法“在一般环境中比其他算法表现得更好”。


遗传算法是一种基于生物进化概念“适者生存”的优化技术。每个问题的潜在解决方案都有一个适应度评分,表明它解决问题的程度,以及一个遗传表示。其主要思想是,一个解决方案必须以一种允许随机突变以及与其他解决方案交叉的方式表示。遗传算法运行数代,尝试各种解决方案,应用突变,并保持最适合的结果。在 de Wynter 的公式中,遗传算法搜索神经网络组件的组合,如卷积层,那些组件属于一个组件集,其表现就相当于一个图灵机。遗传算法必须找到这些组件的一个序列,该序列生成的网络最好地近似于所需要的输入数据到输出的映射,但受到最大序列长度的限制。


其他研究团队已经应用遗传或进化算法来优化深度学习系统。谷歌去年发布了开源的AdaNet,这是一个基于TensorFlow的框架,用于基于进化的 AutoML。最近,Uber 开源了EvoGrad,这是一个进化算法的PyTorch库,它将种群视为一个抽象的概率分布。根据 Wynter 的说法:


[M]任何研究人员都得出了这样的结论:共同进化算法为构建机器学习系统提供了最佳途径。但本文提出的函数近似框架为他们提供了直觉上更可靠的理论基础。


原文链接


Alexa Research Paper Shows Genetic Algorithms Offer Best Solution for Neural Network Optimization


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2019-12-01 08:001580

评论

发布
暂无评论
发现更多内容

Java 生成解析二维码

喜瑞斯

Kubernetes config多集群管理工具

雪雷

k8s kubecm k8s多集群管理 kubeconfig

K8s事件监控之kube-eventer

雪雷

k8s事件告警 k8s资源监控 k8s管理

区块链最激动人心的未来是什么

CECBC

大数据 区块链技术

曾经每个手机上都有的游戏,作为前端如今你也能开发出来了,附教程

web前端程序猿

html5 大前端

GitOps工具Argo CD实战

雪雷

DevOps CI/CD gitops argo cd

必看的数据库使用规范

Simon

MySQL 技术规范

如何优雅的备份账号相关信息

Simon

MySQL

mPaas-RPC拦截器各种场景下的使用指南

阿里云金融线TAM SRE专家服务团队

RPC

等级三整理之深信服

Lane

小小的代码分支模型如何撬动研发过程管理

陈晨

Go: 使用pprof收集样本数据

陈思敏捷

pprof Go 语言

K8s可视化监控之-Weave Scope

雪雷

k8s k8s可视化 k8s监控

支付宝蜻蜓刷脸支付

诸葛小猿

支付宝 蜻蜓 刷脸支付

Kubernetes-学习必备(awesome-kubernetes-notes)

雪雷

学习 k8s入门 k8s文档 k8s知识

MySQL5.7应当注意的参数

Simon

MySQL 参数

极客公园张鹏对话百度CTO王海峰,揭秘中国AI的今昔与前路

脑极体

Gitlab CI之单元测试和代码扫描

雪雷

单元测试 CI/CD gitlab ci 代码扫描

Istio微服务治理笔记(一)

雪雷

istio 服务治理 server mesh

玩K8S不得不会的HELM

雪雷

k8s Helm

赋能云端管理 激发智能边缘 英特尔发布超能云终端解决方案

最新动态

区块链加未来3至5年可以预见 上链将成为常态

CECBC

区块链 金融 数字时代

一.操作系统概述

Winter

操作系统

微服务链路追踪之Jaeger

雪雷

全链路监控 Jaeger

XSKY新一代分布式文件系统XGFS揭秘——元数据服务

XSKY星辰天合

构建统一监管制度 加快数据要素立法修法

CECBC

区块链 金融 区块链数字经济

Gitlab CI进阶之共享CI库

雪雷

DevOps gitlab CI/CD gitlab ci

Prometheus + Grafana详解

雪雷

监控 Grafana Prometheus 告警

Git 常用命令总结

迷羊

git

大数据技术思想入门(一):分布式存储特点

cristal

Java 大数据 hadoop 分布式

搜狗联合清华天工研究院推出ChoreoNet模型:让数字人随着音乐翩翩起舞

脑极体

Alexa的研究论文为神经网络优化提供了最佳解决方案_AI&大模型_Anthony Alford_InfoQ精选文章