写点什么

Uber 的合成训练数据将深度学习的速度提升了 9 倍

  • 2020-02-12
  • 本文字数:1073 字

    阅读完需:约 4 分钟

Uber的合成训练数据将深度学习的速度提升了9倍

Uber人工智能实验室开发了一种名为生成式教学网络(GTN)的算法,该算法为神经网络生成合成训练数据,使得神经网络的训练速度比使用真实数据时更快。利用这些合成数据,Uber 将其神经结构搜索(NAS)深度学习优化过程提升了 9 倍。


在 arXiv 上发表的一篇论文中,该团队描述了这个系统和一系列的实验。GTN 的动机来自神经结构搜索(NAS)问题,它训练许多不同的深度学习模型结构,并针对一组测试数据选择表现最好的一个。虽然一种典型的方法是在完整的数据集上通过多次迭代(或 epoch)训练每个模型,但这既耗时又昂贵。不过,模型可以在 GTN 的合成数据上进行训练,耗时更短,并且可以对其在真实训练数据上的真实表现进行估计;这样可以快速地对模型进行评估,缩短了搜索时间。据研究人员称:


GTN-神经结构搜索(GTN-NAS)堪比目前最先进的 NAS 方法,这些方法的表现最好,并且计算量比典型的 NAS 方法少几个数量级。


神经结构搜索是自动机器学习(AutoML)中一个活跃的研究领域。NAS 有一个缺点,它需要训练许多深度学习模型来确定哪个模型表现得最好。该研究主要侧重于高效探索搜索空间,这意味着该系统将训练更少的模型。Uber 的系统生成了一个新数据集,使得每个模型迭代训练的次数更少,这样,系统就可以在相同的时间内试验更多的模型。


通过较少的迭代训练模型存在的问题是,在非常早期的训练阶段,大多数模型的性能都很差,需要多次迭代来确定模型的真实性能。不过,研究表明,并不是所有的训练样本都这样,仔细选择输入样本可以加快训练速度。Uber 的想法是使用元学习来生成训练样本。与生成对抗网络(GAN)类似,Uber 的 GTN 会训练一个生成器神经网络,为学习者网络生成训练样本。学习者根据真实的测试数据进行评估,生成“元损失”,并用元损失的梯度更新生成器。利用这项技术,Uber 创建了一个生成器,生成用于训练计算机视觉(CV)系统识别MNIST数据集中的数字的样本。CV 系统只需 32 个训练步骤就能达到 98.9%的准确率。Uber 表示,在CIFAR10数据集上的一个类似实验中,他们使用合成数据通过 128 步就可以预测模型性能,而使用真实数据需要 1200 步,速度提高了 9 倍。


论文的共同作者 Jeff Clune 在推特上发了一张由该系统生成的合成图像数据的图片,并将其描述为“另类的、不现实的”。他还说:


在神经结构搜索中,GTN 生成的数据完全可以替代真实数据,这样可以极大地加快任何 NAS 算法的速度。到目前为止,我们只展示了随机搜索-NAS(加上一些花哨的功能),但是我们希望看到其他人尝试下其他更高级的 NAS 方法!


原文链接:


Uber’s Synthetic Training Data Speeds Up Deep Learning by 9x


2020-02-12 09:003388

评论

发布
暂无评论
发现更多内容

2020年程序猿必读10本好书推荐

ABC实验室

学习 2020 程序员 好书推荐

使用JUnit、AssertJ和Mockito编写单元测试和实践TDD (二)为什么要写单元测试

编程道与术

编程 编程语言 TDD 代码审查 单元测试

自助设备系列——上下游

孙苏勇

产品 行业资讯 智能设备

ELK 日志收集简易教程

meng

elasticsearch Logstash Kibana ELK Filebeat

给程序员的错误找个台阶

曲水流觞TechRill

Grafana+Prometheus(InfluxDB)+Jmeter使用Nginx代理搭建可视化性能测试监控平台

软测小生

Grafana Prometheus Influxdb Jmeter 性能测试

有没有什么上古的程序代码至今依然没被更替?

极客时间

编程 程序员 开发

当我们说文本编辑器时,到底在说什么

付济

写作平台 InfoQ markdown

打造个人商业模式第一步

一尘观世界

副业赚钱 提升认知 思维方式 商业模式 认识自己

freecplus框架,Linux平台下C/C++程序员提高开发效率的利器

C语言技术网-码农有道

从全国首起暗网案件告破说起——暗网,超乎你想象

石君

网络安全 暗网 洋葱网络

Kafka系列第5篇:一文读懂消费者背后的那点"猫腻"

z小赵

大数据 kafak 实时计算

VSCode最强助攻

页面仔小杨

编程 vscode

快来体验 JetBrains Space EAP 版本

刘培培

DevOps JetBrains Space

告别手写,一键生成 Helm Chart README

郭旭东

Kubernetes Helm

NumPy 运算规则总结

张利东

Python

听保洁老大爷讲Java的垃圾回收

侯树成

JVM

Flutter Andorid真机或打包APK杂症记录

北风烈

flutter 打包APK

嵌套文件夹复制实现

Howe

Java 文件复制

5G来临,我们该如何打造自己的家庭数据中心基础篇

ABC实验室

5G 数字资产 家庭数据中心

我在极客时间学习的三个月

石乐

我的编程之路-2(首秀)

顿晓

方法 沟通 新项目

游戏开发通用技术和工具

波波

编程 游戏开发 H5游戏

C语言数据类型

C语言技术网-码农有道

docker安装mysql5.7并挂载目录到本地

桥哥技术之路

Docker

我的工作原则与思考

梁帅

互联网 工作效率 原则

C语言程序的基本结构

C语言技术网-码农有道

C/C++

高仿瑞幸小程序 03 创建轮播图

曾伟@喵先森

小程序 微信小程序 大前端 移动

分析Kubernetes技术体系的层级,慎用比较前沿的技术

韩超

面对压力的战略和战术

山楂大卷

管理 精神力 逻辑思维 压力 工作思路

最新Idea 2020.1 二种方法激活教程

公众号:V5codings

intellij-idea

Uber的合成训练数据将深度学习的速度提升了9倍_AI&大模型_Anthony Alford_InfoQ精选文章