Uber的合成训练数据将深度学习的速度提升了9倍_AI&大模型_Anthony Alford_InfoQ精选文章



 写点什么

登录/注册

Uber的合成训练数据将深度学习的速度提升了9倍

Uber人工智能实验室开发了一种名为生成式教学网络（GTN）的算法，该算法为神经网络生成合成训练数据，使得神经网络的训练速度比使用真实数据时更快。利用这些合成数据，Uber 将其神经结构搜索（NAS）深度学习优化过程提升了 9 倍。

在 arXiv 上发表的一篇论文中，该团队描述了这个系统和一系列的实验。GTN 的动机来自神经结构搜索（NAS）问题，它训练许多不同的深度学习模型结构，并针对一组测试数据选择表现最好的一个。虽然一种典型的方法是在完整的数据集上通过多次迭代（或 epoch）训练每个模型，但这既耗时又昂贵。不过，模型可以在 GTN 的合成数据上进行训练，耗时更短，并且可以对其在真实训练数据上的真实表现进行估计；这样可以快速地对模型进行评估，缩短了搜索时间。据研究人员称：

GTN-神经结构搜索（GTN-NAS）堪比目前最先进的 NAS 方法，这些方法的表现最好，并且计算量比典型的 NAS 方法少几个数量级。

神经结构搜索是自动机器学习（AutoML）中一个活跃的研究领域。NAS 有一个缺点，它需要训练许多深度学习模型来确定哪个模型表现得最好。该研究主要侧重于高效探索搜索空间，这意味着该系统将训练更少的模型。Uber 的系统生成了一个新数据集，使得每个模型迭代训练的次数更少，这样，系统就可以在相同的时间内试验更多的模型。

通过较少的迭代训练模型存在的问题是，在非常早期的训练阶段，大多数模型的性能都很差，需要多次迭代来确定模型的真实性能。不过，研究表明，并不是所有的训练样本都这样，仔细选择输入样本可以加快训练速度。Uber 的想法是使用元学习来生成训练样本。与生成对抗网络（GAN）类似，Uber 的 GTN 会训练一个生成器神经网络，为学习者网络生成训练样本。学习者根据真实的测试数据进行评估，生成“元损失”，并用元损失的梯度更新生成器。利用这项技术，Uber 创建了一个生成器，生成用于训练计算机视觉（CV）系统识别MNIST数据集中的数字的样本。CV 系统只需 32 个训练步骤就能达到 98.9%的准确率。Uber 表示，在CIFAR10数据集上的一个类似实验中，他们使用合成数据通过 128 步就可以预测模型性能，而使用真实数据需要 1200 步，速度提高了 9 倍。

论文的共同作者 Jeff Clune 在推特上发了一张由该系统生成的合成图像数据的图片，并将其描述为“另类的、不现实的”。他还说：

在神经结构搜索中，GTN 生成的数据完全可以替代真实数据，这样可以极大地加快任何 NAS 算法的速度。到目前为止，我们只展示了随机搜索-NAS（加上一些花哨的功能），但是我们希望看到其他人尝试下其他更高级的 NAS 方法！

原文链接：

Uber’s Synthetic Training Data Speeds Up Deep Learning by 9x

评论

发布

暂无评论

STC89C52+AT24C02实现设备开机次数记录

6 月优质更文活动

BI分析能力：当今企业必备核心竞争力

构建系列之新一代利器Esbuild(下)

前端 cli 构建 #web esbuild

图文结合带你搞懂GreatSQL体系架构

greatsql greatsql社区

HTML5 游戏开发实战｜黑白棋

html html5 6 月优质更文活动

直播系统源码知识分享：解你忧愁！降低直播延迟的实现

山东布谷科技

软件开发源码搭建直播系统源码直播源码

快上车，搭乘HUAWEI HiCar驶向未来

重磅新品全球公测！华为云数据库又有大动作

平平无奇爱好科技

瓴羊Quick BI四度入选魔力象限报告，标志着BI系统的国产化进程加速

对不起该用户已成仙‖

程序员用哪一种IDE写代码比较好？

没有用户名丶

【网络安全】堡垒机对于企业的重要性你知道吗？

云计算运维网络安全堡垒机

Spring Boot配置文件加载顺序详解

2023银川市等级保护测评中心地址在哪里？有几家？

等保等保测评等级测评银川

C++的重载运算符和重载函数

强化学习从基础到进阶--案例与实践[7.1]：深度确定性策略梯度DDPG算法、双延迟深度确定性策略梯度TD3算法详解项目实战

汀丶人工智能

人工智能深度学习强化学习 6 月优质更文活动 DDPG算法

一图讲清楚公众号扫码关注绑定手机号自动登录

越长大越悲伤

微信公众号接入

Redis跳跃表是如何添加元素的？

小小怪下士

Java redis 面试

MaxCompute湖仓一体近实时增量处理技术架构揭秘

阿里云大数据AI技术

sql 大数据分布式计算数据处理企业号 6 月 PK 榜

Intellij IDEA 插件开发 | 京东云技术团队

京东科技开发者

Java IntelliJ IDEA 企业号 6 月 PK 榜插件工程

强化学习从基础到进阶-常见问题和面试必知必答[7]：深度确定性策略梯度DDPG算法、双延迟深度确定性策略梯度TD3算法详解

汀丶人工智能

人工智能深度学习强化学习 6 月优质更文活动 DDPG算法

SQL 优化（二）：避免隐式转换

再见Navicat，dbeaver才是真香

程序员小毕

Java 数据库程序员后端架构师

CSS中常用的颜色格式

CSS css3 前端设计

G1垃圾回收参数调优及MySQL虚引用造成GC时间过长分析 | 京东云技术团队

京东科技开发者

MySQL G1 GC 企业号 6 月 PK 榜

华为云专家出品《从零到一•Python图像处理入门》电子书

Python 华为华为云华为开发者大会2023

强化学习从基础到进阶--案例与实践[7]：深度确定性策略梯度DDPG算法、双延迟深度确定性策略梯度TD3算法详解

汀丶人工智能

人工智能深度学习强化学习 6 月优质更文活动 DDPG算法

大语言模型的开发利器langchain

程序那些事

程序那些事 AIGC ChatGPT 大语言模型

安全专家们看过来，易安联EnSRC第二期众测启动

【直播预告】HarmonyOS极客松赋能直播第三期：一次开发多端部署与ArkTS卡片开发

HarmonyOS开发者

推荐几款可以大幅提高开发效率的vscode插件 | 京东云技术团队

京东科技开发者

Vue 前端 vscode

软件测试/测试开发丨Python内置库学习笔记

Python 软件测试 io 科学计算内置库