写点什么

Uber 的合成训练数据将深度学习的速度提升了 9 倍

  • 2020-02-12
  • 本文字数:1073 字

    阅读完需:约 4 分钟

Uber的合成训练数据将深度学习的速度提升了9倍

Uber人工智能实验室开发了一种名为生成式教学网络(GTN)的算法,该算法为神经网络生成合成训练数据,使得神经网络的训练速度比使用真实数据时更快。利用这些合成数据,Uber 将其神经结构搜索(NAS)深度学习优化过程提升了 9 倍。


在 arXiv 上发表的一篇论文中,该团队描述了这个系统和一系列的实验。GTN 的动机来自神经结构搜索(NAS)问题,它训练许多不同的深度学习模型结构,并针对一组测试数据选择表现最好的一个。虽然一种典型的方法是在完整的数据集上通过多次迭代(或 epoch)训练每个模型,但这既耗时又昂贵。不过,模型可以在 GTN 的合成数据上进行训练,耗时更短,并且可以对其在真实训练数据上的真实表现进行估计;这样可以快速地对模型进行评估,缩短了搜索时间。据研究人员称:


GTN-神经结构搜索(GTN-NAS)堪比目前最先进的 NAS 方法,这些方法的表现最好,并且计算量比典型的 NAS 方法少几个数量级。


神经结构搜索是自动机器学习(AutoML)中一个活跃的研究领域。NAS 有一个缺点,它需要训练许多深度学习模型来确定哪个模型表现得最好。该研究主要侧重于高效探索搜索空间,这意味着该系统将训练更少的模型。Uber 的系统生成了一个新数据集,使得每个模型迭代训练的次数更少,这样,系统就可以在相同的时间内试验更多的模型。


通过较少的迭代训练模型存在的问题是,在非常早期的训练阶段,大多数模型的性能都很差,需要多次迭代来确定模型的真实性能。不过,研究表明,并不是所有的训练样本都这样,仔细选择输入样本可以加快训练速度。Uber 的想法是使用元学习来生成训练样本。与生成对抗网络(GAN)类似,Uber 的 GTN 会训练一个生成器神经网络,为学习者网络生成训练样本。学习者根据真实的测试数据进行评估,生成“元损失”,并用元损失的梯度更新生成器。利用这项技术,Uber 创建了一个生成器,生成用于训练计算机视觉(CV)系统识别MNIST数据集中的数字的样本。CV 系统只需 32 个训练步骤就能达到 98.9%的准确率。Uber 表示,在CIFAR10数据集上的一个类似实验中,他们使用合成数据通过 128 步就可以预测模型性能,而使用真实数据需要 1200 步,速度提高了 9 倍。


论文的共同作者 Jeff Clune 在推特上发了一张由该系统生成的合成图像数据的图片,并将其描述为“另类的、不现实的”。他还说:


在神经结构搜索中,GTN 生成的数据完全可以替代真实数据,这样可以极大地加快任何 NAS 算法的速度。到目前为止,我们只展示了随机搜索-NAS(加上一些花哨的功能),但是我们希望看到其他人尝试下其他更高级的 NAS 方法!


原文链接:


Uber’s Synthetic Training Data Speeds Up Deep Learning by 9x


2020-02-12 09:003236

评论

发布
暂无评论
发现更多内容

Tuxera NTFS 2021 for Mac(NTFS磁盘格式读写工具)v2021.1中文版

Mac相关知识分享

磁盘格式读写软件

CAD迷你看图 for Mac(强大的cad看图软件)v4.4.5版

Mac相关知识分享

CAD看图、

WiFi6 IPQ6010 vs WiFi7 IPQ5332: Should upgrade? Performance, cost and future outlook

wifi6-yiyi

wifi IPQ6010

AnyToISO Pro for Mac(专业级ISO镜像文件制作工具)v3.9.6版

Mac相关知识分享

Mac软件 镜像文件制作工具

制造业包括哪些?需要堡垒机吗?

行云管家

网络安全 信息安全 堡垒机 制造业

惊艳!老司机熬夜总结的Python高性能编程,高效、稳定、快速!

我再BUG界嘎嘎乱杀

Python 后端 高性能 开发语言

阿里云弹性容器实例(ECI):无服务器容器解决方案深度解析

Geek_2d6073

完美解决 WebSocket 连接失败的技巧

Liam

程序员 后端 websocket

GitHub星标破千Star!Python游戏编程的初学者指南

我再BUG界嘎嘎乱杀

Python 入门 开发语言 零基础 游戏编程

NineData和华为云在一起!

NineData

数据库 DevOps 华为云 NineData GuassDB

C++面向对象

EquatorCoco

Java c++ 开发语言

软件测试学习笔记丨JUnit5标记测试用例

测试人

软件测试 测试开发

AR | 我们从技术说起

AR玩家

AR Rokid Vision pro 炬目AR 炬目科技

如何选择适合您需求的 CDN 服务商

Geek_2d6073

Aiseesoft Mac FoneTrans for Mac(iOS文件传输和管理器软件)

Mac相关知识分享

Mac软件 设备管理软件

2024 Intersolar Europe,这家中国能源新秀再次瞩目!

科技汇

交互式原型设计神器:Axure RP 9 for Mac/win版中文激活版

你的猪会飞吗

mac软件下载 苹果软件下载

软件测试学习笔记丨JUnit5重复测试

测试人

软件测试

python中对于wordcloud词云生成报错提示的解决

我再BUG界嘎嘎乱杀

Python wordcloud 词云

基于Vue+thinkPhP6前后端分离的多客陪玩管理系统100%原生源码/技术培训/运维协助/开发文档齐全/官方终身授权/全球搭建部署/支持二次开发

DUOKE七七

ScreenFocus for mac(mac多屏工作专注效率工具)v1.1.1(26)版

Mac相关知识分享

Mac软件 Mac办公软件

BetterDisplay Pro Mac(显示器管理工具)v2.0.11版

Mac相关知识分享

Mac软件 mac下载

突破Web3红海,DePIN如何构建创新生态系统?

TechubNews

web3、

在 Go 语言中如何让结构体不可比较?

伤感汤姆布利柏

ThreadLocal 源码浅析

快乐非自愿限量之名

Java 数据结构 ThreadLocal

解读MySQL 8.0数据字典的初始化与启动

不在线第一只蜗牛

MySQL 数据字典

PTGui Pro for Mac(全景图拼接制作工具)v10.0.11版

Mac相关知识分享

Mac软件

深度解析:利用1688 API获取商品详情的全面指南

Noah

AI Agent 开发者对话:科研和商业化落地

奇绩创坛

人工智能 创业 AI 大模型 agent

GPT-4o差点没及格!首个多任务长视频评测基准,它有亿点难

Openlab_cosmoplat

ChatGPT GPT-4 人工智能、

Uber的合成训练数据将深度学习的速度提升了9倍_AI&大模型_Anthony Alford_InfoQ精选文章