硬核干货——《中小企业 AI 实战指南》免费下载! 了解详情
写点什么

AWS DeepComposer – 现已全面开放并增加新的功能

  • 2020-04-05
  • 本文字数:1280 字

    阅读完需:约 4 分钟

AWS DeepComposer – 现已全面开放并增加新的功能

AWS DeepComposer 是一种创新的机器学习入门方法,在 AWS re:Invent 2019 大会上推出了预览版。今天我特别高兴地宣布,DeepComposer 现已向所有 AWS 客户开放并增加了多项新功能。

AWS DeepComposer 基础

如果您还不熟悉 AWS DeepComposer,请参考下面的入门步骤。


  • 登录 AWS DeepComposer 控制台

  • 了解该服务以及它如何使用生成式 AI。

  • 使用控制台中的虚拟键盘或物理键盘(可在 Amazon.com 订购)录制一段短乐音。

  • 选择您喜爱种类的预训练模型。

  • 以您的乐音为基础,使用此模型生成新的复调乐曲。

  • 在控制台中播放乐曲。

  • 导出乐曲或在 SoundCloud 上分享。



现在我们来看新增的功能,借助这些新功能可以更轻松开始使用生成式 AI。


学习胶囊


DeepComposer 采用生成式对抗网络(简称 GAN,参阅研究报告)技术。GAN 是一种专为利用现有数据集生成新样本而构建的神经网络架构。GAN 包含两个相互对抗的不同神经网络,根据样本输入生成原创数字作品:借助 DeepComposer,您可以训练并优化 GAN 模型以创作原创音乐。


在此之前,希望提升 GAN 技能的开发人员并没有轻松的入门方法。为了帮助他们提升,而不论他们的 ML 或音乐背景如何,我们构建了一系列的轻松学习胶囊,介绍了关键的概念以及如何训练和评估 GAN。这包括一个动手实验室,其中包含了构建 GAN 模型的详细分步操作说明和代码。



在您熟悉 GAN 后,您将能够开始训练自己的模型!


控制台中训练


您现在可以在 DeepComposer 控制台中直接训练自己的生成式模型,无需编写任何机器学习代码。


首先选择一个 GAN 架构:


  • MuseGAN(由 Hao-Wen Dong、Wen-Yi Hsiao、Li-Chia Yang 和 Yi-Hsuan Yang 开发,参阅研究报告,见 Github):MuseGAN 专为生成音乐而设计。MuseGAN 中的生成器由一个共享网络和一系列私有网络组成,该共享网络用于学习歌曲的高级别表现,私有网络用于学习如何生成单个音轨。

  • U-Net(由 Olaf Ronneberger、Philipp Fischer 和 Thomas Brox 开发,参阅研究报告,见项目页面):U-Net 在图像转换领域尤其成功(例如将冬季图像转换为夏季图像),也可以用于音乐生成。它的架构比 MuseGAN 更简单,因此更便于初学者理解。如果您想更深入了解,则可以通过此 Jupyter 笔记本进一步了解 U-Net 架构。



假设我们使用 MuseGAN 并给新模型取一个名称。



然后我会选择我要用于训练模型的数据集。



当然我也可以设置超参数(即训练参数),但这次我将使用默认设置。最后,我单击“开始训练”,AWS DeepComposer 将会启动一个训练作业并代我完成所有的基础设施和机器学习设置。



大约 8 小时后,模型训练完成,我可以使用它来生成乐曲。此处我可以添加新推出的“旋律助手”功能,它会帮助纠正输入中的音符定时,并确保音符与节拍保持一致。



**入门


**AWS DeepComposer 现已在美国东部(弗吉尼亚北部)区域开放。


此服务为所有 AWS 客户提供了 12 个月的免费套餐,因此您可以使用我们的示例模型免费生成 500 首乐曲。


除提供免费套餐外,在美国境内通过 Amazon.com 订购键盘并将它关联到 DeepComposer 控制台,还将享受另外 3 个月的免费试用机会!



本文转载自 AWS 技术博客。


原文链接:https://mp.weixin.qq.com/s/GZplCs7Ei8Jzj_TKsueo1A


2020-04-05 08:00840

评论

发布
暂无评论
发现更多内容

HAOMO AI DAY速递:六大闭环、MANA五大模型助力毫末智能驾驶产品快速迭代

科技大数据

如何让你的架构设计应用做到高内聚、低耦合?

风铃架构日知录

Java 程序人生 后端 架构设计 后端开发

OpenTelemetry日志体系

骑牛上青山

Java 日志 log 调用链 OpenTelemetry

Button(按钮)与ImageButton(图像按钮)

芯动大师

Android Studio button imagebutton

三年成功实现7次OTA升级!MANA六大闭环成毫末产品迭代强大助力

科技大数据

选购LED显示屏时需要注意8个技术参数

Dylan

LED显示屏 户外LED显示屏 led显示屏厂家

线上压测

agnostic

多位AI学者、行业大牛、企业家齐聚2023 HAOMO AI DAY分享自动驾驶行业前沿洞见

科技大数据

【Redis技术探索】「数据迁移实战」手把手教你如何实现在线+离线模式进行迁移Redis数据实战指南(在线同步数据)

码界西柚

redis 数据同步 1月日更 数据同步工具 RedisShake

Guitar Pro2024最新免费版吉他打谱软件下载

茶色酒

Guitar Pro Guitar Pro8 guitar pro2023

运维训练营第十一课作业

好吃不贵

8 个很酷的 GitHub 技巧

devpoint

GitHub vscode 开发技巧

《零基础学 Python(2023 版)》学习笔记 Day0

IT蜗壳-Tango

Python编程 IT蜗壳教学

无线配置多一个路由器作为家庭wifi的无线热点?

eng八戒

家庭网络 热点

盘点毫末智行AI DAY:智算中心成立、六大闭环、MANA五大模型...助力毫末智能驾驶产品快速迭代

科技大数据

追求技术极致 探索落地先机 毫末智行城市NOH公布未来产品规划

科技大数据

新能源汽车

元器件温度系数(ppm/℃)是什么?

不脱发的程序猿

元器件温度系数

TSDB助力井下位置服务

CnosDB

数据库 IoT 时序数据库 开源社区 infra

中国自动驾驶行业最大智算中心亮相 毫末顾维灏:毫末车端感知架构实现跨代升级

科技大数据

汽车

毫末智行稳健收官2022“三大战役” 火力全开打响2023“四大战役”

科技大数据

智能汽车

怎么用vscode创建工程

eng八戒

ide vscode koa

用 SwiftUI 实现 AI 聊天对话 app - iChatGPT

37手游iOS技术运营团队

ios SwiftUI openai ChatGPT

使用 App Store Connect API 批量创建内购商品

37手游iOS技术运营团队

AppleParty 苹果派 App Store Connect API 批量创建内购IAP 批量上传 IAP

直播交友一对一视频语音APP项目系统架构和模式分析(成品1对1源码)

山东布谷科技胡月

视频语音直播app开发 语音直播交友系统搭建 社交app开发 1v1语音系统搭建 视频社交APP开发

VSCODE 配置远程调试环境

eng八戒

ide vscode 服务器

尝试阅读理解一份linux shell脚本

eng八戒

bash Shell Linux Kenel 脚本

分享 7 个不错的 AI 工具

devpoint

人工智能 AI openai

MySQL字符集和排序规则详解

C++后台开发

MySQL 数据库 中间件 后端开发 C++开发

社交视频直播一对一交友APP源码之Android如何打包APP

山东布谷科技胡月

语音直播app开发

极客时间运维进阶训练营第十周作业

老曹

2023-01-07:hyper/docker-registry-web是registry的web界面工具之一。请问部署在k3s中,yaml如何写?

福大大架构师每日一题

云原生 k8s k3s 福大大

AWS DeepComposer – 现已全面开放并增加新的功能_语言 & 开发_亚马逊云科技 (Amazon Web Services)_InfoQ精选文章