写点什么

AWS DeepComposer – 现已全面开放并增加新的功能

  • 2020-04-05
  • 本文字数:1280 字

    阅读完需:约 4 分钟

AWS DeepComposer – 现已全面开放并增加新的功能

AWS DeepComposer 是一种创新的机器学习入门方法,在 AWS re:Invent 2019 大会上推出了预览版。今天我特别高兴地宣布,DeepComposer 现已向所有 AWS 客户开放并增加了多项新功能。

AWS DeepComposer 基础

如果您还不熟悉 AWS DeepComposer,请参考下面的入门步骤。


  • 登录 AWS DeepComposer 控制台

  • 了解该服务以及它如何使用生成式 AI。

  • 使用控制台中的虚拟键盘或物理键盘(可在 Amazon.com 订购)录制一段短乐音。

  • 选择您喜爱种类的预训练模型。

  • 以您的乐音为基础,使用此模型生成新的复调乐曲。

  • 在控制台中播放乐曲。

  • 导出乐曲或在 SoundCloud 上分享。



现在我们来看新增的功能,借助这些新功能可以更轻松开始使用生成式 AI。


学习胶囊


DeepComposer 采用生成式对抗网络(简称 GAN,参阅研究报告)技术。GAN 是一种专为利用现有数据集生成新样本而构建的神经网络架构。GAN 包含两个相互对抗的不同神经网络,根据样本输入生成原创数字作品:借助 DeepComposer,您可以训练并优化 GAN 模型以创作原创音乐。


在此之前,希望提升 GAN 技能的开发人员并没有轻松的入门方法。为了帮助他们提升,而不论他们的 ML 或音乐背景如何,我们构建了一系列的轻松学习胶囊,介绍了关键的概念以及如何训练和评估 GAN。这包括一个动手实验室,其中包含了构建 GAN 模型的详细分步操作说明和代码。



在您熟悉 GAN 后,您将能够开始训练自己的模型!


控制台中训练


您现在可以在 DeepComposer 控制台中直接训练自己的生成式模型,无需编写任何机器学习代码。


首先选择一个 GAN 架构:


  • MuseGAN(由 Hao-Wen Dong、Wen-Yi Hsiao、Li-Chia Yang 和 Yi-Hsuan Yang 开发,参阅研究报告,见 Github):MuseGAN 专为生成音乐而设计。MuseGAN 中的生成器由一个共享网络和一系列私有网络组成,该共享网络用于学习歌曲的高级别表现,私有网络用于学习如何生成单个音轨。

  • U-Net(由 Olaf Ronneberger、Philipp Fischer 和 Thomas Brox 开发,参阅研究报告,见项目页面):U-Net 在图像转换领域尤其成功(例如将冬季图像转换为夏季图像),也可以用于音乐生成。它的架构比 MuseGAN 更简单,因此更便于初学者理解。如果您想更深入了解,则可以通过此 Jupyter 笔记本进一步了解 U-Net 架构。



假设我们使用 MuseGAN 并给新模型取一个名称。



然后我会选择我要用于训练模型的数据集。



当然我也可以设置超参数(即训练参数),但这次我将使用默认设置。最后,我单击“开始训练”,AWS DeepComposer 将会启动一个训练作业并代我完成所有的基础设施和机器学习设置。



大约 8 小时后,模型训练完成,我可以使用它来生成乐曲。此处我可以添加新推出的“旋律助手”功能,它会帮助纠正输入中的音符定时,并确保音符与节拍保持一致。



**入门


**AWS DeepComposer 现已在美国东部(弗吉尼亚北部)区域开放。


此服务为所有 AWS 客户提供了 12 个月的免费套餐,因此您可以使用我们的示例模型免费生成 500 首乐曲。


除提供免费套餐外,在美国境内通过 Amazon.com 订购键盘并将它关联到 DeepComposer 控制台,还将享受另外 3 个月的免费试用机会!



本文转载自 AWS 技术博客。


原文链接:https://mp.weixin.qq.com/s/GZplCs7Ei8Jzj_TKsueo1A


2020-04-05 08:00862

评论

发布
暂无评论
发现更多内容

遵循 CI/CD 最佳实践,让高效贯彻整个团队

极狐GitLab

DevOps 自动化 持续集成 CI/CD 持续交付

中企出海之宝岛台湾假勤管理

用友BIP

中企出海

当AI大模型遇见金融,这四大挑战不容忽视

索信达控股

视频与图片检索中的多模态语义匹配模型 ——原理、启示、应用与展望

百度Geek说

企业号 6 月 PK 榜 模态 视频模拟 图片模拟 6 月 优质更文活动

云计算架构设计原则

穿过生命散发芬芳

6 月 优质更文活动

六大类型JavaScript题型

不叫猫先生

JavaScript 6 月 优质更文活动

阿里云斩获 4 项年度云原生技术服务优秀案例

阿里巴巴云原生

阿里云 云原生

人体分割识别图像技术的原理及应用

数据堂

人体分割识别图像技术的挑战和未来发展

数据堂

互联网行业-镭速文件传输系统方案

镭速

2023-06-15:说一说Redis的Key和Value的数据结构组织?

福大大架构师每日一题

redis 福大大架构师每日一题

UI自动化的稳定性和效率

QE_LAB

自动化测试 UI自动化测试 appium

基于Spark的大规模日志分析

华为云开发者联盟

开发 华为云 华为云开发者联盟 企业号 6 月 PK 榜

GOTC峰会Sermant发布1.1.0-beta版本,带来哪些提升?

华为云开源

#云原生 #开源 流量治理 #微服务

HarmonyOS 极客马拉松2023 正式启动,诚邀极客们用键盘码出无限可能!

说山水

解析Spring内置作用域及其在实践中的应用

华为云开发者联盟

开发 华为云 华为云开发者联盟 企业号 6 月 PK 榜

把数字中国,建立在行业感知的底座上

脑极体

行业感知

Django笔记四十三之使用uWSGI部署Django系统

Hunter熊

Python django 部署 uwsgi

开战在即!与全球伙伴一起打造你的数据应用,TiDB Future App Hackathon 2023 来啦!

PingCAP

数据库 hackathon TiDB

你一定要悄悄学会怎么把Vimeo视频保存到手机相册,然后惊艳所有人!

frank

TrafficRoute:一体化的DNS解析和流量调度套件

火山引擎边缘云

技术 流量 解析 火山引擎边缘云

WeOpsV4.1重磅出击,日志监控功能横空出世!

嘉为蓝鲸

运维 日志 weops 嘉为蓝鲸

全球化财务助力跨国业务的稳定增长和持续发展

用友BIP

百度文心一格x京东618:打造电商行业首个AI线下广告,节省80%制作成本

飞桨PaddlePaddle

百度 飞桨 AIGC 京东618

C语言代码封装MQTT协议报文,了解MQTT协议通信过程

DS小龙哥

6 月 优质更文活动

洞察开源代码平台“创新力”|2023开放原子全球开源峰会开源协作平台分论坛成功举办

开放原子开源基金会

开源 开放原子全球开源峰会 开放原子 开源协作平台

云小课|RDS for MySQL参数模板一键导入导出,参数配置轻松搞定

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 企业号 6 月 PK 榜

C语言编程语法—排序算法

芯动大师

C语言 排序算法 6 月 优质更文活动

微软增加100亿美元AI收入,Salesforce如何对垒?

B Impact

华为云CodeArtBuild减负!云端编译构建,让你的开发省时省力!

云计算 代码 华为云 编译构建

Spring框架中的线程池

demo123567

spring 线程池

AWS DeepComposer – 现已全面开放并增加新的功能_语言 & 开发_亚马逊云科技 (Amazon Web Services)_InfoQ精选文章