【AICon】AI 基础设施、LLM运维、大模型训练与推理,一场会议,全方位涵盖! >>> 了解详情
写点什么

OpenAI 又搞新动作!新型神经网络模型 MuseNet 让所有人都能玩转音乐

  • 2019-04-27
  • 本文字数:1918 字

    阅读完需:约 6 分钟

OpenAI又搞新动作!新型神经网络模型MuseNet让所有人都能玩转音乐

今日,OpenAI——由诸多硅谷大亨联合建立的非营利性人工智能研究组织——对外发布了一款新型深度神经网络模型 MuseNet,该模型不但可调用 10 种不同乐器生成时长约 4 分钟的音乐作品,而且能够融合从乡村到莫扎特再到披头士等各种音乐风格。


据悉,MuseNet 并非基于我们对音乐的理解进行编曲,而是通过学习预测数十万 MIDI 文件中下一个音符,来找到和声、节奏和曲风的模式。与 GPT-2 相似,MuseNet 同样采用多功能无监督技术。GPT-2 是一种大规模 transformer 模型,经过训练即可预测音频以及文本序列中的下一个音符。

邀你试玩 MuseNet

打开 MuseNet,进入简单模式(显示为默认值),你将听到该模型预先随机生成的音乐样例。然后自行选定一个作曲家或风格,从一段名曲里选择一个起始位置,即可开始生成音乐,它允许用户探索该模型可以创建的各种音乐风格。进入高级模式,用户则可以与模型直接进行交互,当然这样一来,一首乐曲会耗费更多的创作时间,但最终却可以生成一部全新的作品。


MuseNet 所掌握的曲风众多,因此能让音乐玩家用新颖的方式将几代音乐人融合在一起。比如,我们在模型中选取肖邦夜曲的前 6 个音符,并输入命令,要求生成一个由钢琴、鼓、贝斯和吉他演奏出的流行音乐作品,MuseNet 最终就能将两种曲风完美交融,并让乐队在 30 秒左右插入。


OpenAI 方面介绍说,在现阶段,初版的 MuseNet 曲库只收录了部分作曲家,非常欢迎音乐家和普通玩家在 5 月 12 日之前进行免费体验,也期待看到大家如何用 MuseNet 玩转音乐,随后,OpenAI 将根据玩家的反馈对模型进行优化。

作曲家和器乐曲谱写 token 为音乐玩家赋能

为给用户赋能,让用户能够更加灵活地控制 MuseNet 生成的样例,研发团队还创建了作曲家与器乐曲谱写 token。在训练期间,这些作曲家与器乐曲谱写 token 会被预先添加到每个示例中,因此模型将学会使用这些信息来预测音符。在乐曲生成时,通过诸如“拉赫玛尼诺夫钢琴开头”这样的提示符,就可以开始训练模型根据所选风格来创建样例了。然后,可通过将 MuseNet 嵌套可视化,来深入了解该模式已经学会了什么。

初版 MuseNet 尚存两点局限性

但 OpenAI 也坦诚,目前这款音乐生成工具只是初具雏形,MuseNet 的局限性包括:


首先,用户需要明确一点,对 MuseNet 而言,他们在模型中所选择的乐器仅仅是建议,而非是一定被满足的要求。这是因为 MuseNet 生成的每一个音符都是通过对所有音符和乐器的组合概率进行计算方才确定。虽然该模型会尽力调整,以便使用户所做的乐器选择成为可能,但这并不能保证它不会做出别的选择。


另外,当用户选择的曲风和乐器组合起来比较古怪时,比如,选择贝斯和鼓来演绎肖邦,这可就给 MuseNet 出了难题。所以,选择与作曲家或乐队原始风格最接近的乐器,模型最后生成的作品才会更加自然。

历数 OpenAI 的那些研发成果

OpenAI 是一家非营利性人工智能研究组织,正式成立于 2015 年 12 月,总部位于旧金山。区别于以盈利为目的的传统企业,OpenAI 致力于将其研究的内容进行开源分享,立足于最大限度造福全人类的目的来发展人工智能。


回顾这些年,OpenAI 也确实言出必行,研发成果源源不断。


  • 2019 年 4 月,开发出一种深层神经网络 Sparse Transformer,能够预测序列中接下来将要出现的内容——包括文本、图像以及声音等。其利用 attention 机制的改进算法,能够在相当于以往最大周期的 30 倍的长序列当中提取模式。

  • 2019 年 3 月,发布大型强化深度学习模拟器 Neural MMO,一款”大型多角色”虚拟训练场景游戏,把 AI 代理放进一个类似于 RPG(角色扮演游戏)的模拟场景中,AI 们会互相竞争,通过战争来抢夺有限的资源,从而得到优化。

  • 2019 年 2 月,创建文本生成器 GPT-2,该自然语言模型经过 40 千兆字节互联网文本样本的训练,可预测下一个单词。

  • 2018 年 3 月,发布一种元学习算法 Reptile。该算法通过对任务进行重复采样并执行随机梯度下降,将初始参数更新为在该任务上学习到的最终参数。OpenAI 官博表示这种方法与 MAML(一种广泛适用的元学习算法 )一样好用,但执行起来更简单,计算效率更高。

  • 2016 年 5 月,发布开源人工智能研究工具集 OpenAI Gym 的公开测试版本,该工具集用于开发和对比强化学习(RL)算法,这是现代机器学习研究的基础。


但随着 OpenAI 于上个月在官方博客宣布进入重组状态,成为一家“有限利润(capped-profit)”的公司,不少业内人士均表示担心,此举是否会造成 OpenAI 在未来不再继续 Open ?也许,只有保持研究成果的持续开源,才能逐步打消人们心中的顾虑。


而本文这款新型深度神经网络模型 MuseNet 的发布,以及邀请大众自由参与、免费体验的开放态度,无疑是继重组架构风波后,OpenAI“自证清白”的有力一步。


参考链接:


https://openai.com/blog/musenet/


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2019-04-27 11:004714

评论

发布
暂无评论
发现更多内容

java培训Spring之AOP的案例分析

@零度

spring JAVA开发 aop

Digital Twins与物联网的挑战:如何可视化并加速开发

龙智—DevSecOps解决方案

物联网 digital twin 物联网发展

Flutter事件响应源码分析

得物技术

flutter 源码 源码分析 UI 框架

重磅发布 丨 阿里云首部 “数智化转型系列丛书”重磅面世!

博文视点Broadview

大数据培训hive和mapreduce的区别

@零度

mapreduce hive 大数据开发

链上智能合约dapp系统开发,TRX波场链系统开发

Geek_232be3

DAPP系统开发 区块链资讯

弹窗如何设计才能提高用户体验

源字节1号

网站开发

java编程开发多线程锁的8个问题分析

编程江湖

Spark启动及提交流程内部核心原理剖析

编程江湖

艾瑞:技术驱动、生态助力,移动应用行业展望“黄金十年”

Geek_2d6073

Perforce Helix Core与SVN的较量,谁会赢?

龙智—DevSecOps解决方案

svn Subversion helixcore

架构实战营-模块一作业

凯博无线

grpc双向流究竟是什么情况?2段代码告诉你

华为云开发者联盟

gRPC RPC 消息 grpc双向流 消息序列

预约下载 | 《Serverless 开发速查手册》全新上线

阿里巴巴云原生

NFT跨链挖矿软件定制,defi质押挖矿dapp平台搭建

Geek_232be3

系统开发、 TFS挖矿 系统开发 区块链资讯

如何通过 Jira Service Management 打造员工自助服务工具实现高效分布式工作

龙智—DevSecOps解决方案

Atlassian 薪酬估算器 jsm

OpenHarmony 3.1 Beta版本关键特性解析——HiStreamer轻量级可定制的媒体管线框架大揭秘

OpenHarmony开发者

OpenHarmony HiStreamer 媒体管线框架

web技术分享| 快速实现一个呼叫邀请 SDK

anyRTC开发者

前端 Web 语音通话 视频通话 呼叫邀请

第11期直播:解读集群镜像“开箱即用”神器——sealer!

OpenAnolis小助手

技术分享 龙蜥社区 sig 龙蜥大讲堂 集成镜像

与容器服务 ACK 发行版的深度对话最终弹:如何通过 open-local 玩转容器本地存储

阿里巴巴云原生

您有多点会员吗?——数据库渐进式创新助力多点推进经营大脑实践

PingCAP

Web 键盘输入法应用开发指南(10)—— 性能与原理

天择

JavaScript 浏览器 键盘 输入法 3月月更

易观分析:开源是隐私计算技术应用和生态构建的关键

易观分析

隐私计算 开源社区 开源技术

如何写出好的产品帮助文档?

小炮

产品文档

web前端培训比较常见的排序算法有哪些

@零度

算法 前端开发

TDesign Vue Next For Mobile 发布

TDesign

深度解密|基于 eBPF 的 Kubernetes 问题排查全景图发布

阿里巴巴云原生

突破地心引力!与KubeEdge一起迈向太空的云原生

华为云原生团队

开源 边缘计算 卫星定位 边缘技术 边缘云

面试突击33:线程池有哪些状态?状态是如何转换的?

王磊

java面试

搭建 VuePress 站点必做的 10 个优化

冴羽

JavaScript Vue 前端 vuepress 博客搭建

Node.js-COMMONJS 规范

编程江湖

OpenAI又搞新动作!新型神经网络模型MuseNet让所有人都能玩转音乐_AI&大模型_Christine Payne_InfoQ精选文章