最新发布《数智时代的AI人才粮仓模型解读白皮书(2024版)》,立即领取! 了解详情
写点什么

Facebook 发布神经蛋分离法,可从嘈杂环境中提取音视频

  • 2018-11-29
  • 本文字数:618 字

    阅读完需:约 2 分钟

Facebook发布神经蛋分离法,可从嘈杂环境中提取音视频

分离混合分布是机器学习和信号处理的长期挑战,而 Facebook 近日提出的新方法似乎可以有效解决这一难题。


人类天生善于分离个别声音和视觉效果,例如在拥挤的鸡尾酒会上听到别人的声音,或者在动物穿过灌木丛时发现动物。但依赖于机器学习的应用程序通常很难完成这项任务。解决这一问题的监督方法,包括对每个来源的样本进行培训,以及假定大量的训练数据都不一定能取得很好的效果,完全无监督的方法会使模型对混合信号源做出不准确的假设。


于是 Facebook 的研究人员提出了神经蛋分离法(Neural Egg Separation,简称 NES),据官方解释,这一方法的命名灵感来源于鸡蛋,意思是像分离蛋清和蛋黄一样把清晰的音视频从模糊的信号中提取出来。


这是一种半监督方法,结合了训练和估计的各个方面。在这一迭代方法中,系统通过将信号混合在一起并进行多个分析来分离已知和未知分布。在此过程中,系统逐渐将更多已知信号注入混合信号中,同时模型在隔离和提取时不断改进。实验表明,NES 明显优于采用类似监督的其他方法,即使对使用全面监督的系统,NES 方法也具有竞争力。


除了改善 ML 系统在逼真的杂乱和嘈杂条件下理解音频和视觉输入的能力之外,这种方法还可以通过应用增强人们隔离信号的自然能力。比如,可以应用在音乐会(或类似场景)中的音频、视频记录,或者开发基于 AR 的应用,用来实时放大特定音频源或视觉特征。


论文地址:


https://research.fb.com/publications/neural-separation-of-observed-and-unobserved-distributions/


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2018-11-29 15:261605
用户头像
陈思 InfoQ编辑

发布了 576 篇内容, 共 262.6 次阅读, 收获喜欢 1293 次。

关注

评论 1 条评论

发布
暂无评论
发现更多内容

"5.25秒变0.023秒:小程序图片优化全攻略"

陇锦

小程序 微信小程序 前端 前端开发 js

一文了解:仿真技术的巨头——美国Altair公司

智造软件

CAE CAE软件 altair

零代码集成自动化的实现逻辑是什么?

RestCloud

零代码 APPlink

软件测试/测试开发/全日制/测试管理丨Redis内存数据库

测试人

软件测试

如何使用 Helm 在 K8s 上集成 Prometheus 和 Grafana|Part 2

SEAL安全

Kubernetes 运维 Helm Prometheus

户外交通LED显示屏必须具备的特点

Dylan

技术 网络 计算机 LED显示屏 led显示屏厂家

如何使用代码混淆技术保护移动应用程序安全

虾皮shopee根据ID取商品详情 API (shopee.item_get):利用虾皮shopee API提升电商平台用户转化率与客单价

技术冰糖葫芦

API

第35期 | GPTSecurity周报

云起无垠

英文版sketch怎么转为中文,Sketch中英文切换教程

Rose

Mac矢量图设计 Sketch 99 Sketch中英文切换教程

性能持续突破!火山引擎ByteHouse上线向量检索能力

字节跳动数据平台

数据库 大数据 云原生 数仓 企业号 1 月 PK 榜

当创建pvc后,kubernetes组件如何协作

华为云开发者联盟

Kubernetes 开发 华为云 华为云开发者联盟

智能商品管理系统相比传统商品管理在自动化程度上有哪些优势?

第七在线

Java AtomicReference

0x5d0de9

Java

如何下载会员视频?推荐使用唐尼downie 4 !

Rose

mac软件下载 视频下载工具 Downie 4 Mac版 Downie 4中文版

一篇文章了解做仿真软件的达索系统-达索代理商

思茂信息

cst abaqus软件 达索系统

EVE-NG强大的网络模拟器和实验平台

小齐写代码

制程架构并驾齐驱,软件硬件双核驱动 英特尔携手合作伙伴兑现AI PC承诺

E科讯

好玩有趣的桌面宠物Desktop Goose for mac

Rose

Desktop Goose mac破解版 mac桌面宠物

AI实践 | 一文简述语音克隆实践

云起无垠

将ChatGPT引入企业财务共享服务的探讨与思考

用友BIP

Office 2013-2021专业增强版激活许可证 Mac/win

Rose

office许可证 office下载

SVN管理工具Cornerstone for mac入门教程

Rose

SVN管理工具 cornerstone 4 破解版 Cornerstone入门教程

Premiere新手入门教程:Premiere Pro (PR) mac版基础教程合集

Rose

Premiere Pro下载 Premiere教程 PR转场预设

BACK Stack会成为平台工程的新趋势吗?

杨振涛

云原生 平台工程 内部开发者平台 平台工程社区 PECommunity

【第七在线】如何让智能商品系统提供深入的供应链决策支持?

第七在线

代码混淆:保护您的应用程序

雪奈椰子

Apache Doris 聚合函数源码阅读与解析|源码解读系列

SelectDB

数据库 大数据 数据仓库 数据分析 apache doris

2024律师课程推荐:iCourt律师执行实务集训营(赠《执行实务大礼包》)

科技汇

康威定律:AI时代的IT组织变革

FN0

AI 软件开发 组织设计

软件测试/测试开发/全日制/测试管理丨MongoDB NoSQL数据库

测试人

软件测试

Facebook发布神经蛋分离法,可从嘈杂环境中提取音视频_AI&大模型_Facebook_InfoQ精选文章