【ArchSummit】如何通过AIOps推动可量化的业务价值增长和效率提升?>>> 了解详情
写点什么

Facebook 发布神经蛋分离法,可从嘈杂环境中提取音视频

  • 2018-11-29
  • 本文字数:618 字

    阅读完需:约 2 分钟

Facebook发布神经蛋分离法,可从嘈杂环境中提取音视频

分离混合分布是机器学习和信号处理的长期挑战,而 Facebook 近日提出的新方法似乎可以有效解决这一难题。


人类天生善于分离个别声音和视觉效果,例如在拥挤的鸡尾酒会上听到别人的声音,或者在动物穿过灌木丛时发现动物。但依赖于机器学习的应用程序通常很难完成这项任务。解决这一问题的监督方法,包括对每个来源的样本进行培训,以及假定大量的训练数据都不一定能取得很好的效果,完全无监督的方法会使模型对混合信号源做出不准确的假设。


于是 Facebook 的研究人员提出了神经蛋分离法(Neural Egg Separation,简称 NES),据官方解释,这一方法的命名灵感来源于鸡蛋,意思是像分离蛋清和蛋黄一样把清晰的音视频从模糊的信号中提取出来。


这是一种半监督方法,结合了训练和估计的各个方面。在这一迭代方法中,系统通过将信号混合在一起并进行多个分析来分离已知和未知分布。在此过程中,系统逐渐将更多已知信号注入混合信号中,同时模型在隔离和提取时不断改进。实验表明,NES 明显优于采用类似监督的其他方法,即使对使用全面监督的系统,NES 方法也具有竞争力。


除了改善 ML 系统在逼真的杂乱和嘈杂条件下理解音频和视觉输入的能力之外,这种方法还可以通过应用增强人们隔离信号的自然能力。比如,可以应用在音乐会(或类似场景)中的音频、视频记录,或者开发基于 AR 的应用,用来实时放大特定音频源或视觉特征。


论文地址:


https://research.fb.com/publications/neural-separation-of-observed-and-unobserved-distributions/


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2018-11-29 15:261610
用户头像
陈思 InfoQ编辑

发布了 576 篇内容, 共 263.2 次阅读, 收获喜欢 1293 次。

关注

评论 1 条评论

发布
暂无评论
发现更多内容

全是蓝光,太狠了!

Jackpop

TensorFlow Recommenders: Quickstart

毛显新

深度学习 tensorflow 推荐系统 keras

男人要慢,SQL要快:记一次慢SQL优化

艾小仙

Java集合源码总结分析

讲的是切片,但好像又不只是切片?

Gopher指北

Go 语言

Druid 如何开启查询日志

HoneyMoose

Python OpenCV 图像处理之直方图相关知识细节,学点细的

梦想橡皮擦

7月日更

教你如何成为解决问题的高手

孙叫兽

高手 解决问题

如何在二三线城市月薪过万(一)看完这篇后端简历优化,包你面试不断

小鲍侃java

面试 后端

CloudQuery 首次开放API,v1.4.1将开放「部门导入」和「用户导入」

BinTools图尔兹

数据库 OpenAPI 数据库管控

今晚拿下PHP反序列化的一系列操作

网络安全学海

php 网络安全 信息安全 渗透测试 漏洞分析

Linux之top命令

入门小站

Linux

安装 Druid 安装的时候提示 JAVA 版本的问题

HoneyMoose

模块三

Winston

坐下来谈谈如何写好一份简历?

童欧巴

面试 大前端 简历

网络攻防学习笔记 Day89

穿过生命散发芬芳

网络攻防 7月日更

充满科技感的农业,是年轻人的『菜』吗?

百度大脑

人工智能

程序员如何快速成长为IT精英

孙叫兽

程序员 成长 IT职场

云图说 | 华为云医疗智能体,智联大健康,AI药物研发

华为云开发者联盟

AI 药物研发 医疗智能体

AI论文解读丨融合视觉、语义、关系多模态信息的文档版面分析架构VSR

华为云开发者联盟

语义 视觉 多模态信息 文档版式 VSR

如何对抗信息茧房?

caiyongji

程序员 信息茧房

Windows Service 小品

喵叔

7月日更

腾讯被罚了!!!

Jackpop

模块三作业

河马先生

架构实战营

带你走进“华为链”

华为云开发者联盟

区块链 高性能 华为链 自研区块链平台 自主可控

数据对AI的重要性:采访首席数据官Rick McFarland - LexisNexis Legal & Professional

WorkPlus

阅读

音视频延时和抖动问题分析和解决

hanaper

在线常用crontab表达式大全验证解析

入门小站

工具

第三届WICC北京落幕 展现开发者服务生态与建设新方向

融云 RongCloud

区块链去中心化钱包开发|开发去中心化钱包

Geek_23f0c3

钱包系统开发 去中心化交易所系统开发 去中心化钱包 去中心化交易所

泰国Ascend Money用开源软件加快应用交付

WorkPlus

阅读

Facebook发布神经蛋分离法,可从嘈杂环境中提取音视频_AI&大模型_Facebook_InfoQ精选文章