re:Invent全球大会引领风向重塑未来 了解详情
写点什么

人类的意念终于能实时转化成文字,但 Facebook 不打算继续了

  • 2021 年 7 月 16 日
  • 本文字数:2522 字

    阅读完需:约 8 分钟

人类的意念终于能实时转化成文字,但Facebook不打算继续了

整理|燕珊、核子可乐


Facebook 正在放弃对于脑机接口(Brain Computer Interface,简称 BCI)设备的研发,尽管近日其投资的一个相关研究项目有了实质性进展——能让患有严重失语症的人拥有“沟通能力”。


近年来,作为最前沿的技术之一,脑机接口领域的技术进展和商业化落地进展一直备受关注。但 Facebook 坦承,面向大众市场的消费级脑机接口仍然遥遥无期。与此同时,为了继续促进光学 BCI 在整个领域的发展,Facebook 宣布开放相关 BCI 软件LabGraph的源代码,并将头戴式硬件原型分享给研究人员和其他同行,以帮助推进这一方向的探索。

Facebook 的“读心术”


2017 年春季可能会是一段被载入史册的重要时期,当时多家大型科技企业相继发起“深入人心”的活动。首先是 Elon Musk(埃隆·马斯克)创立了脑机接口企业 Neuralink,表示正在研究如何将数千个电极植入至人类大脑当中。几天之后,Facebook 也加入了这项探索,媒体曝光 Facebook Reality Labs(FRL)旗下名为 Building 8 的秘密部门正尝试开发一款耳机或者头带,帮助用户用思维方式发送短信——输入速度可以达到每分钟 100 个单词。


根据计划,Facebook 希望让任何用户都能通过 VR 虚拟现实的方式享受这种不需要用到手的人机交互。前 DARPA 官员、时任 Building 8 硬件部门负责人的 Regina Dugan 当时兴奋地强调,“直接通过意念就能打字,听起来是不是相当奇妙?虽然难度极大,但我们获得的进展已经远超大家想象。”


不过如今看来,现实的进展并没有远超想象。在一篇博文中,Facebook 表示将停止该项目,转而将研究重点放在一款用于虚拟现实实验的手腕控制器上,这款控制器能够读取手臂的肌肉信号。该公司指出,“虽然我们对头戴式光学脑机接口的长期发展潜力仍有信心,但还是决定把精力集中在另外一种不同的神经接口之上,希望能够更快拿出可行的市场产品。”


最初,Facebook 的脑机接口(BCI)项目团队设定的长期目标是:开发一个无声、无创的语音接口,人们只需用意念去想希望说出的话语,就可以实现相应的文本输入操作。


去年才开始接手和领导“无声”语音识别项目、但最近开始转而研究 Facebook 平台选举话题管理的物理学家及神经科学家 Mark Chevillet 表示,“我们在技术层面获得了丰富的实践积累。因此我们可以自信地说,从消费级接口角度来评判,头戴式光学无声语音设备还有很长的发展道路要走,远比我们预想的要长。”

BCI 难以应用到消费级产品


Facebook 的畅想无疑是让“无声”语音项目与 VR 结合,毕竟早在 2014 年它就以 20 亿美元高价收购了 Oculus VR。Chevillet 表示,为了实现这个目标,Facebook 公司采取了双管齐下的推进方法。首先,他们需要确定意念到语音的接口是否可行。为此,Facebook 决定赞助加州大学旧金山分校的一项研究,由研究员 Edward Chang 尝试在人类大脑表面放置电极垫。


植入的电极能够从单一神经元处读取数据,这种被称为脑皮层电流描记法(简称 ECoG)的技术能够一次性对大量神经元进行测量。


这支研究团队最终取得了一系列令人惊讶的进展。根据《新英格兰医学杂志》上的报道,他们使用这些电极垫完成了实时语音解码。其中的研究对象是一位代号为“Bravo-1”的 36 岁男性,他由于严重中风而失去了正常的语言表达能力,只能勉强发出断断续续的咕哝声。在报告当中,研究员团队表示通过大脑表面的电极垫,Bravo-1 已经能够以每分钟 15 个单词的速度在计算机上表达语句。至于具体实现方式,他们会测试 Bravo-1 尝试进行默念时用于控制舌头及声道的运动皮层区域神经信号。


为了达成这样的结果,Chang 的团队给 Bravo-1 提供了 50 个常用词汇,每一个进行近万次默念,而后将患者的神经信号输入至深度学习模型。在训练模型将词汇与神经信号相匹配之后,该团队即可以 40%的正确概率确定 Bravo-1 想要表达的词汇(远高于训练之初的 2%)。尽管如此,他的表达结果仍然充满了错误,例如把“嗨,你好吗?”理解成“黑,你吼吗?”


但科学家们决定添加一套语言模型来进一步提高性能,用于判断英语语境下哪些单词序列出现的几率更高。通过这次努力,准确率被提升至 75%。通过这种方法,系统已经能够将 Bravo-1 的表达“我稀饭我的护士”正确地调整为“我喜欢我的护士。”


但同样值得注意的是,英语这门语言共包含超过 17 万个单词,而一旦超出 Bravo-1 所掌握的词汇范畴,其性能也将直线下降。换句话说,这项技术虽然有望用于医疗援助,但与 Facebook 的最初预期仍然相去甚远。Chevillet 坦言,“在可预见的未来,这项技术应该能够实现临床辅助应用,而这跟 Facebook 的业务没什么关系。对于我们真正关注的消费级应用,目前的成果还远远不够。”


Facebook 开发的漫射光学层析成像设备,使用光测量大脑中的血氧变化。

应用场景待拓展


技术发展的速度往往比应用和产品的落地要快得多。多年来,脑科学更多聚焦在基础理论探索阶段,一方面这是极为复杂的交叉性学科,另一方面该技术还未大量进入日常生活,缺乏足够市场支持。


而尽管脑机接口技术的发展面临诸多挑战,该领域还是吸引了不少科技巨头进场,除了 Facebook,Google、阿里巴巴、科大讯飞等公司也在相继布局。今年 4 月,马斯克的 Neuralink 公司宣布,能够让一只猕猴通过大脑活动来控制计算机,而无需通过手来操纵游戏杆。消息一出,脑机接口又再登上热点话题。


研究人员通过在猴子的大脑皮层区域接入 2000 多条细丝,在猴子与计算机交互的时候记录猴子大脑的神经元活动,并将这些神经元活动数据输入到“解码器算法”中,以观察并实时预测猴子的手部运动。虽然有不少业内专家认为 Neuralink 的一系列成果在脑机领域并没有什么创新,但这也侧面说明了人类对脑机接口始终充满好奇。


在众多产业中,医疗领域被视为脑机接口最先落地的方向,目前已经实现临床应用产品,功能集中在针对神经疾病的病情诊断、系统监测和辅助治疗等方面。


阿里巴巴达摩院在 2021 十大科技趋势中亦指出,脑机接口帮助人类超越生物学极限。学术界和工业界正在努力攻克脑信号的采集和处理难题,帮助人类更好地理解大脑工作原理,技术的成熟将加速脑机接口的临床应用,未来将为口不能言、手不能动的患者提供精准康复服务。


参考链接:


https://www.technologyreview.com/2021/07/14/1028447/facebook-brain-reading-interface-stops-funding/

https://www.theregister.com/2021/07/15/facebook_dumps_mindreading_neural_interface/

2021 年 7 月 16 日 20:123739
用户头像
罗燕珊 InfoQ中文站编辑

发布了 198 篇内容, 共 73.2 次阅读, 收获喜欢 362 次。

关注

评论 1 条评论

发布
用户头像
力荐一个阅读全球计算机论文的好RP:
1000+份计算机paper,卡耐基梅隆大学,芝加哥大学,facebook,google,微软,twitter等大牛一作,持续更新中...
https://github.com/0voice/computer_expert_paper
2021 年 07 月 20 日 15:03
回复
没有更多了
发现更多内容

推荐系统的未来发展(三十三)

数据与智能

价值观 推荐系统

架构训练营模块 1 作业 - 1班助教

听闻

图解DDD建模六个问题与六个步骤

JAVA前线

Java 领域驱动设计 DDD

Ta想做一粒智慧的种子

白洞计划

暑假期间快手将重点整治平台:短视频平台如何完善内容审核机制

石头IT视角

架构实战营 模块八课后作业

iProcess

架构实战营

Kats-Facebook最新开源的时序分析工具

好孩子

新加坡Degital Future Pte Ltd收购BITUAN,继续发展完善产品生态

股市老人币圈新

架构实战营 - 模块 8- 作业

请弄脏我的身体

架构实战营

长文图解:金字塔思维如何指导技术系统优化

JAVA前线

性能优化 金字塔 结构化思维

直接上干货!这些细节在Android面试上要注意了

欢喜学安卓

android 程序员 面试 移动开发

我为什么要学习业务建模?

escray

学习 极客时间 7月日更 如何落地业务建模

Linux之find命令的参数详解

入门小站

Linux

全面了解Java并发编程基础!超详细!

程序员的时光

Java 并发编程

Go 学习笔记之 Map

架构精进之路

Go 语言 7月日更

公司内部使用的数仓开发规范

白程序员的自习室

数据仓库 开发规范 数仓规范 7月日更

架构实战营-模块8作业-消息队列MySQL表格

Lane

我赌一包辣条这是全网最详细的代码审计(没有之一)

网络安全学海

黑客 网络安全 信息安全 代码审计 漏洞分析

网络攻防学习笔记 Day70

穿过生命散发芬芳

网络攻防 7月日更

进来偷学一招,数据归档二三事儿

楼下小黑哥

Java 数据库 系统设计

第二周作业-熊猫潘戈项目利益相关方

小夏

产品经理训练营 邱岳

业务架构模块8作业:设计消息队列存储消息数据的MySQL 表格

好吃不贵

ACM金牌选手整理的【LeetCode刷题顺序】

编程熊

Java 面试 算法 面经 笔试

模块8作业

dwade

#架构实战营

模块一作业

架构0期-Bingo

正式加入字节跳动!如何才能更容易拿到大厂Offer

欢喜学安卓

android 程序员 面试 移动开发

记录一次Neokylin_Server_V5系统已有分区的扩容操作

星河寒水

分区扩容

图像的模板匹配,Python OpenCV 取经之旅第 29 天

梦想橡皮擦

7月日更

TEMS模型--衡量你的人生资源

俞凡

认知

【LeetCode】基于时间的键值存储Java题解

HQ数字卡

算法 LeetCode 7月日更

在线脑图思维导图生成工具

入门小站

工具

撑起瞬时千亿交易额的云数据库是怎么炼成的?

撑起瞬时千亿交易额的云数据库是怎么炼成的?

人类的意念终于能实时转化成文字,但Facebook不打算继续了-InfoQ