Jeremy Freeman: 从计算机的角度探索神经学

阅读数:316 2014 年 3 月 31 日

话题:数据库QCon大数据语言 & 开发架构AI

计算机技术已经成为人类了解自身奥秘的重要工具,无论在生物科学还是神经学,高容量的计算和存储集群、新型软件正扮演者越来越重要的角色。InfoQ 专访了霍华德·休斯医学研究所研究员 Jeremy Freeman,他通过计算机技术收集斑马鱼的神经元信息,并挖掘其中的规律。同时作为QCon 北京 2014大会《大数据处理与大数据应用》专题的讲师,Jeremy Freeman 将就《大规模脑计算——操控脑,绘制脑地图》话题做分享。以下为专访全文:

InfoQ: 你好 Jeremy Freeman,请介绍下自己吧。

Jeremy Freeman: 大家好,我叫 Jeremy Freeman,是来自于霍华德·休斯医学研究所的一位研究组负责人。我现在的工作是借助于云计算技术研究大脑。

InfoQ: 你在 Spark Summit 2013 上做的斑马鱼的神经元演示很吸引人,做这项研究的初衷是什么?

Jeremy Freeman: 我的激情来源于我对大脑工作原理的渴求。大脑是非常复杂的,特别是人类的大脑,但即使是老鼠、鱼和苍蝇这样的小动物它们的大脑依旧不简单。大脑如此复杂的原因之一就是它有非常多的神经元:苍蝇和鱼有数十万,老鼠有数百万,人类有数十亿。长期以来我们一次仅能记录少数神经元的活动,但是在过去的十年间有很多技术获得了长足的发展,甚至有些技术在最后这几年才发展起来,它们让我们能够同时测量非常大规模的神经元的活动。虽然我们现在能够产生所有的这些数据,但是我们能够拿它们做什么呢? 我们怎样才能找到蕴含在这些复杂数据中的模式,帮助我们理解大脑的工作原理呢?我一直在从计算机的角度探索神经学,使用这些新型的数据——通过它们达到理解大脑的目的——是一个非常令人鼓舞的挑战。

InfoQ: 你的实验中利用了大量最先进的大数据技术。可否讲一下这些大数据技术对你实验带来了什么帮助?在使用 Spark 的过程中,你都遇到了什么挑战?

Jeremy Freeman: 神经数据如此之大以致于它需要新技术的支撑。我们需要快速地处理大规模的数据。但是神经数据还有另外一个挑战,那就是我们几乎不知道什么是“正确的”分析。相反的,我们需要交互式地探索数据,并且适应需要重复查询的复杂模型。Spark 能够完美地契合我们的场景,因为它正好是为这两种用例而设计的。开源是 Spark 的另一个优势,它有一个奇妙的用户社区,能够被扩展到支持流式分析。最大的挑战是 Spark 以及其他被普遍使用的大数据技术在神经科学领域的应用还很少,所以我和我的合作者们不得不一起从头开始构建一个新的分析集。但是我希望我们所构建的东西现在能够对神经科学社区有所帮助。

InfoQ: 规模突破是进行神经元实验面对的问题,大规模神经元实验主要有哪些挑战?你认为现在的科技能够支持比斑马鱼更强大的大脑分析了吗?

Jeremy Freeman: 斑马鱼的关键优势是它是透明的,特殊的显微镜利用这一点几乎能够同时监控它整个大脑的神经响应。对于其他的动物,例如老鼠,我们能够测量相当大区域内(几百个神经元)的活动,但是不可能延伸到整个大脑。令人兴奋的是,同时使用显微镜和大规模电记录的新技术可能给了我们扩大测量范围的机会。我的合作者们正在积极地开发这些技术,而我的主要焦点是如何使用这些数据。

InfoQ: 有些人说你是他们见过的计算机科学家里面对生物了解最多的,也是生物科学家里面对计算机技术了解最多的。你此有什么评价吗?

Jeremy Freeman: 谢谢这样夸奖我!我不知道这是不是真的。从我还是一个孩子开始,我一直在尽可能多的去学习神经科学和计算方面的知识,因为我意识到它们之间是如何联系的。尤其是现在,这两者的关系变得越来越紧密,几乎缺一不可。在这个过程中很多人让我受益匪浅,包括来自于不同网络的朋友、合作者、导师、我的神经科学家伙伴、Spark 社区以及其他高科技企业中的朋友。

InfoQ: 说说你将在 QCon 北京 2014 大会上的分享吧。

Jeremy Freeman: 我将会介绍我们是如何使用 Spark 映射和操作大脑的。我首先会介绍我们使用的动物模型以及合作者们开发的、能够让我们同时记录这些动物大脑中成千上万神经元活动的技术。然后我会介绍这些实验数据给我们带来的技术分析挑战,以及我们是如何使用 Sprak 克服这些挑战的。特别会介绍我们为了对神经数据进行快速、探索性分析而开发的一个开源类库,并给出一些示例展示这个类库是如何帮助我们在整个大脑的层面上理解功能性组织、感觉处理的瞬时动态以及活动行为的。基于在 Spark Summit 上的呈现,我将会介绍一个新的专门针对分解神经响应瞬时动态的分析家族,同时还会介绍一个新的使用 Spark Streaming 在实验期间分析在线流式神经数据的方法集,以及与新的在线机器学习算法相关的技术。

此专题详细信息,请见专题页面。关于此次 QCon 北京其他专题的详细信息,请移步至大会官网

需要特别注明的是,每年 QCon 大会门票都会在开幕前售罄,及早预定可提前确保席位,并享受更低折扣。3 月 26 日前报名参加可享受 9 折优惠。团体购票(5 人及以上)将享有更多优惠。详请咨询 qcon【at】cn.infoq.com,或直接致电 010-64738142。报名请点击报名页面。


感谢辛湜@hashjoin 对本文的审校。

给 InfoQ 中文站投稿或者参与内容翻译工作,请邮件至editors@cn.infoq.com。也欢迎大家通过新浪微博(@InfoQ)或者腾讯微博(@InfoQ)关注我们,并与我们的编辑和其他读者朋友交流。