Windows Azure 上的 NCBI BLAST

  • Jonathan Allen
  • 侯伯薇

2010 年 12 月 18 日

话题:.NET云计算Windows AzureDevOps语言 & 开发架构

NCBI BLAST的全名是“国家生物学信息中心的基本本地排列搜索工具(Basic Local Alignment Search Tool of the National Center for Biotechnology Information)”。 NCBI BLAST 是由工作在国家卫生研究所的一组研究员创建的,那是美国卫生和人类服务部的一个部门。 NCBI 把 BLAST 描述为一种工具,它能够找到序列之间类似的部分。 程序会把核苷酸或者蛋白质的序列与序列数据库相比较,并计算符合的统计学意义。 BLAST 可以被用于推论出序列之间的功能和进化关系,还有助于识别基因家族中的成员。

11 月 6 日,微软宣布他们在 Windows Azure 上提供了 NCBI BLAST。 在一个演示中,它们采用了西雅图儿童医院的一个项目来检验已知蛋白质序列的相互关系。 他们声称,如果使用单独的计算机,那么这项分析会花费六年的时间,而 Windows Azure 上的 NCBI BLAST 完成这项计算只需要一周。 (注意到这里并没有给出“一台计算机”的具体配置。 单独一台超级计算机会比笔记本电脑当然会快得多。) 在另一项演示中,他们为华盛顿大学分析了细菌中的制氢过程。 据微软所说,“当哈佛实验室的本地资源无法处理该项计算时,研究员们把他们的需求提交给全国范围内的计算机集群,但是由于它会占用很长的任务队列时间,两天之后请求就被拒绝了。” 他们继续说到,在 Windows Azure 上只花了三天时间就完成了所有的计算。

Windows Azure 能够运行三种不同版本的 BLAST,BlastP、BlastN 和 BlastX。 BlastP 是用于在蛋白质数据库中搜索类似序列的。 BlastN 会对 DNA 序列做相同的工作。 BlastX 是用于比较 DNA 序列和蛋白质序列数据库的概念性转换的。 所有三种应用程序都可以不需改变就运行在 Windows Azure 上。 此外,还需要专注于用户界面的 web 角色,以及在 BLAST 应用程序的各个分离实例中分配工作的 worker 角色。

Windows Azure 上的 NCBI BLAST 已经通过微软的“全球云研究协作计划 (Global Cloud Research Engagement Initiative)”免费提供给很多位研究员。 这个项目也被叫做“Azure 参与研究项目(Azure Research Engagement Project)”。

查看英文原文:NCBI BLAST for Windows Azure
.NET云计算Windows AzureDevOps语言 & 开发架构