AICon 上海站|日程100%上线,解锁Al未来! 了解详情
写点什么

Cloudera 宣布与博德研究所合作

  • 2016-06-15
  • 本文字数:946 字

    阅读完需:约 3 分钟

根据 Cloudera 上月报道,他们将会与博德研究所共同合作研究博德研究所的Genome Analysis Toolkit 第四代产品Hellbender(GATK4)。InfoQ 之前对其进行过相关报道

Cloudera 的生命科学部门负责人 Shawn Dolley 称 GATK4 可以节约成本,并减少了研发时间,并同时宣布有关博德研究所与各种云 IaaS 提供商的广泛合作,但不提供定量的标准。Dooley 提到了合作工作所能带来的优势,

2014 年 Cloudera 与 Spark 之间的合作,推动我们成为首个可以交付、支持并提供 Spark 培训的 Hadoop 供应商。我们很荣幸可以将我们的专业知识运用到多 omic 生物标志分析领域,投资基于 Spark 的生物信息学标准,并与博德研究所合作创造下一代 GATK 产品。这种低成本的基因组测序和大数据技术的领先技术相结合,代表着我们可以更广泛地对患者的基因组进行测序,并产生之前从未得到过的数据集。

云平台的用例和架构注重于避免重复的基础设施,并推进最佳实践,使用户可以深入理解观察疾病和治疗方法,而不仅仅是管理基础设施。博德研究所数据科学和数据工程高级总监、GATK 软件包创始人 Eric Banks 博士说,

博德研究所的 GATK 产品目前有超过 31000 名注册用户。绝大多数用户建立了本地计算存储基础设施,以处理需要进行基因分析的庞大信息。这些合作将为我们消除传统技术的限制,同时给予相同高质量数据处理水平提供新的机会。

关于 GATK 之前的版本到 GATK4 之间性能的提升,Bank 表示,

在 Cloudera 企业版中使用 Spark 计算框架,给予了我们在 GATK3 上因其计算复杂程度无法实现的工具。在 Cloudera
企业版上,我们现在可以以快于先前版本的 GATK 两个数量级的速度来运行基因数据分析,加速反复分析,推进基因创新。

博德研究所与 laaS 提供商的广泛合作旨在让下一代 GATK Spark 可以基于 SaaS 模型使用,让用户可以通过不同的 laaS 登录 GATK4,而不受特定提供商的限制。GATK4 最早将在今年发布,根据提供商不同价格也会不同。免费的许可证将会提供给学术研究,而收费的许可证将可以供给商业用户使用。

查看英文原文 Cloudera Announces Partnership with the Broad Institute


感谢张龙对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2016-06-15 19:001441
用户头像

发布了 218 篇内容, 共 72.3 次阅读, 收获喜欢 76 次。

关注

评论

发布
暂无评论
发现更多内容

数据库事务的三个元问题

Zilliz

数据库 数据库设计

为啥你写的代码老有大串的if/else?

华为云开发者联盟

代码 if for循环 else

双 11 大促会场开发提效解析:前端智能化落地实践

凹凸实验室

机器学习 大前端 智能代码

CANN5.0黑科技解密 | 高并发图片视频处理,为出行保驾,为生活添彩!

华为云开发者联盟

高并发 图像预处理 CANN 昇腾 异构计算

如期而至-用户购买时间预测(下)

索信达控股

模型 购买预测 购买行为 精准营销

一文读懂 Apache Pulsar

了凡跨境洞察

云原生 Apache Pulsar 消息系统 数据流 Apache Pulsar 社区

高并发多方案秒杀架构

MetaThoughts

浅析流媒体CDN与WEB CDN的业务差异

郑州埃文科技

CDN加速 IP网络 在线并发

OceanBase 源码解读(七):一文读懂数据库索引实现原理

OceanBase 数据库

开源 oceanbase 技术解析

恒拓高科WorkPlus助力南兴装备移动数字化升级

BeeWorks

Kyligence 智能数据服务与管理相关研究

Kyligence

技术专题合集

Linux常用命令速查手册

入门小站

Linux

科创人·StreamNative翟佳:开源模式价值为王,基础软件的未来在国内社区

科创人

大厂面试算法题之数组

程序员学长

数据结构 算法 大厂面试

前端性能优化 24 条建议

编程江湖

大前端

DataPipeline与TiDB推出异构数据实时同步解决方案,共筑安全可信基础设施

DataPipeline数见科技

数据库 大数据 中间件 数据融合 数据管理

前端开发之Vue 技术栈编写表单组件

@零度

Vue 前端开发

进程崩溃/应用卡死,故障频频怎么办?|HDC2021技术分论坛

HarmonyOS开发者

HarmonyOS

浅谈服务网关和联邦云

星环科技

联邦云 服务网关

<<活法>>读后感

Tiger

28天写作

Java开发之环境搭建基础教程

@零度

Java 开发环境搭建

MySQL性能测试之select&update【FunTester框架】

FunTester

MySQL 性能测试 测试框架 FunTester FunTester框架

极光笔记|基于CMPP协议集成短信测试桩全流程实践分享

极光JIGUANG

从 0-15 套存储集群,YRCloudFile 助力 AI 训练效率“超线性增长”

焱融科技

人工智能 云计算 分布式 高性能 文件存储

这套神奇的个人信息管理系统,带我一步步进入互联网大厂

博文视点Broadview

【干货分享】研效优化实践:AI算法助力深层BUG挖掘

WeTest

Python enumerate():使用计数器简化循环

华为云开发者联盟

Python 变量 计数器 循环 enumerate

10年经验总结,华为fellow教你如何成为一名优秀的架构师?

华为云开发者联盟

架构设计 架构师 华为fellow 云服务运维

大数据开发之传输组件Sqoop的功能介绍

@零度

大数据 sqoop

架构实战营-模块六作业

无名

架构实战营 「架构实战营」

Android C++系列:Linux网络(三)协议格式

轻口味

c++ android 28天写作 12月日更

Cloudera宣布与博德研究所合作_大数据_Dylan Raithel_InfoQ精选文章