2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

Cloudera 宣布与博德研究所合作

  • 2016-06-15
  • 本文字数:946 字

    阅读完需:约 3 分钟

根据 Cloudera 上月报道,他们将会与博德研究所共同合作研究博德研究所的Genome Analysis Toolkit 第四代产品Hellbender(GATK4)。InfoQ 之前对其进行过相关报道

Cloudera 的生命科学部门负责人 Shawn Dolley 称 GATK4 可以节约成本,并减少了研发时间,并同时宣布有关博德研究所与各种云 IaaS 提供商的广泛合作,但不提供定量的标准。Dooley 提到了合作工作所能带来的优势,

2014 年 Cloudera 与 Spark 之间的合作,推动我们成为首个可以交付、支持并提供 Spark 培训的 Hadoop 供应商。我们很荣幸可以将我们的专业知识运用到多 omic 生物标志分析领域,投资基于 Spark 的生物信息学标准,并与博德研究所合作创造下一代 GATK 产品。这种低成本的基因组测序和大数据技术的领先技术相结合,代表着我们可以更广泛地对患者的基因组进行测序,并产生之前从未得到过的数据集。

云平台的用例和架构注重于避免重复的基础设施,并推进最佳实践,使用户可以深入理解观察疾病和治疗方法,而不仅仅是管理基础设施。博德研究所数据科学和数据工程高级总监、GATK 软件包创始人 Eric Banks 博士说,

博德研究所的 GATK 产品目前有超过 31000 名注册用户。绝大多数用户建立了本地计算存储基础设施,以处理需要进行基因分析的庞大信息。这些合作将为我们消除传统技术的限制,同时给予相同高质量数据处理水平提供新的机会。

关于 GATK 之前的版本到 GATK4 之间性能的提升,Bank 表示,

在 Cloudera 企业版中使用 Spark 计算框架,给予了我们在 GATK3 上因其计算复杂程度无法实现的工具。在 Cloudera
企业版上,我们现在可以以快于先前版本的 GATK 两个数量级的速度来运行基因数据分析,加速反复分析,推进基因创新。

博德研究所与 laaS 提供商的广泛合作旨在让下一代 GATK Spark 可以基于 SaaS 模型使用,让用户可以通过不同的 laaS 登录 GATK4,而不受特定提供商的限制。GATK4 最早将在今年发布,根据提供商不同价格也会不同。免费的许可证将会提供给学术研究,而收费的许可证将可以供给商业用户使用。

查看英文原文 Cloudera Announces Partnership with the Broad Institute


感谢张龙对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2016-06-15 19:001739
用户头像

发布了 218 篇内容, 共 78.3 次阅读, 收获喜欢 76 次。

关注

评论

发布
暂无评论
发现更多内容

Sentieon | 每周文献-Multi-omics(多组学)-第九期

INSVAST

基因测序 Multi-omics 多组学

Sentieon | 每周文献-Liquid Biopsy(液体活检)-第十期

INSVAST

基因测序 液体活检 Liquid Biopsy

使用DWS集群,用户被锁定如何解锁

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 企业号 8 月 PK 榜

端云一体化云开发,助推HarmonyOS应用与元服务高效开发

最新动态

推荐系统在线峰会来了,冷启动、推荐工程、模型训练…你都能找到答案

小红书技术REDtech

推荐系统

轻量应用服务器和云服务器的区别

天翼云开发者社区

服务器 云服务器

财务数智化十年“老兵”的六条财务共享中心建设体会

用友BIP

智能财务 财务共享

Sentieon|应用教程:利用Sentieon Python API引擎为自研算法加速

INSVAST

开源软件 基因测序 Python API

Sentieon | 每周文献-Benchmark and Method Study(基准与方法研究)-第八期

INSVAST

基因测序 基因数据分析 基准与方法研究

制造执行系统(MES)在汽车行业中的应用

万界星空科技

MES系统 汽车

判断LED显示屏的质量指南

Dylan

性能 质量 环境 LED显示屏

使用云函数实现定时签到

查拉图斯特拉说

腾讯云 签到

共享服务器的复杂性与核心原理

天翼云开发者社区

服务器

低成本生成式AI:引领未来内容创作新篇章

百度开发者中心

#人工智能 生成式AI 文心一言

生成式AI技术原理与应用

百度开发者中心

#人工智能 生成式AI 文心一言

Sentieon | 每周文献-Long Read Sequencing(长读长测序)-第七期

INSVAST

基因测序 长读长测序 Long Read

实现高效数据同步:40 分钟内同步500GB MySQL 数据至 Doris

NineData

MySQL 数据库 Doris 数据迁移 数据实时同步

大数据平台安全主要是指什么安全?如何保障?

行云管家

大数据 数据 大数据平台 大数据平台安全

Sentieon | 每周文献-Clinical Trial-第十一期

INSVAST

基因测序 临床试验

生成式AI掀起创意新革命

百度开发者中心

#人工智能 AI作画 生成式AI 文心一言

生成式AI:游戏研发的革命者

百度开发者中心

游戏开发 #人工智能 生成式AI 文心一言

Sentieon | 应用教程: 关于读段组的建议

INSVAST

代码 教程 字段 基因测序

直播预告|没有 “专业” 的向量数据库,大模型就玩不转了吗?

Zilliz

非结构化数据 Milvus Zilliz AIGC 向量数据库

生成式AI:改变生活创造未来

百度开发者中心

#人工智能 ChatGPT 生成式AI 文心一言

SphereEx DBPlusEngine - 更全面、更便捷的 ShardingSphere 商业版功能全览

SphereEx

数据库

Cloudera宣布与博德研究所合作_大数据_Dylan Raithel_InfoQ精选文章