10 月 23 - 25 日,QCon 上海站即将召开,现在购票,享9折优惠 了解详情
写点什么

Cloudera 宣布与博德研究所合作

  • 2016-06-15
  • 本文字数:946 字

    阅读完需:约 3 分钟

根据 Cloudera 上月报道,他们将会与博德研究所共同合作研究博德研究所的Genome Analysis Toolkit 第四代产品Hellbender(GATK4)。InfoQ 之前对其进行过相关报道

Cloudera 的生命科学部门负责人 Shawn Dolley 称 GATK4 可以节约成本,并减少了研发时间,并同时宣布有关博德研究所与各种云 IaaS 提供商的广泛合作,但不提供定量的标准。Dooley 提到了合作工作所能带来的优势,

2014 年 Cloudera 与 Spark 之间的合作,推动我们成为首个可以交付、支持并提供 Spark 培训的 Hadoop 供应商。我们很荣幸可以将我们的专业知识运用到多 omic 生物标志分析领域,投资基于 Spark 的生物信息学标准,并与博德研究所合作创造下一代 GATK 产品。这种低成本的基因组测序和大数据技术的领先技术相结合,代表着我们可以更广泛地对患者的基因组进行测序,并产生之前从未得到过的数据集。

云平台的用例和架构注重于避免重复的基础设施,并推进最佳实践,使用户可以深入理解观察疾病和治疗方法,而不仅仅是管理基础设施。博德研究所数据科学和数据工程高级总监、GATK 软件包创始人 Eric Banks 博士说,

博德研究所的 GATK 产品目前有超过 31000 名注册用户。绝大多数用户建立了本地计算存储基础设施,以处理需要进行基因分析的庞大信息。这些合作将为我们消除传统技术的限制,同时给予相同高质量数据处理水平提供新的机会。

关于 GATK 之前的版本到 GATK4 之间性能的提升,Bank 表示,

在 Cloudera 企业版中使用 Spark 计算框架,给予了我们在 GATK3 上因其计算复杂程度无法实现的工具。在 Cloudera
企业版上,我们现在可以以快于先前版本的 GATK 两个数量级的速度来运行基因数据分析,加速反复分析,推进基因创新。

博德研究所与 laaS 提供商的广泛合作旨在让下一代 GATK Spark 可以基于 SaaS 模型使用,让用户可以通过不同的 laaS 登录 GATK4,而不受特定提供商的限制。GATK4 最早将在今年发布,根据提供商不同价格也会不同。免费的许可证将会提供给学术研究,而收费的许可证将可以供给商业用户使用。

查看英文原文 Cloudera Announces Partnership with the Broad Institute


感谢张龙对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2016-06-15 19:001659
用户头像

发布了 218 篇内容, 共 76.4 次阅读, 收获喜欢 76 次。

关注

评论

发布
暂无评论
发现更多内容

深度学习进阶篇-预训练模型[2]:Transformer-XL、Longformer、GPT原理、模型结构、应用场景、改进技巧等详细讲解

汀丶人工智能

人工智能 深度学习 nlp 预训练模型 Transformer

财务共享中心释放企业“数据”生产力

用友BIP

财务共享

1个Java程序员需要具备什么样的素质和能力才可以称得上高级工程师?

Java永远的神

程序员 后端 架构师 java面试 Java性能优化

公网对讲SDK——对讲应用场景

anyRTC开发者

音视频 视频会议 指挥调度 快对讲 公网对讲

文档关键信息提取形成知识图谱:基于NLP算法提取文本内容的关键信息生成信息图谱教程及码源(含pyltp安装使用教程)

汀丶人工智能

nlp 知识图谱 信息抽取 命名实体识别 pyltp

MobPush 合规指南

MobTech袤博科技

构建高可用云原生应用,如何有效进行流量管理?

华为云开发者联盟

云原生 后端 华为云 华为云开发者联盟 企业号 5 月 PK 榜

Elasticsearch之join关联查询及使用场景 | 京东云技术团队

京东科技开发者

数据库 elasticsearch sql join 企业号 5 月 PK 榜

CMake常用命令大全:提高项目构建效率

小万哥

程序员 面试 后端 C/C++ cmake

为什么说财务共享是财务数智化转型的基石?

用友BIP

财务共享

[杂谈]百度飞浆环境配置

alexgaoyh

ubuntu gpu cuda cudnn PaddlePaddl

首个机器学习实时特征平台测试基准论文被 VLDB 2023 录取

第四范式开发者社区

人工智能 机器学习 数据库 开源 特征

羊了个羊游戏|链游dapp系统开发方案

Congge420

一名开发者眼中的 TiDB 与 MySQL 的选择丨TiDB Community

PingCAP

MySQL 数据库 TiDB

Chrome分组插件

soap said

Chrome插件

CST 电磁仿真计算时,为什么要关闭超线程?【操作教程】

思茂信息

cst cst使用教程 cst电磁仿真 cst仿真软件

【参考设计】16芯串联电池包储能系统

元器件秋姐

芯片 电池 元器件 电源 驱动器

Gamefi很有潜力?分析链游gamefi系统开发源码!

Congge420

对话 ONES 联合创始人兼 CTO 冯斌:技术管理者如何打造一支自驱型团队?

万事ONES

CFS第十二届财经峰会7月举行, 候选品牌:行云管家

行云管家

云计算 商业 财经峰会

什么是数字藏品|数字藏品系统开发源码?

Congge420

成功加冕!用友大易获评2023最佳招聘管理软件供应商

用友BIP

招聘

3种分页列表缓存方式,速收藏~~

华为云开发者联盟

开发 华为云 华为云开发者联盟 企业号 5 月 PK 榜

前端微服务无界实践 | 京东云技术团队

京东科技开发者

微服务 前端 企业号 5 月 PK 榜 无界

5人5月用容器技术保卫蓝天

华为云开发者联盟

云计算 后端 华为云 华为云开发者联盟 企业号 5 月 PK 榜

又一开发者公布高分方案源代码,助力软件杯选手高效解题

飞桨PaddlePaddle

百度飞桨 中国软件杯

索信达两大营销创新产品获官方认可,都有哪些创新亮点?

索信达控股

Cloudera宣布与博德研究所合作_大数据_Dylan Raithel_InfoQ精选文章