报名「音视频前端技术创新实践专场」,听腾讯云技术专家揭秘音视频相关技术>> 了解详情
写点什么

BenchSci 通过 Google Cloud 帮助制药公司交付新药

  • 2021 年 3 月 25 日
  • 本文字数:1525 字

    阅读完需:约 5 分钟

BenchSci 通过 Google Cloud 帮助制药公司交付新药

每个初创企业都应该有一个崇高的目标,即使他们不能 100%地确定自己将如何实现目标。我们的公司 BenchSci 是一家加拿大生物技术初创公司,其使命是帮助科学家将新药研发速度提高 50%。自 2015 年公司成立以来,我们在建立一个平台,以帮助科学家通过挖掘和开发新药大量公共数据集,研究文章和专有客户数据集。该平台完全建立在 Google Cloud 之上,Google Cloud 为医疗技术提供功能的广度和深度为我们朝着目标迈进提供了支持。

 

由于制药研发效率低下,因此我们的任务迫在眉睫。以临床前研究为例:一项研究估计临床前研究支出的一半是浪费的,仅在美国每年就达到 282 亿美金,在全球达到 486 亿美金。根据我们的估计,大约 36.1%的临床前研究浪费来自科学家,他们使用了不适当的试剂,诸如生命科学实验中使用的抗体之类的材料。

 

因此,我们的第一款产品是 AI 辅助试剂选择工具。它收集相关的科学论文和试剂目录,使用专有的机器学习模型从中提取相关的数据点,使结果以易于使用的界面搜索方式提供。根据现有的实验证据,科学家们可以快速地预先确定一种特定的试剂是否适合他们的实验。这样,他们可以将精力集中在最有可能产生成果的实验上,并更快地为患者提供新的治疗方法。

 

所有这些都在 Google Cloud 上运行。我们收集论文和文章、产品目录、医学和生物学数据库以及其他数据,并将它们存储在 Cloud Storage 中。然后,我们使用 Dataflow 、BigQuery 和其他工具构建的管道来组织和提取数据的见解。接下来,我们使用机器学习算法处理数据,并将结果存储在 Cloud SQL 和 Cloud Storage 中。科学家们通过基于 Google Kubernetes Engine( GKE ), Cloud Load Balancer ,身份识别代理, Cloud CDN , Cloud DNS 和其他服务的 Web 界面访问结果。最后,我们使用多个云项目,IAM 和 Infrastructure-as-code (基础架构即代码)来确保数据安全和隔离每个客户。除了最专业的研发架构和操作之外,我们不再需要其他东西,从而大大减少了管理费用。

 

Google Cloud 托管服务与易于扩展的持久性容器和虚机的结合,使我们能够快速对新功能进行原型设计和测试,然后以最少的管理工作将它们投入生产。

 

Google Cloud 还可以根据 BenchSci 的需求进行扩展。例如,过去三年来,我们分析的数据增加了一个数量级。切换到 BigQuery (无服务器数据仓库)和 Cloud SQL (托管的关系型数据库)消除了我们的大量运营开销,还要感谢 BigQuery 在文本处理机器学习管道中设置关键步骤的灵活性以及 Cloud SQL 在数据访问方面的稳定性。

 

随着时间的推移,我们还改进了数据处理流程。我们从 Dataproc (托管的 Hadoop 服务)开始,后来利用 Dataflow (使用 Apache Beam )重写了该系统。数据流可以处理数百 TB 的数据,让我们专注于实现业务逻辑,而不是管理基础架构。

 

最近,我们扩展了平台以支持私有数据集。最初,我们为所有客户提供对同一基础公共数据的不同视图。但是,随着时间的推移,一些客户问我们是否可以在系统中包括他们专有的药理数据。我们没有使用严格的项目隔离来管理多租户系统,而是利用 GKE 和 Config Connector 为每个客户的数据创建独有的环境,而不会增加团队的运维工作量。

 

简而言之,Google Cloud 使我们能够专注于解决问题,而不必因构建和运营计算基础架构和服务而分心。展望未来,在 Google Cloud 上运营使我们有信心通过收集更多和更广泛的数据源来成长;使用机器学习算法从每个数据单元中提取更多信息;处理更广泛,更专有的数据;通过各种接口和访问点来满足更广泛的客户需求。我们的目标仍然雄心勃勃,但是通过与 Google Cloud 合作,感觉可以实现。

 

在 Google Cloud 上的知名医疗客户包括了罗氏、拜耳、赛诺菲、薛定谔等。

 

了解有关医疗保健和生命科学解决方案的更多信息

2021 年 3 月 25 日 17:53602

评论

发布
暂无评论
发现更多内容

话题讨论 | 你现在还会推荐亲朋做程序员吗?

石云升

话题讨论 2月春节不断更

最基础的3道java面试题,你真的答得上来吗

田维常

面试

如何理解Linux系统SSH协议和原理

Changing Lin

Linux 2月春节不断更

谁再把IDEA的Project比作Eclipse的Workspace,我就跟谁急

YourBatman

eclipse IntelliJ IDEA Project Workspace

DIY一款能随周围环境变化的智能灯泡,求婚必备!

IoT云工坊

人工智能 物联网 人脸识别 sdk IoT App

面试杀手锏!2021最新Android常用开源库总结,Android校招面试指南

欢喜学安卓

android 程序员 面试 移动开发

大白话详解5种网络IO模型

程序员小毕

Java 面试 io 网络 高性能

点赞系统软件开发

luluhulian

字节面试太刁钻了:不加机器,怎么提升系统并发100倍

Java架构师迁哥

new的过程是怎样的?看完这一篇就懂了

codevald

Java JVM原理 面向对象编程 类对象

GraphX 在图数据库 Nebula Graph 的图计算实践

Nebula Graph

图数据库 图数据库实战

博文视点算法书单|让算法学习不再难

博文视点Broadview

GitHub星标数超4.2万的火爆之作!

博文视点Broadview

领域的边界,一个小讨论

李小腾

领域驱动设计 DDD

k8s-client-go源码剖析(三)

远鹏

Go Kubernetes Kubernetes源码

第三周

ALone

LeetCode题解:69. x 的平方根,二分查找,JavaScript,详细注释

Lee Chen

算法 LeetCode 前端进阶训练营

GitHub上标星75k+超牛的《Java面试突击版》,分享PDF离线版

Crud的程序员

Java 程序员 架构 算法

MySQL字段类型最全解析

Simon

MySQL 数据库数据类型

Elasticsearch 从 0 到千万级数据查询实践

📿

Java spring elasticsearch Spring Cloud spring data

再迎巅峰!阿里爆款分布式小册开源5天Github已73K

程序员小毕

Java 程序员 面试 分布式 微服务

两个高频设计类面试题:如何设计HashMap和线程池

yes

面试 hashmap 线程池

勿让 Docker Volume 引发 Terminating Pod

黄久远

Docker 云计算 Kubernetes 容器 云原生

单例模式原来是这么简单?!

后台技术汇

28天写作 2月春节不断更

一款基于 WEB 的通用数据管控工具 - CloudQuery

侯林捷

开发工具 运维工程师 dba 数据库管理工具

CodeDay#5 全程回顾——一场关于动态化开发实践的技术探讨

蚂蚁集团移动开发平台 mPaaS

mPaaS Codeday 技术沙龙

运动健身市场越来越大,你的客户却越来越少?

IoT云工坊

人工智能 App 物联网 健身房 智能健身房

面试看这个就够了!6年菜鸟开发面试字节跳动安卓研发岗,学习路线+知识点梳理

欢喜学安卓

android 程序员 面试 移动开发

2020已过,2021来临,iOS 开发市场如何?一切都是未知!【未来可期】

ios 程序员

软件架构模式之事件驱动架构

架构精进之路

软件架构 七日更 28天写作 2月春节不断更

「JWT」,你必须了解的认证登录方案

Crud的程序员

Java 架构

数据cool谈(第2期)寻找下一代企业级数据库

数据cool谈(第2期)寻找下一代企业级数据库

BenchSci 通过 Google Cloud 帮助制药公司交付新药-InfoQ