客户的故事

发现新的治疗方法和人工智能

600 x

改善查询运行时在整个数据集

10倍

更快的数据管道使团队能够支持更多的研究

regeneron客户
行业:生命科学
解决方案:基因关联研究
bob体育客户端下载平台用例:三角洲湖,数据科学,机器学习,ETL
:AWS

“砖平台是使每个人在我们的集成药bob体育客户端下载物开发过程——从作为计算生物学家——轻松访问、分析和提取的见解从我们所有的数据。”

——jeffrey里德博士Regeneron基因组信息学主管

Regeneron的使命是利用基因组数据的力量需要给患者带来新的药物。然而,将这些数据转换为改变生活从来没有发现和有针对性的治疗更具挑战性。加工性能和可伸缩性差的局限性,他们的数据团队缺乏什么他们需要分析pb级的基因组和临床数据。砖现在使他们快速分析整个基因组数据集快速加速的发现新疗法。

分散的基因组数据块机器学习

超过95%的所有实验药物,目前药物开发管道预计将失败。改善这些努力,Regeneron遗传学中心建立一个最全面的遗传学数据库和电子健康记录外显子测序的配对超过400000人。然而,他们面临许多挑战分析这些巨大的数据集:

  • 基因组和临床数据是高度分散的,使得它很难分析和培训模式对整个10 tb的数据集。

  • 困难和昂贵的扩展他们的遗产架构以支持对超过800亿数据点的分析。

  • 只是想ETL数据团队花天数据,以便它可以用来分析。

砖简化基础设施和大规模毫升

砖为Regeneron提供了一个平台上运行的AWS,简化了操作,通过改进的bob体育客户端下载数据科学生产率加速药物发现。这是赋予他们以新的方式分析数据,以前是不可能的。

  • 自动化集群管理:简化了集群的配置,减少时间DevOps工作所以工程师和数据科学家可以花更多的时间在高价值的任务。

  • 互动工作区:允许数据科学家分享数据和见解,促进透明度和协作的环境在整个药品开发生命周期。

  • 高性能Spark-powered管道:显著提高可靠性和速度的ETL管道用于处理10 tbs的EHR + DNAseq数据。

更快的发现新的药物和治疗方法

砖,团队Regeneron DevOps工作不再需要浪费过多的资源建立和维护基础设施来支持他们的分析。今天,生物信息学团队、数据科学家和计算生物学家可以花更多的时间在高价值的任务,比如小说发展新的治疗方法。

  • 加速药物目标识别:减少了时间数据科学家和计算生物学家在整个数据集上运行查询从30分钟3秒- 600 x改进!

  • 提高生产率:改进的协作,自动化DevOps和加速管道2天vs 3周(ETL)使他们的团队来支持更广泛的研究。