超过95%的所有实验药物,目前药物开发管道预计将失败。改善这些努力,Regeneron遗传学中心建立一个最全面的遗传学数据库和电子健康记录外显子测序的配对超过400000人。然而,他们面临许多挑战分析这些巨大的数据集:
基因组和临床数据是高度分散的,使得它很难分析和培训模式对整个10 tb的数据集。
困难和昂贵的扩展他们的遗产架构以支持对超过800亿数据点的分析。
只是想ETL数据团队花天数据,以便它可以用来分析。
砖为Regeneron提供了一个平台上运行的AWS,简化了操作,通过改进的bob体育客户端下载数据科学生产率加速药物发现。这是赋予他们以新的方式分析数据,以前是不可能的。
自动化集群管理:简化了集群的配置,减少时间DevOps工作所以工程师和数据科学家可以花更多的时间在高价值的任务。
互动工作区:允许数据科学家分享数据和见解,促进透明度和协作的环境在整个药品开发生命周期。
高性能Spark-powered管道:显著提高可靠性和速度的ETL管道用于处理10 tbs的EHR + DNAseq数据。
砖,团队Regeneron DevOps工作不再需要浪费过多的资源建立和维护基础设施来支持他们的分析。今天,生物信息学团队、数据科学家和计算生物学家可以花更多的时间在高价值的任务,比如小说发展新的治疗方法。
加速药物目标识别:减少了时间数据科学家和计算生物学家在整个数据集上运行查询从30分钟3秒- 600 x改进!
提高生产率:改进的协作,自动化DevOps和加速管道2天vs 3周(ETL)使他们的团队来支持更广泛的研究。