客户的故事

通过基于云的AI推进疾病疗法

200万年

基因组变异分析了15分钟

2药物靶点

发现神经退行性疾病如阿尔茨海默氏症和帕金森氏症

客户生原体
行业:生命科学
bob体育客户端下载平台用例:三角洲湖,数据科学,机器学习,ETL
:AWS

“砖允许我们专注于将特定的基因变异与特定疾病的科学——而不是浪费时间和带宽上云优化。”

——高级总监大卫·塞克斯顿基因组技术和信息,生原体

大规模基因组数据集转换制药公司怎样生原体确定新的治疗目标病人护理方法,提高现有治疗方法的疗效。但随着投资组合的研究项目,他们的基础设施和分析功能没有准备管理巨大的基因组数据集包括数十亿神经紊乱的结果。生原体把砖搬他们的本地数据基础设施变成了AWS云,大大减少了数据处理时间和增加带宽跨团队合作。通过提高可伸缩性和速度、疾病生物学家现在能够加深他们了解遗传变异,人类长寿,和神经状态发展世界各地的治疗和患者的治疗方法。

pb级的基因组数据驱动现代化

生原体使用人类基因证据等级的药物组合,发现新基因的目标,更好地理解生物神经系统疾病。但蒸馏pb级的基因组数据转换成明确的基因型和表现型之间的联系需要数据技术建立规模和适应——遗留解决方案是没有资格处理。

大量的健康和福祉数据处理从英国生物库的500000志愿者,生原体信息学面临重大挑战。在现有的数据中心存储容量不足在规模不可能收集和分析数据。他们的网络带宽无法处理如此多的信息传输和,2018年,这些问题导致了一周停机生原体的高性能计算集群。

“我们真的需要一个新的生原体数据范式,”大卫·塞克斯顿说的高级主管在生原体基因组技术和信息。“搬砖和云帮助我们可视化和分析我们的基因组数据在pb级别。”

简化信息和基础设施的规模

砖介绍了基因组学、砖的工作流运行时专门针对基因组数据,数据砖Lakehouse平台的一个组成部分。bob体育客户端下载它支持的全方位的需求,从最初的数据处理到大规模的统计分析。它还帮助移动数据团队架构,他们可以使用开源技术加速摄入和大型数据集的分析。bob下载地址

合作DNAnexus和砖,生原体迁移他们的本地数据基础设施云到亚马逊网络服务(AWS)。这些共同努力简化操作,并帮助降低平均数据处理时间。三角洲湖,生原体管道之前需要花了两个星期的时间来处理700000个变异,并优化它注释200万个变异在大约15分钟。

“英国生物库的数据集是具有挑战性的,因为它的规模和复杂性。有500000名参与者,我们正在处理数以百万计的变异和数据点,我们需要理解,“Sexton说。“建立一个高质量的数据集,我们必须处理这些变量,并将它们与健康和评估数据,所有东西都结合到一个大型语料库的数据,科学家们可以轻松查询。”

现在所需的存储和带宽支持他们的努力,生原体可以专注于数据科学生产力和针对新疗法。通过结合DNAnexus平台与砖基因组学,生原体能够bob体育客户端下载使用英国生物库数据来识别基因包含protein-truncating变异影响人类长寿和神经状态。这些发现导致了两个新的药物靶点的识别和发掘见解神经退行性疾病如阿尔茨海默氏症和帕金森氏症。

加快新发现的疾病治疗和疗法

“真正重要的数据是需要高质量的和一致的,“Sexton说。“砖允许我们专注于将特定的基因变异与特定疾病的科学——而不是浪费时间和带宽上云优化。”

确保高度精确,可查询数据库,生原体需要大量基于遗传对数据进行分区的位置。如此多的元数据在成千上万的列,垂直分区是至关重要的。这样是安全的;这是非常重要的保护数据的完整性,系统正在建设和研究人员获得。迁移到砖环境允许生原体拼接在许多方面的复杂数据,并将火花蜂巢Metastore集成到他们的平台对亲自监督数据安全访问控制模型。bob体育客户端下载

“砖使我们找到许多在六个不同的基因变异,所有这一切人类寿命产生重大影响,”Sexton说。“我们已经能够建立毫升模型,使我们能够理解基因组变异如何影响其他药物的功能和可能的成功发展。大大提高数据效率和发现,我们现在有一个独特的机会来更好地理解复杂疾病的生物学和发展靶向疗法来治疗他们。”