按需网络研讨会:Regeneron如何用Apache Spark加速生物银行规模的基因组发现TM

基因组学领域已经成熟到一个阶段,DNA测序项目已经达到人口规模。虽然许多组织已经投资于像英国生物银行这样的大型基因组数据集,但很少有专业知识或适当的技术架构来将这些大量的原始DNAseq数据转化为可操作的见解。

Regeneron是一家领先的生物技术公司,致力于创造治疗创新,已经建立了世界上最全面的基因数据库之一,拥有超过50万个外显子组。在将这些数据转化为新的治疗方法的过程中,Regeneron遇到了许多挑战。例如,如何对>300B数据点进行快速而准确的查询?如何加快对结核病规模数据进行新颖的统计检验?

在本次会议上,Regeneron将分享他们在建立世界上最大的基因数据库时所面临的挑战,他们如何通过由Apache Spark™、Databricks和AWS支持的可扩展和高性能的信息基础设施克服这些挑战,以及一路走来学到的关键经验教训。

参加本次网络研讨会,了解:

  • 关于基因组学在Regeneron加速药物开发中的作用
  • 将50万外显子体和电子医疗记录转化为可操作的见解,他们面临着多大的挑战
  • Apache Spark、Databricks和AWS如何使他们能够轻松地扩展信息学并将查询速度提高600倍
  • 演示由Apache Spark和Databricks支持的全基因组疾病风险评分的机器学习模型

立即观看