Databricks运行时6.2 for Genomics(不支持)

Databricks于2019年12月发布了这张图片。

Databricks Runtime for Genomics (Databricks Runtime Genomics)是一种变体Databricks Runtime 6.2(不支持)针对基因组和生物医学数据进行了优化。它是Databricks基因组学统一分析平台的一个组成部分。bob体育亚洲版bob体育客户端下载

有关更多信息,包括创建Databricks用于基因组学集群的运行时的说明,请参见基因组学导游.有关开发基因组学应用程序的更多信息,请参见基因组学导游

新功能

Databricks Runtime 6.2 for Genomics是建立在Databricks Runtime 6.2之上的。有关Databricks Runtime 6.2中的新功能的信息,请参见Databricks Runtime 6.2(不支持)发行说明。

弗斯logistic回归

版本发光包含在Databricks运行时6.2 for Genomics提供了一个弗斯logistic回归检验

用户定义的样品质量控制指标

您可以在数据框架中为每个样本聚合多个基因型aggregate_by_index.此函数允许您计算内置QC函数中包含的每个样品质量控制(QC)指标。

改进

管道变压器性能

的开销管变压器已经减少了大约一半。这种加速意味着您可以使用Databricks Runtime for Genomics来并行化命令行工具,而不会牺牲每核效率。

联合基因分型的鲁棒性

联合基因分型Databricks Runtime 6.2 for Genomics提供的更有效地处理包含数千个条目的样本清单。此外,管道现在通过插入显式的no-calls优雅地处理缺失的gVCF块。

简化与LOFTEE的集成

Databricks Runtime for Genomics中包含的VEP注释管道提供了与LOFTEE

冰雹0.26.0

Databricks运行时6.2基因组包括冰雹0.26.0。

Samtools 1.9

Samtools 1.9现在已安装。