Databricks运行时7.1 for Genomics(不支持)

Databricks于2020年7月发布了这张图片。

Databricks运行时7.1 for Genomics是一个版本Databricks运行时7.1(不支持)针对基因组和生物医学数据进行了优化。它是Databricks基因组学统一分析平台的一个组成部分。bob体育亚洲版bob体育客户端下载

有关更多信息,包括创建Databricks用于基因组学集群的运行时的说明,请参见基因组学导游.有关开发基因组学应用程序的更多信息,请参见基因组学导游

新功能

Databricks Runtime 7.1 for Genomics是建立在Databricks Runtime 7.1之上的。有关Databricks Runtime 7.1中的新特性的信息,请参见Databricks运行时7.1(不支持)发行说明。

发疯的转换

Glow现在提供了一个函数transform_loco使用保留一条染色体(LOCO)策略进行gllowgr岭回归转换。划分预测表型值避免了下游关联测试中的近端污染。的GloWGR文档演示新用法。

GloWGR输出重塑功能

Glow现在提供了一个函数reshape_for_gwas将GloWGR的表型估计输出从Pandas数据帧转换为Spark数据帧,与Glow全基因组关联研究(GWAS)兼容回归函数.的GloWGR文档反映新的用法。

改进

RNASeq输出未配对的对齐

RNASeq管道现在从STAR输出未配对的对齐。这些以前被放弃了,只支持配对对齐。

以下部分列出了Databricks Runtime 7.1 for Genomics中包含的不同于Databricks Runtime 7.1的库。

包装库

图书馆

版本

亚当

0.32.0

GATK

4.1.4.1

Hadoop-bam

7.9.2

samtools

1.9

VEP

96