Databricks Runtime 6.3 for Genomics(不支持)

Databricks于2020年1月发布了这张图片。

Databricks Runtime for Genomics (Databricks Runtime Genomics)是一种变体Databricks Runtime 6.3(不支持)针对基因组和生物医学数据进行了优化。它是Databricks基因组学统一分析平台的一个组成部分。bob体育亚洲版bob体育客户端下载

有关更多信息,包括创建Databricks用于基因组学集群的运行时的说明,请参见基因组学导游.有关开发基因组学应用程序的更多信息,请参见基因组学导游

新功能

Databricks Runtime 6.3 for Genomics是建立在Databricks Runtime 6.3之上的。有关Databricks Runtime 6.3中的新功能的信息,请参见Databricks Runtime 6.3(不支持)发行说明。

来自达美航空的联合基因分型管道

联合基因分型在Databricks Runtime 6.3 for Genomics中,现在可以将DNASeq管道编写的Delta表作为输入。该功能允许您同时使用这两个管道,而无需将结果导出到gvcf。

读取vcf时自动解析注释

版本发光包括在Databricks Runtime 6.3 for Genomics自动解析CSQ而且读取vcf时的INFO字段。INFO_CSQ而且INFO_ANN结果dataframe中的字段现在具有简化查询的结构化模式。

改进

改进的多等位基因变异分裂器

Glow和Databricks Runtime for Genomics中的多等位基因变异分配器现在可以处理更复杂类型的多等位基因位点。新的行为反映了vt分解命令行工具。此外,您现在可以通过调用glow.transform(“split_multiallelics”……

更快的线性和逻辑回归函数

logistic_regression_gwasDatabricks Runtime 6.3 for Genomics的函数比6.2版本快60%左右。linear_regression_gwas大约快50%。