一种云兼容的生物信息学管道,用于从新一代临床样本测序中快速鉴定病原体
摘要
无偏倚的下一代测序(NGS)方法能够在临床微生物实验室进行全面的病原体检测,并在公共卫生监测、疫情调查和传染病诊断方面有许多应用。然而,在临床相关的时间框架内准确分析结果的生物信息学挑战阻碍了该技术的实际部署。在这里,我们描述了SURPI(“基于序列的超快速病原体鉴定”),这是一种从临床样本生成的复杂宏基因组NGS数据中进行病原体鉴定的计算管道,并演示了该管道在分析237个临床样本(包括超过11亿个序列)中的使用。SURPI可部署在基于云的服务器和独立服务器上,利用两个最先进的对准器进行加速分析,SNAP和RAPSearch,它们与现有的生物信息学工具一样准确,但性能要快几个数量级。在快速模式下,SURPI在11分钟至5小时内扫描7 - 5亿个读取数据集检测病毒和细菌,而在综合模式下,所有已知微生物都被识别出来,然后在50分钟至16小时内从头组装和蛋白质同源性搜索不同的病毒。SURPI还直接促进了急性患者的实时微生物诊断。强调了其在需要快速周转时间的传染病中开发无偏倚的基于ngs的临床分析的潜在关键作用。