horovod.spark:分布式和Horovod深度学习

学习如何使用horovod.spark包执行分布式机器学习模型的训练。

horovod.spark在砖

砖支持horovod.spark包,它提供了一个估计量的API,您可以使用与Keras和PyTorch毫升管道。有关详细信息,请参见Horovod在火花,其中包括一段Horovod砖上

请注意

  • 砖安装horovod包和依赖关系。如果你升级或降级这些依赖项,可能存在兼容性问题。

  • 当使用horovod.spark在Keras使用自定义回调,你必须保存模型TensorFlow SavedModel格式。

    • 与TensorFlow 2。x,使用.tf文件名后缀。

    • 与TensorFlow 1。x,设置选项save_weights_only = True

需求

砖运行时毫升

例如:分布式训练功能

这是一个基本的例子运行分布式训练函数使用horovod.spark:

def火车():进口horovod.tensorflow作为hvdhvd初始化()进口horovod.sparkhorovod火花运行(火车,num_proc=2)

示例笔记本:Horovod火花估计使用Keras和PyTorch

以下笔记本演示如何使用Horovod火花Keras和PyTorch估计API。

Horovod火花估计Keras笔记本

在新标签页打开笔记本

Horovod火花估计PyTorch笔记本

在新标签页打开笔记本