准备数据和环境毫升和DL

本节描述如何准备你的数据和你的数据砖机器学习更深的学习环境。

准备数据

文章在这一节中包含加载和数据预处理的各个方面的ML和DL应用程序。

准备环境

砖运行时机器学习(砖运行时的ML)是一个准备好环境优化的机器学习和数据科学。砖运行时毫升包含许多外部库,包括TensorFlow PyTorch, Horovod, scikit-learn XGBoost,提高性能和提供扩展,包括GPU加速XGBoost、分布式深度学习使用HorovodRunner,检查点使用模型砖(DBFS)保险丝挂载文件系统

使用砖运行时毫升,选择ML版本的运行时当你创建您的集群

请注意

在统一目录访问数据机器学习工作流,您必须使用一个单用户访问。共享集群不兼容数据砖运行时机器学习。

安装库

您可以安装额外的库来创建一个自定义你的笔记本或集群环境。

使用GPU集群

您可以创建集群GPU加速深度学习任务。创建砖GPU集群的信息,请参阅GPU-enabled集群。砖运行时毫升包括GPU硬件驱动程序和NVIDIA CUDA等库。