机器学习

本节包括笔记本例子显示如何使用砖火车模型使用最流行的包。

scikit-learn

scikit-learn是一种最流行的Python库单节点机器学习。它是包含在砖运行时和砖运行时毫升。砖的运行时版本说明scikit-learn库版本包含在您的集群的运行时。

MLlib

Apache火花MLlib是Apache火花机器学习库组成的常见的学习算法和工具,包括分类、回归、聚类、协同过滤、降维,底层优化原语。

XGBoost

XGBoost是一个受欢迎的机器学习库专门为培训决策树和随机森林。是包含在砖运行时毫升。在砖上安装XGBoost运行时的信息,或在砖上安装一个定制的版本运行时毫升,明白了这些指令

你可以训练XGBoost模型在单个机器上或在一个分布式的方式。