使用Apache火花MLlib砖

Apache火花MLlib是Apache火花机器学习库组成的常见的学习算法和工具,包括分类、回归、聚类、协同过滤、降维,底层优化原语。砖推荐以下Apache火花MLlib指南:

例如笔记本电脑

以下笔记本演示如何使用各种Apache火花MLlib特性使用砖。

二进制分类示例

这个笔记本电脑向你展示了如何构建一个二进制分类应用程序使用Apache火花MLlib管道API。

二进制分类笔记本

在新标签页打开笔记本

决策树的例子

这些例子展示各种决策树的应用使用Apache火花MLlib管道API。

决策树

这些笔记本电脑演示如何执行与决策树分类。

决策树的数字识别笔记本

在新标签页打开笔记本

决策树从SFO调查笔记本

在新标签页打开笔记本

GBT回归使用MLlib管道

这个笔记本电脑向你展示了如何使用MLlib管道使用梯度推动执行回归树来预测自行车租赁数量(每小时)的信息,比如星期天气,季节,等等。

自行车共享回归笔记本

在新标签页打开笔记本

Apache火花MLlib管道和结构化流的例子

这个笔记本显示如何培养一个Apache火花MLlib管道在历史数据和应用于流媒体数据。

MLlib管道结构流笔记本

在新标签页打开笔记本

先进的Apache火花MLlib例子

这个笔记本演示了如何创建一个定制的变压器。

定制变压器笔记本

在新标签页打开笔记本

MLlib特性信息供参考,砖建议以下Apache火花API参考:

使用Apache火花MLlib从R,请参阅R机器学习文档。

砖支持可视化的机器学习算法,请参阅机器学习的可视化