机器学习库(MLlib)

回到术语表
Apache火花的机器学习库(MLlib)被设计为简单起见,可伸缩性,并且很容易与其他工具的集成。与可伸缩性、语言兼容性,和速度的火花,科学家可以专注于他们的数据和模型,而不是解决问题的复杂性围绕分布式数据(如基础设施、配置等)。之上的火花,MLlib是一个可扩展的机器学习库组成的常见的学习算法和工具,包括分类、回归、聚类、协同过滤、降维,底层优化原语。火花MLLib无缝集成与其他组件(如火花引发SQL,引发流,和DataFrames砖安装的运行时。图书馆是可用的Java, Scala和Python作为火花应用程序的一部分,这样你就可以把它完整的工作流。MLlib允许预处理,绿豆,训练模型,预测在数据规模。您甚至可以使用模型训练MLlib结构化流进行预测。火花提供了一个先进的机器学习API来执行各种各样的机器学习任务,从分类、回归、聚类深度学习。

额外的资源


回到术语表