Spark 3.0引入了一个新的模块:Spark Graph。Spark Graph将流行的查询语言Cypher,其附带的属性图模型和图算法添加到数据科学工具箱中。图表在推荐、欺诈检测和研究方面有大量有用的应用。本教程旨在帮助您理解何时应该使用图形,以及如何使用Spark Graph来扩展分析工作流。在本教程中,我们将探索图查询和图算法背后的概念和动机,新Spark graph模块的组件及其api,以及这些api如何允许您成功地编写自己的图应用程序并将其集成到数据科学工作流程中。
本教程混合了演示文稿、代码示例和笔记本。我们将演示如何编写操作不同类型输入数据的端到端Graph应用程序。我们将展示Spark Graph如何与Spark SQL和openCypher Morpheus交互,这是一个Spark Graph扩展,允许您轻松管理多个图形,并为Neo4j图形数据库以及Cypher语言扩展提供内置的属性图数据源。在教程结束时,与会者将很好地理解何时在数据科学工作流程中应用图形,如何将Spark Graph引入现有的Spark工作流程,以及如何充分利用新的api。
本教程将由演讲者和实践互动环节共同指导。教程材料将在演示期间提供。
Spark 3.0引入了一个新的模块:Spark Graph。Spark Graph将流行的查询语言Cypher,其附带的属性图模型和图算法添加到数据科学工具箱中。图表在推荐、欺诈检测和研究方面有大量有用的应用。本教程旨在帮助您理解何时应该使用图形,以及如何使用Spark Graph来扩展分析工作流。在本教程中,我们将探索图查询和图算法背后的概念和动机,新Spark graph模块的组件及其api,以及这些api如何允许您成功地编写自己的图应用程序并将其集成到数据科学工作流程中。
本教程混合了演示文稿、代码示例和笔记本。我们将演示如何编写操作不同类型输入数据的端到端Graph应用程序。我们将展示Spark Graph如何与Spark SQL和openCypher Morpheus交互,这是一个Spark Graph扩展,允许您轻松管理多个图形,并为Neo4j图形数据库以及Cypher语言扩展提供内置的属性图数据源。
在教程结束时,与会者将很好地理解何时在数据科学工作流程中应用图形,如何将Spark Graph引入现有的Spark工作流程,以及如何充分利用新的api。本教程将由演讲者和实践互动环节共同指导。教程材料将在演示期间提供。