Spark 3.0中的图特性:Spark Graph中集成图查询和算法-继续

Spark 3.0引入了一个新的模块:Spark Graph。Spark Graph将流行的查询语言Cypher,其附带的属性图模型和图算法添加到数据科学工具箱中。图表在推荐、欺诈检测和研究方面有大量有用的应用。本教程旨在帮助您理解何时应该使用图形,以及如何使用Spark Graph来扩展分析工作流。在本教程中,我们将探索图查询和图算法背后的概念和动机,新Spark graph模块的组件及其api,以及这些api如何允许您成功地编写自己的图应用程序并将其集成到数据科学工作流程中。

本教程混合了演示文稿、代码示例和笔记本。我们将演示如何编写操作不同类型输入数据的端到端Graph应用程序。我们将展示Spark Graph如何与Spark SQL和openCypher Morpheus交互,这是一个Spark Graph扩展,允许您轻松管理多个图形,并为Neo4j图形数据库以及Cypher语言扩展提供内置的属性图数据源。在教程结束时,与会者将很好地理解何时在数据科学工作流程中应用图形,如何将Spark Graph引入现有的Spark工作流程,以及如何充分利用新的api。

本教程将由演讲者和实践互动环节共同指导。教程材料将在演示期间提供。

试着砖
查看更多Spark + AI欧洲峰会2019视频


«回来
关于马茨·里德伯格

Neo4j

Mats已经与Neo4j合作了四年多,专注于图形查询语言的设计和实现。Mats领导了Cypher for Apache Spark (CAPS)项目的开发,该项目现在被称为Morpheus,它已被接受为Spark 3.0的主要特性,命名为Spark Graph,并将把领先的图查询语言Cypher引入Apache Spark。Mats拥有计算机科学硕士学位,专门研究图算法。

关于Max Kießling

Neo4j

Max是Neo4j的软件工程师。他拥有莱比锡大学的硕士学位,在那里他从事声明性图查询的分布执行。在Neo4j,他是负责开发Apache Spark / Morpheus Cypher以及图形算法库的团队的一员。