Soren Neo4j图分析的软件工程师团队专注于大数据查询执行和图算法。他的兴趣盖在大数据环境中使用数字如火花SQL。加入Neo4j之前,他在莱比锡大学学习。
火花3.0引入了一个新的模块:火花图。火花图添加了流行的查询语言密码,其附带的属性图模型和图算法的数据科学的工具箱。有大量有用的图表应用推荐,欺诈检测和研究。
睡眠是一个开源库API兼容火花图和扩展其功能:
我们将演示如何在火花探索数据,用睡眠来将数据转换为一个属性图,然后在Neo4j构建图形解决方案。
关系是最预测指标之一的行为和偏好。社区检测基于关系推断是一个功能强大的工具在同辈群体偏好相似,预测未来的行为,评估组织弹性,发现层次结构和其他数据分析做准备。中心措施基于关系识别网络中最重要的项目,帮助我们理解组织动力学等影响,可访问性,传播速度的东西,和团体之间的桥梁。数据科学家们用图算法识别组织和基于估计重要的实体交互。在这个会话中,我们将介绍社区检测的常见用途和中心措施以及一些标志性的图算法计算值。我们将展示如何运行的例子社区检测和中心算法在Apache火花包括使用AggregateMessages函数添加自己的算法。您将学习的最佳实践和技巧对于棘手的情况。对于那些想在图形平台运行图形算法,我们还将说明在Neo4j几个例子。bob体育客户端下载
一些社区检测算法包括:
*三角形数和聚类系数来估计网络凝聚力
*强连通组件和连接组件发现集群
*标签传播快速推断出组织和数据清洗与semi-supervised学习
*鲁汶模块化发现组层次结构平衡的三合会识别不稳定组
* PageRank来揭示影响者
*中间性中心预测瓶颈和桥梁