托管火花是什么?

Apache火花是一个快速和大数据集群计算系统建立在速度、易用性和先进的分析,最初建于2009年在加州大学伯克利分校。高层在Scala api,它提供了Java、Python、R和一个优化引擎,支持数据分析的通用计算图形。此外,它还支持其他一些工具,如火花SQL SQL和DataFrames MLlib机器学习,GraphX对于图形处理,并引发流流处理。

数据探索火花提供两种模式:

  • 互动
  • 批处理

火花勘探模式简化用户交互,火花也提供给组织一个统一的数据平台托管。bob体育客户端下载在没有直接访问引发资源的远程应用程序,用户不得不面对更长的路线生产。为了克服这个障碍,创建服务,使远程应用程序有效地连接到一个火花从任何地方集群在一个REST API。这些接口支持的执行代码片断或程序在本地或运行在Apache火花上下文Hadoop纱线。主持火花接口被证明是交钥匙解决方案,因为他们促进火花和应用服务器之间的交互,简化交互式的web和移动应用程序所需的架构。

主持火花服务提供这些特性:

  • 交互式Scala、Python和R覆盖物
  • 批量提交在Scala中,Java、Python
  • 多个用户可以共享相同的服务器
  • 允许用户提交的工作从任何地方通过休息
  • 不需要任何代码更改程序做的做

组织现在可以轻松地克服现有的瓶颈,阻碍他们实施引发的能力,相反,专注于捕捉大数据的价值承诺。

额外的资源

回到术语表