托管Spark:ホスト型のSpark

用語集のトップペ,ジへ

ホスト型のSparkとは

Apache火花とは2009年にUCバークレーで,高速性,使いやすさ,高度な分析を中心として構築されたビッグデータ用の高速で汎用的なクラスタコンピューティングシステムです。Apache火花は,Scala、Java、Python、Rの高レベルAPIとデータ分析用の一般的な計算グラフをサポートする最適化されたエンジンを提供します。さらに、SQLとデータフレーム用の火花SQL,機械学習用のMLlib,グラフ処理用のGraphX,ストリーム処理用の火花ストリーミングなど,他にもいくつかのツールもサポートしています。

デタ探索のための2のSparkのモド

  • 対話型
  • バッチ
Spark探索モ,ドエンドユーザーとのインタラクションを簡素化するために,火花は統一されたホスト型データプラットフォームとして組織にも提供されます。リモートアプリケーションから火花リソースに直接アクセスできない場合,ユーザーは本番運用までに長い道のりを辿らなければなりませんでした。この障害を解決すべく,リモートアプリケーションがどこからでもREST APIを介して火花クラスタに効率的に接続できるサービスが開発されています。これらのンタフェスは,ロカルまたはApacheHadoop纱で実行される火花コンテキストでのコードや,プログラムのスニペットの実行をサポートします。ホスト型の火花インターフェースは,火花とアプリケーションサーバー間のインタラクションを促進し,インタラクティブなWebやモバイルアプリで必要なアーキテクチャを合理化するため,ターンキーソリューションであることが証明されています。

ホストされたSparkサビスの機能:

  • Scala, Python, Rへのescンタラクティブな対応
  • Scala, Java, Pythonでのバッチ送信
  • 複数のユ,ザ,による同じサ,バ,の共有
  • 休息を介してユ,ザ,がどこからでもジョブ送信が可能
  • コ,ドの変更は不要で,好みのプログラムコ,ドが使用できる作業環境
この機能は組織の火花の運用を妨げる既存のボトルネックの克服を容易にし,ビッグデータ分析を活用した価値の獲得を促進しています。

関連リソ,ス


用語集のトップペ,ジへ