Apache火花^™

Apache Spark est unMoteur d’分析unifiées超快速注入大数据和机器学习。Il首字母缩写été conçu à l'Université de californinie à Berkeley en 2009。

乐加大项目开源de traitement de données

代理代理，Apache火花， le moteur d’analyses unifiées，一个不同部门的企业的迅速发展。Des actor essentiels du monde de l'internet telels que Netflix, Yahoo et eBay ont déployé Spark à très grande échelle, traant ensemble plusieurs peta-octets de données sur Des clusters de plus de 8 000 neure。Cette communauté开源est rapidement devenue la + important du monde du big data avec + 1 000个贡献者+ 250个组织。
Spark - Apache Spark

L'équipe à L' origine du projet de recherche Spark à L' uc Berkeley a fondé Databricks en 2013。

Apache Spark est 100%开源，hébergé par la Fondation Apache, indépendante de tout fournisseur。Chez Databricks, nous nous engagement pleinement dans l'entretien de ce modèle de développement ouvert。主要丹斯拉主要avec la communauté Spark, Databricks继续à贡献者大规模au projet Apache Spark， à la fois par le développement et en faisant la promotion de la communauté。

Écosystème Apache Spark

Spark SQL + DataFrames

流媒体

MLlib机器学习

GraphX计算尺寸

API Spark Core

R

SQL

Python

Scala

Java

有阿帕奇火花吗?|阿帕奇星火的优势

Rapidite

Conçu de bout en bout dans une optique de performance, Spark peut s'avérer100 fois加上rapide que Hadoop pour le traitement de données à grande échelleEn explotant le calculation En mémoire et d'autres optimization。火花est également rapide sur les données stockées sur disque;Il détient à世界上真实的生命记录à大échelle de données sur disque。

Simplicite d 'utilisation

Spark possède des API simples d'utilisation pour travailler sur de grands ensembles de données。cell -ci成分符号un ensemble de plus de 100 opérateurs pour la transformation de données et des API familières pour DataFrames permettant la manipulation de données semi-structurées。

Un moteur unifié

Spark est livré avec des bibliothèques haut niveau qui prenent en charge les requêtes SQL, les données en flux, le机器学习et le tritement de。Ces bibliothèques标准渗透剂aux développeurs de gagner en productivité et peuvent se合成器设施pour créer des flux de travail complex。

Essayez gratuement Apache Spark sur le cloud Databricks

Databricks bob体育亚洲版Unified Anbob体育客户端下载alytics Platform offre une performance 5 fois + élevée que la solution Spark开源，des notebooks collaboratifs, des workflow intégrés et et de la sécurité pour l' enterprise - le tout en une seule Platform de cloud entièrement managée。

尝试砖

Le项目Apache Spark开源esttelechargeable ici．

Apache火花^™

Apache Spark est unMoteur d’分析unifiées超快速注入大数据和机器学习。Il首字母缩写été conçu à l'Université de californinie à Berkeley en 2009。

乐加大项目开源de traitement de données

L'équipe à L' origine du projet de recherche Spark à L' uc Berkeley a fondé Databricks en 2013。

Écosystème Apache Spark

Données structurées: Spark SQL

流式分析:Spark流式分析

机器学习:MLlib

计算图形:GraphX

Exécution générale: Spark Core

有阿帕奇火花吗?|阿帕奇星火的优势

Rapidite

Simplicite d 'utilisation

Un moteur unifié

Essayez gratuement Apache Spark sur le cloud Databricks

Apache火花™

Apache Spark est unMoteur d’分析unifiées超快速注入大数据和机器学习。Il首字母缩写été conçu à l'Université de californinie à Berkeley en 2009。

乐加大项目开源de traitement de données

L'équipe à L' origine du projet de recherche Spark à L' uc Berkeley a fondé Databricks en 2013。

Écosystème Apache Spark

Données structurées: Spark SQL

流式分析:Spark流式分析

机器学习:MLlib

计算图形:GraphX

Exécution générale: Spark Core

有阿帕奇火花吗?|阿帕奇星火的优势

Rapidite

Simplicite d 'utilisation

Un moteur unifié

Essayez gratuement Apache Spark sur le cloud Databricks

Apache火花^™