比较Apache SparkTM用数据砖


Les capacités d'Apache Spark apportent vitesse, simplicité d'utilisation et divers avages à l'utilisation。Spark包括des API adaptées à une vaste gamme de cas d'utilisation:
  • Intégration de données et ETL
  • 分析了互动
  • 机器学习等分析avancées
  • tritement de données临时réel

v


Databricks est bâti法国火花及亚洲基金会:
  • Des pipeline de données extrêmement fiables et performants
  • Une grande productivité en数据科学,quelle que soit l'échelle

想了解更多吗?BOB低频彩访问我们的bob体育客户端下载平台页面

比较les fonctionnalités

砖

En savoir +

是的
Exécutez plusieurs版本de Spark 是的
Système de fichiers intégré optimisé pour l'accès au stockage dans le cloud (AWS S3, Redshift, Azure Blob) 是的
没有服务器的池可以自动配置资源,而不像SQL和Python那样费力 是的
共享资源,最佳利用 是的
计算资源隔离 是的
Écritures加上rapides sur S3 是的
优化du计算挂件les opérations连接和过滤 是的
新循环的版本 是的
威力计算自动化à l'échelle 是的
库存本地mis自动化à l'échelle 是的
高级disponibilité倒les集群 是的
多用途集群分区 是的
迁移自动进入les实例点et à la需求 是的
制造à la seconde 是的

是的

交易酸 是的
Gestion de schémas 是的
分价优惠/流通、讲座/écriture 是的
Contrôle de versions des données 是的
优化des性能 是的

是的
笔记本交互语言(SQL, Python, R et Scala) 是的
临时合作réel 是的
历史des révisions des笔记本et intégration GitHub 是的
非循环的可视化 是的
交互式的桌面笔记 是的

是的
监视和警报tâches星火 是的
Déploiement en un clic de notebooks autant que de tâches Spark 是的
API倒凹坑des通量的劳动丹les笔记本 是的
流式生产avec监控 是的

En savoir +

是的
Contrôle d'accès倒les笔记本,集群,tâches等données structurées 是的
Journaux d 'audit 是的
因此SAML 2.0是不可避免的 是的
chiffsement des données (au repos et en movement) 是的
Conformité (HIPAA, SOC 2 Type 2) 是的

是的
Connectez d'autres outils de BI à l'aide d'une interface ODBC/JDBC authentifiée (Tableau, Looker等) 是的
其他API 是的
Connecteurs de sources de données 是的

是的
助理和协助委员conçu Spark 是的
Prise en charge de SQL 是的

Ressources supplementaires

SQL大数据的基准平台

博客

评论Hotels.com一个multiplié par 20 la quantité de données analysées,无problèmes de性能

Témoignage de客户端

三角洲湖géré: Le meilleur des systèmes de streaming, des entrepôts de données et des datalakes。

演示