比较Apache SparkTM用数据砖
Les capacités d'Apache Spark apportent vitesse, simplicité d'utilisation et divers avages à l'utilisation。Spark包括des API adaptées à une vaste gamme de cas d'utilisation:
- Intégration de données et ETL
- 分析了互动
- 机器学习等分析avancées
- tritement de données临时réel
Databricks est bâti法国火花及亚洲基金会:
- Des pipeline de données extrêmement fiables et performants
- Une grande productivité en数据科学,quelle que soit l'échelle
比较les fonctionnalités
砖运行时 |
Exécutez plusieurs版本de Spark | ||
Système de fichiers intégré optimisé pour l'accès au stockage dans le cloud (AWS S3, Redshift, Azure Blob) | ||
没有服务器的池可以自动配置资源,而不像SQL和Python那样费力 | ||
共享资源,最佳利用 | ||
计算资源隔离 | ||
Écritures加上rapides sur S3 | ||
优化du计算挂件les opérations连接和过滤 | ||
新循环的版本 | ||
威力计算自动化à l'échelle | ||
库存本地mis自动化à l'échelle | ||
高级disponibilité倒les集群 | ||
多用途集群分区 | ||
迁移自动进入les实例点et à la需求 | ||
制造à la seconde |
管理三角洲湖 |
交易酸 | ||
Gestion de schémas | ||
分价优惠/流通、讲座/écriture | ||
Contrôle de versions des données | ||
优化des性能 |
集成工作区 |
笔记本交互语言(SQL, Python, R et Scala) | ||
临时合作réel | ||
历史des révisions des笔记本et intégration GitHub | ||
非循环的可视化 | ||
交互式的桌面笔记 |
生产工作和工作流程 |
监视和警报tâches星火 | ||
Déploiement en un clic de notebooks autant que de tâches Spark | ||
API倒凹坑des通量的劳动丹les笔记本 | ||
流式生产avec监控 |
企业安全 |
Contrôle d'accès倒les笔记本,集群,tâches等données structurées | ||
Journaux d 'audit | ||
因此SAML 2.0是不可避免的 | ||
chiffsement des données (au repos et en movement) | ||
Conformité (HIPAA, SOC 2 Type 2) |
集成 |
Connectez d'autres outils de BI à l'aide d'une interface ODBC/JDBC authentifiée (Tableau, Looker等) | ||
其他API | ||
Connecteurs de sources de données |
专家支持 |
助理和协助委员conçu Spark | ||
Prise en charge de SQL |