比较Apache SparkTM和砖


Apache Spark功能提供了快速、易用和广泛的使用优势,并包括支持一系列用例的api:

  • 数据集成和ETL
  • 互动分析
  • 机器学习和高级分析
  • 实时数据处理

v


Databricks构建在Spark之上,并添加:

  • 高可靠性和高性能的数据管道
  • 大规模生产数据科学

想了解更多吗?BOB低频彩访问我们的bob体育客户端下载平台页面

特征比较

砖

BOB低频彩

是的 没有
运行多个版本的Spark 是的 没有
为云存储访问优化的内置文件系统(AWS S3, Redshift, Azure Blob) 是的 没有
为SQL和Python工作负载提供自动配置资源的无服务器池 是的 没有
spark原生细粒度资源共享,以实现最佳利用 是的 没有
计算资源的故障隔离 是的 没有
更快地写入S3 是的 没有
在连接和筛选期间计算优化 是的 没有
快速释放周期 是的 没有
伸缩计算 是的 没有
自动缩放本地存储 是的 没有
集群的高可用性 是的 没有
多用户集群共享 是的 没有
在现场实例和按需实例之间自动迁移 是的 没有
第二级计费 是的 没有

是的 没有

ACID事务 是的 没有
模式管理 是的 没有
批处理/流读写支持 是的 没有
数据版本控制 是的 没有
性能优化 是的 没有

是的 没有
支持多种语言(SQL, Python, R和Scala)的交互式笔记本 是的 没有
实时协作 是的 没有
笔记本修订历史和GitHub集成 是的 没有
一键式可视化 是的 没有
将笔记本发布为交互式仪表板 是的 没有

是的 没有
Spark作业监视警报 是的 没有
从笔记本到Spark Jobs的一键部署 是的 没有
在笔记本电脑中构建工作流的api 是的 没有
带监控的生产流 是的 没有

BOB低频彩

是的 没有
笔记本、集群、作业和结构化数据的访问控制 是的 没有
审计日志 是的 没有
支持SAML 2.0的SSO 是的 没有
数据加密(静止和运动时) 是的 没有
合规性(HIPAA, SOC 2 Type 2) 是的 没有

是的 没有
通过认证的ODBC/JDBC连接其他BI工具(Tableau, Looker等) 是的 没有
REST API 是的 没有
数据源连接器 是的 没有

是的 没有
来自设计Spark的提交者的帮助和支持 是的 没有
SQL支持 是的 没有

额外的资源

在云端测试大数据SQL平台bob体育客户端下载

博客

Hotels.com如何在没有性能问题的情况下将分析的数据增加20倍

客户的故事

托管的Delta Lake:最好的数据湖、仓库和流系统。

演示