阿里巴巴的数据

Databricks DataInsight与阿里云服务深度整合,简化大数据分析和人工智能

阿里巴巴的数据

背景图像

砖DataInsight

Databricks DataInsight是一个基于Apache Spark™的完bob体育客户端下载全管理的数据和分析平台。DataInsight是建立在Databricks Runtime和Delta Lake上的。与阿里云服务集成,确保数据安全,并允许配置监控和警报策略,以及动态集群扩展。它满足了数据分析师、数据工程师和数据科学家的分析需求。

更好的性能

更好的性能

Databricks Runtime提供了50倍于开源Apache Spark™的改进bob下载地址

流和批处理集成

流和批处理集成

Databricks Delta Lake为数据湖分析提供ACID事务处理功能,处理批处理和流数据集

合作的分析

合作的分析

Databricks DataInsight满足了数据科学家、数据工程师和业务分析师的分析需求,并提供了一个交互式和协作的笔记本环境

实时数据洞察

实时数据洞察

独立的计算和存储可以减少数据冗余,并支持多个用户访问数据,降低数据存储成本并提供独立的可伸缩性

一个完全管理的分析平台bob体育客户端下载

快速启动完全托管的集群,只为使用的部分付费

集群规模

集群规模

根据作业需求设置节点数量,具有高可用性集群支持

实例的选择

实例的选择

支持三种实例类型:ECS通用类型、计算类型和内存类型

一个完全协作的创新平台bob体育客户端下载

跨团队的多个用户可以交互地共享数据和协作

笔记本

笔记本

提供交互式作业执行模式的协作工作空间,支持Apache Spark、PySpark、Spark R和Spark SQL作业,并可视化显示分析结果

统一的元数据

统一的元数据

数据库和表的元信息可以在集群之间共享而不重复

与Apache Spark生态系统完全兼容

100%兼容开源Apache Sparkbob下载地址

砖运行时

砖运行时

性能优化Databricks运行时基于Apache Spark。针对阿里云OSS进行I/O优化,提供更快、更高效的分析引擎。

三角洲湖

三角洲湖

整合阿里云服务的优化版Delta Lake

企业安全

集成阿里云内存,根据用户和角色控制权限,确保数据安全

统一批处理和流处理的大数据分析引擎

深度整合阿里云服务和功能,如DataWorks的数据治理和数据谱系以及AI机器学习平台(PAI),提供更全面的数据解决方案。bob体育客户端下载

Stepone
北京吉智科技有限公司北京基智科技有限公司

观看这段10分钟的视频,了解北京集智科技如何使用Databricks DataInsight进行客户获取和管理用例。

Databricks DataInsight典型架构

深度整合阿里云产品,打造实时/线下数据仓库

关键的角色

  • 数据收集
    接收外部云存储上的实时流数据和批量数据
  • 数据ETL
    持续高效地处理增量数据,支持数据回退和删除,提供ACID事务保障
  • BI数据分析
    支持特别查询,与各种BI分析工具无缝集成
  • 人工智能数据探索
    提供完整的机器学习平台bob体育客户端下载

Databricks DataInsight典型架构