bob下载地址

数据工程师是世界上一些最流行的开源数据技术的最初创造者bob下载地址

参加聚会
背景图像

我们最受欢迎的开源项目bob下载地址

icon-title
Apache火花TM
Apache Spark是用于执行数据工程、数据科学和ML工作负载的统一引擎。

什么是Apache Spark?→

比较Spark和Databricks→

访问spark.apache.org→

icon-title
三角洲湖
Delta Lake允许您在AWS S3、ADLS、GCS和HDFS等存储系统上构建湖屋架构。

BOB低频彩了解更多关于三角洲湖→

访问三角洲。io→

技术讲座:从Delta Lake开始→

icon-title
MLflow
MLflow管理ML生命周期,包括实验、再现性、部署和中央模型注册表。

Managed MLflow on Databricks→

访问mlflow.org→

技术讲座:管理机器学习生命周期→

icon-title
Redash
Redash允许任何人利用SQL来探索、查询、可视化和共享来自大小数据源的数据。

访问Redash在GitHub→

icon-title
三角洲分享
Delta Sharing是业界首个用于安全数据共享的开放协议,使与其他组织共享数据变得简单。

访问德尔塔共享→

Databricks支持这些额外的流行开源技术bob下载地址

icon-title
TensorFlow
Databricks支持TensorFlow,这是一个用于集群深度学习和通用计算的库

TensorFlow on Databricks→

icon-title
PyTorchTM
PyTorch的创建者Facebook和Databricks在集成方面进行了合作

PyTorch on Databricks→

icon-title
KerasTM
用Python编写的深度学习API,运行在TensorFlow之上。可在Databricks运行时的ML。

Keras on Databricks→

icon-title
RStudio
一个使bob下载地址用R进行协作数据科学的开源工具套件

大数据R编程→

icon-title
scikit-learn
广泛使用的机器学习Python包构建在NumPy, SciPy和Matplotlib之上

Scikit-learn on Databricks→

icon-title
XGBoost
一个分布式梯度增强库,具有Python、R和c++等语言的绑定

XGBoost on Databricks→

icon-title
起程拓殖
HashiCorp Terraform是一个流行的开源工具,用于跨bob下载地址多个云提供商创建安全且可预测的云基础设施。Databricks Terraform提供商允许客户使用一个灵活、强大的工具管理他们的整个Databricks工作空间以及其余的基础设施。使用Terraform还鼓励客户采用基础设施即代码(IaC)的最佳实践。

terrraform on Databricks→

准备好了
开始了吗?