开源
Einige der weltweit beliebtesten Open-Source-Datentechnologien wurden ursprünglich von databries - ingenieuren erfunden
一个einem Treffen teilnehmenUnsere beliebtesten开源项目
Apache火花™
Apache Spark ist eine vereinheitlichte Engine zum Ausführen von数据工程,数据科学和ml -工作负载。
三角洲湖
Mit Delta Lake können Sie eine Lakehouse-Architektur auf Speichersysteme wie AWS S3, ADLS, GCS和HDFS aufsetzen。
MLflow
MLflow verwaltet den ML-Lebenszyklus, einschließlich experiment, reduzierbarkeit, Implementierung und einer zentralen模型注册。
Redash
Mit Redash kann wirklich jder Anwender SQL nutzen,嗯Daten aus großen und kleinen Datenquellen zu untersuchen, abzufragen, zu visualisieren und zu teilen。
Delta-Freigabe
Delta Sharing ist das branchenweit erste offene Protokoll für die sichere Datenfreigabe。麻省理工三角洲共享鸟的数据aususch Mit anderen组织zum Kinderspiel。
Databricks unterstützt außerdem die folgenden beliebten开源技术
TensorFlow
Databricks unterstützt TensorFlow, eine Bibliothek für深度学习和allgemeine Berechnungen auf集群
PyTorch™
PyTorch-Schöpfer Facebook und Databricks entwickeln gemeinsam Integrationen
Keras™
在Python geschriebene Deep-Learning-API中,die auf TensorFlow aufbaut。Verfügbar在Databricks运行时für机器学习。
RStudio
Eine Sammlung von Open-Source-Tools für kollaborative Data Science mit R
Scikit-learn
Weit verbreitetes Python-Paket für maschinelles leren, das auf NumPy, SciPy und Matplotlib aufbaut
XGBoost
Eine verteilte Gradient-Boosting-Bibliothek mit Bindungen in Sprachen wie Python, R和c++
起程拓殖
HashiCorp Terraform ist ein beliebtes开源工具zum Erstellen einer sicheren und vorhersehbaren cloud - infrastrucktur für mehere Cloud-Anbieter。Der terrraform - anbieter von databrick ermöglicht es Kunden, ihre gesamten databick - arbeitsbereiche zusammen mit dem Rest ihrer基础结构灵活,leistungsstarken工具zu verwalten。Die Verwendung von terrraform带来Kunden auch dazu, bewährte Methoden mit Infrastructure as Code (IaC) zu übernehmen。
萤石的
losgehen吗?