bob下载地址
Les ingénieurs de Databricks sont Les créateurs de plusieurs technologies de données开bob下载地址源parmi Les plus populaires au monde
参加à un Meetup没有项目,开源和大众bob下载地址
Apache火花TM
Apache Spark est un moteur unifié pour exécuter des charges de travail de data engineering, de data Science et de ML。
三角洲湖
Delta Lake vous permet de construcire une architecture de lakehouse sur des systèmes de stockage telels qu'AWS S3, ADLS, GCS et HDFS。
MLflow
MLflow gère le cycle de vie du ML, y compris l'expérimentation, la reproductibilité, le déploiement et un registry central des modèles。
Redash
Redash permet à quiconque d'exploiter SQL pour explorer, interroger, visualiser et partager des données à partir de petites ou de grandes sources de données(小数据和大数据)。
三角洲分享
Delta共享最优先协议室外倾倒共享sécurisé des données。Il permet d'échanger facility des données avec d' aures organizations。
Databricks prend en charge ces技术开源courantes bob下载地址supplémentaires
TensorFlow
datricks prend en charge TensorFlow, une bibliothèque de référence pour le deep learning et les clusters de computation
PyTorchTM
Facebook, le créateur de PyTorch, et Databricks ont collaboré sur des intégrations公社。
KerasTM
API de深度学习écrite en Python, Keras functiontionne par-dessus TensorFlow。Elle est disponible dans Databricks Runtime pour ML。
RStudio
Une suite d'outils开bob下载地址源倒la数据科学协作à l'aide de R
Scikit-learn
包Python大utilisé dans le机器学习basé sur NumPy, SciPy et Matplotlib
xgboost
Une bibliothèque distribuée de boost de gradient reliée aux languages tels que Python, R等c++。
起程拓殖
HashiCorp terrraform est un outilbob下载地址开放源码流行的永久性的créer une基础设施云sûre et prévisible englobant plusieurs fournisseurs de services云。Le fournisseur Terraform de Databricks permet aux clients de disposer d'un - outil flexible et perissant pour gérer l'ensemble de leurs espaces de travail Databricks et lerest de leleur infrastructure。L'utilisation de Terraform鼓励également les clients à adopter les bonnes pratiques avec L 'infrastructure en tant que code (IaC)。
Prêt à vous
枪骑兵?