オ,プンソ,ス

砖のエンジニアは,主要なオープンソースデータテクノロジーのオリジナルクリエーターです

ミ,トアップに参加
背景

数据库の主要オ,プンソ,スプロジェクト

ア▪▪コン—タ▪▪トル
Apache火花TM
Apache火花はデータエンジニアリング,データサイエンス,機械学習ワークロードを実行するための統合エンジンです。

Apache Sparkとは→

Sparkと数据库の比較→

Spark.apache.orgのサ电子邮箱トへ→

ア▪▪コン—タ▪▪トル
三角洲湖
三角洲湖では,AWS S3, ADLS GCS, HDFSなどのストレージシステムの上に,レイクハウスアーキテクチャを構築できます。

三角洲湖にいて詳しく見る→

三角洲。IOのサaaplトへ→

テックト,ク:三角洲湖入門→

ア▪▪コン—タ▪▪トル
MLflow
MLflowは,実験,再現性,デプロイメント,中央モデルレジストリなど,機械学習ライフサイクルを管理します。

Databricksのマネ,ジド型MLflow→

Mlflow.orgのサaaplトへ→

テックト,ク:MLflowによるMLラ

ア▪▪コン—タ▪▪トル
Redash
Redashでは,あらゆるユーザーがSQLを活用して,データソースサイズの規模を問わず,データを探索,クエリ,視覚化,共有することができます。

GitHubのRedashのサescトへ→

ア▪▪コン—タ▪▪トル
三角洲分享
δ分享はセキュアなデータ共有のための新たなオープンプロトコルで,組織内外でのデータ共有を容易にします。

Delta共享のサ▪▪トへ→

数据库は,次のオ,プンソ,ステクノロジ,もサポ,トしています

ア▪▪コン—タ▪▪トル
TensorFlow
砖は,クラスタ上の深層学習と汎用的なコンピューティングのためのライブラリTensorFlowをサポートしています。

TensorFlow on Databricks→

ア▪▪コン—タ▪▪トル
PyTorchTM
PyTorchのクリエイターであるFacebookとの連携によりPyTorchを統合しています。

PyTorch on Databricks→

ア▪▪コン—タ▪▪トル
KerasTM
Kerasは,TensorFlow上で実行されるPythonで記述された深層学習APIです。機械学習のための数据库ランタ数据库ムの一部として提供されます。

Keras on Databricks→

ア▪▪コン—タ▪▪トル
RStudio
Rを使用したコラボレーション型データサイエンスのためのオープンソースのツール群を砖に統合できます。

Rプログラミングによるビッグデ,タ分析→

ア▪▪コン—タ▪▪トル
scikit-learn
NumPy、SciPy Matplotlib上に構築された機械学習に広く使用されているPythonパッケージを砖上で利用できます。

Scikit-learn on Databricks→

ア▪▪コン—タ▪▪トル
XGBoost
Python, R, c++などの言語に対応した分散型勾配ブスティングラブラリが提供されます。

XGBoost on Databricks→

ア▪▪コン—タ▪▪トル
起程拓殖
HashiCorp起程拓殖は,複数のクラウドプロバイダにわたってセキュアかつ予測可能なクラウドインフラを構築するための一般的なオープンソースツールです。砖起程拓殖プロバイダにより、ユーザーは柔軟で堅牢なツールを使用して、Databricks ワークスペース全体を他のインフラと一緒に管理できます。また、Terraform を利用することで、IaC (コードとしてのインフラ)のベストプラクティスを採用できます。

terrraform on Databricks→

無料お試し·その他のご相談を承っております