运行时机器学习

Ambiente di机器学习ottimizzato pronto all'uso

机器学习运行时(MLR)提供了一个数据科学家技术ML集群可伸缩性框架più diffusi, AutoML integrato e ottimizzazioni per prestazioni senza paragoni。

Vantaggi

框架是一个骨架

ML框架正在以疯狂的速度发展,从业者平均需要管理8个库。ML运行时提供了一键访问最流行的ML框架的可靠和性能分布,并通过预先构建的容器自定义ML环境。

机器学习自动学习

Il ciclo di机器学习,dalla prepareazione dei dati all'inferenza, può essere accelerato con funzionalità di ML integration, fra cui sintonizazione degli iperparameter ricerca di modelli utilizzando Hyperopt e MLflow。

SCALABILITA SEMPLIFICATA

可扩展的大数据基础设施集群自动生成。机器学习运行时算法più diffusi e HorovodRunner,一个简单的API每个深度学习分发。

特性

框架是一个骨架

毫升框架:Le librerie e i framework di ML più diffusi vengono forniti "pronti all'uso", ad esempio TensorFlow, Keras, PyTorch, MLflow, Horovod, GraphFrames, scikit-learn, XGboost, numpy, MLeap e Pandas。

毫升AUMENTATO

自动测量实验:tracciare,对抗e可视化centinaia di migliaia di实验方法利用MLflow开源o姿态图ela funzionalità平行di plottaggio delle坐标。

模型自动Ricerca(每毫升单结点):ricerca ottimizzata e distribution ita di perparameter condizionali su più architecture di modelli con Hyperopt avanzato e tracciamento automatico su MLflow。

自动参数化机器学习:ricerca ottimizzata e distribuita di perperparameter con Hyperopt avanzato e tracciamento automaticsu flow。

Sintonizzazione自动非参数机器学习分布:在MLflow中对PySpark MLlib进行交叉验证。

Ottimizzato per scalabilitÀ semplificata

TensorFlow ottimizzato:TensorFlow ottimizzata / CUDA porta benefit in termini di prestazioni sui cluster GPU。

HorovodRunner:深度学习的一个nodo singolo的代码può essere迁移速度每girare su集群的数据,一个简单的API,一个复杂的问题,所有'uso di Horovod每一个'addestramento分布。

回归logistic MLlib ottimizzata e classificatorad albero:gli stimatori più diffusi sono stati ottimizzati nell'ambito di Databricks Runtime per ML, per frire un incremento della velocità fino al 40% rispetto ad Apache Spark 2.4.0。

GraphFrames ottimizzato:GraphFrames può girare da 2 a 4 volte più velocemente e si所有人eseguire查询Graph a velocità fino a 100 volte maggiori, secondo i carichi di lavoro el 'asimmetria dei dati。

深度学习工作负载优化存储:利用以下高性能解决方案AzureAWS,GCP对于数据加载和模型检查点,这两者对于深度学习训练工作负载都是至关重要的。

工作原理

机器学习运行时è basato su Databricks运行时e viene aggiornato a ogni nuova发布。È disponibile per tutte le offerte di prodotti数据库,fra cui Azure数据库,AWS云,集群GPU e集群CPU。

每个使用ML运行时,一个版本ML运行时,一个创建集群。

Referenze

观看Spark+AI峰会演讲

简化分布式TensorFlow训练用于星巴克的快速图像分类