Databricks运行时11.1机器学习
Databricks Runtime 11.1 for Machine Learning为机器学习和数据科学提供了一个现成的环境Databricks运行时.Databricks Runtime ML包含许多流行的机器学习库,包括TensorFlow、PyTorch和XGBoost。Databricks Runtime ML包含AutoML,一个自动训练机器学习管道的工具。Databricks Runtime ML还支持使用Horovod进行分布式深度学习训练。
有关更多信息,包括创建Databricks Runtime ML集群的说明,请参见Databricks运行时机器学习.
新功能和改进
Databricks Runtime 11.1 ML构建在Databricks Runtime 11.1之上。有关Databricks Runtime 11.1(包括Apache Spark MLlib和SparkR)中的新特性的信息,请参见Databricks运行时发行说明。
对Databricks AutoML的增强
对。进行了以下增强砖AutoML.
当AutoML检测到一个分类问题是二进制的,它会计算二进制分类指标,并推断出问题的正类。还可以使用new
pos_label
参数。详细信息请参见分类和回归参数.对于预测问题,AutoML现在可以处理视界相对于训练数据的时间跨度较长的情况。
对Databricks功能商店的增强
对。进行了以下增强Databricks功能商店.
现在,您可以使用feature Store Python API手动更新特性表的数据源。看到更新特性表的数据源.
系统环境
Databricks Runtime 11.1 ML的系统环境与Databricks Runtime 11.1不同:
DBUtils: Databricks Runtime ML不包含库实用程序(dbutls . Library).使用
%皮普
而不是命令。看到笔记本范围的Python库.对于GPU集群,Databricks Runtime ML包含以下NVIDIA GPU库:
CUDA 11.3
cuDNN 8.0.5.39
NCCL 2.9.9
TensorRT 7.2.2
库
下面几节列出了Databricks Runtime 11.1 ML中包含的不同于Databricks Runtime 11.1的库。
Python库
Databricks Runtime 11.1 ML使用Virtualenv进行Python包管理,包括许多流行的ML包。
除了以下章节中指定的包外,Databricks Runtime 11.1 ML还包括以下包:
hyperopt 0.2.7.db1
sparkdl 2.2.0-db6
feature_store 0.5.0
automl 1.11.0
CPU集群上的Python库
图书馆 |
版本 |
图书馆 |
版本 |
图书馆 |
版本 |
---|---|---|---|---|---|
absl-py |
1.0.0 |
Antergos Linux |
2015.10 (ISO-Rolling) |
argon2-cffi |
20.1.0 |
阿斯特 |
0.8.1 |
astunparse |
1.6.3 |
async-generator |
1.10 |
attrs |
21.2.0 |
azure-core |
1.22.1 |
azure-cosmos |
4.2.0 |
backcall |
0.2.0 |
backports.entry-points-selectable |
1.1.1 |
bcrypt |
3.2.2 |
漂白剂 |
4.0.0 |
bli |
0.7.8 |
boto3 |
1.21.18 |
botocore |
1.24.18 |
cachetools |
5.2.0 |
目录 |
2.0.7 |
certifi |
2021.10.8 |
cffi |
1.14.6 |
chardet |
4.0.0 |
charset-normalizer |
2.0.4 |
点击 |
8.0.3 |
cloudpickle |
2.0.0 |
cmdstanpy |
0.9.68 |
configparser |
5.2.0 |
convertdate |
测试盒框 |
密码学 |
3.4.8 |
周期计 |
0.10.0 |
cymem |
2.0.6 |
Cython |
0.29.24 |
databricks-automl-runtime |
0.2.9.1 |
databricks-cli |
0.16.8 |
dbl-tempo |
0.1.12 |
dbus-python |
1.2.16 |
debugpy |
1.4.1 |
装饰 |
5.1.0 |
defusedxml |
是0.7.1 |
莳萝 |
0.3.4 |
diskcache |
5.4.0 |
distlib |
0.3.4 |
distro-info |
0.23 ubuntu1 |
entrypoints |
0.3 |
ephem |
4.1.3 |
facets-overview |
1.0.0 |
fasttext |
0.9.2 |
filelock |
3.3.1 |
瓶 |
1.1.2 |
flatbuffers |
1.12 |
fsspec |
2021.8.1 |
未来 |
0.18.2 |
使惊讶 |
0.4.0 |
gitdb |
4.0.9 |
GitPython |
3.1.27 |
google-auth |
2.6.0 |
google-auth-oauthlib |
0.4.6 |
google-pasta |
0.2.0 |
grpcio |
1.44.0 |
gunicorn |
20.1.0 |
gviz-api |
1.10.0 |
h5py |
3.3.0 |
hijri-converter |
2.2.4 |
假期 |
0.14.2 |
horovod |
0.24.3 |
htmlmin |
0.1.12 |
huggingface-hub |
0.8.1 |
idna |
3.2 |
ImageHash |
4.2.1 |
imbalanced-learn |
0.8.1 |
importlib-metadata |
4.8.1 |
ipykernel |
6.12.1 |
ipython |
7.32.0 |
ipython-genutils |
0.2.0 |
ipywidgets |
7.7.0 |
isodate |
0.6.1 |
itsdangerous |
2.0.1 |
绝地武士 |
0.18.0 |
Jinja2 |
14 |
jmespath |
0.10.0 |
joblib |
1.0.1 |
joblibspark |
0.5.0 |
jsonschema |
3.2.0 |
jupyter-client |
6.1.12 |
jupyter-core |
4.8.1 |
jupyterlab-pygments |
0.1.2 |
jupyterlab-widgets |
1.0.0 |
keras |
2.9.0 |
Keras-Preprocessing |
1.1.2 |
kiwisolver |
1.3.1 |
korean-lunar-calendar |
0.2.1 |
langcodes |
3.3.0 |
libclang |
14.0.1 |
lightgbm |
3.3.2 |
llvmlite |
0.38.1 |
LunarCalendar |
0.0.9 |
尖吻鲭鲨 |
1.2.0 |
减价 |
3.3.6 |
MarkupSafe |
2.0.1 |
matplotlib |
3.4.3 |
matplotlib-inline |
0.1.2 |
missingno |
0.5.1 |
使走调 |
0.8.4 |
mleap |
0.20.0 |
mlflow-skinny |
1.27.0 |
多重方法 |
1.8 |
murmurhash |
1.0.7 |
nbclient |
0.5.3 |
nbconvert |
6.1.0 |
nbformat |
5.1.3 |
nest-asyncio |
1.5.1 |
networkx |
2.6.3 |
nltk |
3.6.5 |
笔记本 |
6.4.5 |
numba |
0.55.2 |
numpy |
1.20.3 |
oauthlib |
3.2.0 |
opt-einsum |
3.3.0 |
包装 |
21.0 |
熊猫 |
1.3.4 |
pandas-profiling |
3.1.0 |
pandocfilters |
3 |
paramiko |
2.9.2 |
parso |
0.8.2 |
表“感觉” |
0.6.2 |
容易受骗的人 |
0.5.2 |
petastorm |
0.11.4 |
pexpect |
4.8.0 |
phik |
0.12.2 |
pickleshare |
0.7.5 |
枕头 |
8.4.0 |
皮普 |
21.2.4 |
bob体育客户端下载platformdirs |
2.5.2 |
情节 |
5.8.2 |
pmdarima |
1.8.5 |
棒 |
3.0.6 |
prometheus-client |
0.11.0 |
prompt-toolkit |
3.0.20 |
先知 |
1.0.1 |
protobuf |
3.19.4 |
psutil |
5.8.0 |
psycopg2 |
2.9.3 |
ptyprocess |
0.7.0 |
pyarrow |
7.0.0 |
pyasn1 |
0.4.8 |
pyasn1-modules |
0.2.8 |
pybind11 |
2.9.2 |
pycparser |
2.20 |
pydantic |
1.8.2 |
Pygments |
2.10.0 |
PyGObject |
3.36.0 |
PyJWT |
测试盒框 |
PyMeeus |
0.5.11 |
PyNaCl |
1.5.0 |
pyodbc |
4.0.31 |
pyparsing |
3.0.4 |
pyrsistent |
0.18.0 |
pystan |
2.19.1.1 |
python-apt |
2.0.0 + ubuntu0.20.4.7 |
python-dateutil |
2.8.2 |
python编辑器 |
1.0.4 |
pytz |
2021.3 |
PyWavelets |
1.1.1 |
PyYAML |
6.0 |
pyzmq |
22.2.1 |
正则表达式 |
2021.8.3 |
请求 |
2.26.0 |
requests-oauthlib |
1.3.1 |
requests-unixsocket |
0.2.0 |
rsa |
4.8 |
s3transfer |
0.5.2 |
scikit-learn |
0.24.2 |
scipy |
1.7.1上 |
seaborn |
0.11.2 |
Send2Trash |
1.8.0 |
setuptools |
58.0.4 |
setuptools-git |
1.2 |
世鹏科技电子 |
0.40.0 |
simplejson |
3.17.6 |
六个 |
1.16.0 |
切片机 |
0.0.7 |
smart-open |
5.2.1 |
smmap |
5.0.0 |
宽大的 |
3.3.1 |
spacy-legacy |
3.0.9 |
spacy-loggers |
1.0.2中 |
spark-tensorflow-distributor |
1.0.0 |
sqlparse |
0.4.2 |
srs |
2.4.3 |
ssh-import-id |
5.10 |
statsmodels |
0.12.2 |
汇总 |
0.8.9 |
tangled-up-in-unicode |
0.1.0 |
韧性 |
8.0.1 |
tensorboard |
2.9.1 |
tensorboard-data-server |
0.6.1 |
tensorboard-plugin-profile |
2.8.0 |
tensorboard-plugin-wit |
1.8.1 |
tensorflow-cpu |
2.9.1 |
tensorflow-estimator |
2.9.0 |
tensorflow-io-gcs-filesystem |
0.26.0 |
termcolor |
1.1.0 |
terminado |
0.9.4 |
testpath |
0.5.0 |
thinc |
8.0.17 |
threadpoolctl |
2.2.0 |
分词器 |
0.12.1 |
火炬 |
1.11.0 + cpu |
torchvision |
0.12.0 + cpu |
龙卷风 |
6.1 |
tqdm |
4.62.3 |
traitlets |
5.1.0 |
变形金刚 |
4.20.0 |
打字机 |
0.4.2 |
typing-extensions |
3.10.0.2 |
ujson |
4.0.2 |
unattended-upgrades |
0.1 |
urllib3 |
1.26.7 |
virtualenv |
20.8.0 |
愿景 |
0.7.4 |
芥末酱 |
0.9.1 |
wcwidth |
0.2.5 |
webencodings |
0.5.1 |
websocket-client |
1.3.1 |
Werkzeug |
2.0.2 |
轮 |
0.37.0 |
widgetsnbextension |
3.6.0 |
打包 |
1.12.1 |
xgboost |
1.5.2 |
氧化锌碘仿糊 |
3.6.0 |
GPU集群上的Python库
图书馆 |
版本 |
图书馆 |
版本 |
图书馆 |
版本 |
---|---|---|---|---|---|
absl-py |
1.0.0 |
Antergos Linux |
2015.10 (ISO-Rolling) |
argon2-cffi |
20.1.0 |
阿斯特 |
0.8.1 |
astunparse |
1.6.3 |
async-generator |
1.10 |
attrs |
21.2.0 |
azure-core |
1.22.1 |
azure-cosmos |
4.2.0 |
backcall |
0.2.0 |
backports.entry-points-selectable |
1.1.1 |
bcrypt |
3.2.2 |
漂白剂 |
4.0.0 |
bli |
0.7.8 |
boto3 |
1.21.18 |
botocore |
1.24.18 |
cachetools |
5.2.0 |
目录 |
2.0.7 |
certifi |
2021.10.8 |
cffi |
1.14.6 |
chardet |
4.0.0 |
charset-normalizer |
2.0.4 |
点击 |
8.0.3 |
cloudpickle |
2.0.0 |
cmdstanpy |
0.9.68 |
configparser |
5.2.0 |
convertdate |
测试盒框 |
密码学 |
3.4.8 |
周期计 |
0.10.0 |
cymem |
2.0.6 |
Cython |
0.29.24 |
databricks-automl-runtime |
0.2.9.1 |
databricks-cli |
0.16.8 |
dbl-tempo |
0.1.12 |
dbus-python |
1.2.16 |
debugpy |
1.4.1 |
装饰 |
5.1.0 |
defusedxml |
是0.7.1 |
莳萝 |
0.3.4 |
diskcache |
5.4.0 |
distlib |
0.3.4 |
distro-info |
0.23 ubuntu1 |
entrypoints |
0.3 |
ephem |
4.1.3 |
facets-overview |
1.0.0 |
fasttext |
0.9.2 |
filelock |
3.3.1 |
瓶 |
1.1.2 |
flatbuffers |
1.12 |
fsspec |
2021.8.1 |
未来 |
0.18.2 |
使惊讶 |
0.4.0 |
gitdb |
4.0.9 |
GitPython |
3.1.27 |
google-auth |
2.6.0 |
google-auth-oauthlib |
0.4.6 |
google-pasta |
0.2.0 |
grpcio |
1.44.0 |
gunicorn |
20.1.0 |
gviz-api |
1.10.0 |
h5py |
3.3.0 |
hijri-converter |
2.2.4 |
假期 |
0.14.2 |
horovod |
0.24.3 |
htmlmin |
0.1.12 |
huggingface-hub |
0.8.1 |
idna |
3.2 |
ImageHash |
4.2.1 |
imbalanced-learn |
0.8.1 |
importlib-metadata |
4.8.1 |
ipykernel |
6.12.1 |
ipython |
7.32.0 |
ipython-genutils |
0.2.0 |
ipywidgets |
7.7.0 |
isodate |
0.6.1 |
itsdangerous |
2.0.1 |
绝地武士 |
0.18.0 |
Jinja2 |
14 |
jmespath |
0.10.0 |
joblib |
1.0.1 |
joblibspark |
0.5.0 |
jsonschema |
3.2.0 |
jupyter-client |
6.1.12 |
jupyter-core |
4.8.1 |
jupyterlab-pygments |
0.1.2 |
jupyterlab-widgets |
1.0.0 |
keras |
2.9.0 |
Keras-Preprocessing |
1.1.2 |
kiwisolver |
1.3.1 |
korean-lunar-calendar |
0.2.1 |
langcodes |
3.3.0 |
libclang |
14.0.1 |
lightgbm |
3.3.2 |
llvmlite |
0.38.1 |
LunarCalendar |
0.0.9 |
尖吻鲭鲨 |
1.2.0 |
减价 |
3.3.6 |
MarkupSafe |
2.0.1 |
matplotlib |
3.4.3 |
matplotlib-inline |
0.1.2 |
missingno |
0.5.1 |
使走调 |
0.8.4 |
mleap |
0.20.0 |
mlflow-skinny |
1.27.0 |
多重方法 |
1.8 |
murmurhash |
1.0.7 |
nbclient |
0.5.3 |
nbconvert |
6.1.0 |
nbformat |
5.1.3 |
nest-asyncio |
1.5.1 |
networkx |
2.6.3 |
nltk |
3.6.5 |
笔记本 |
6.4.5 |
numba |
0.55.2 |
numpy |
1.20.3 |
oauthlib |
3.2.0 |
opt-einsum |
3.3.0 |
包装 |
21.0 |
熊猫 |
1.3.4 |
pandas-profiling |
3.1.0 |
pandocfilters |
3 |
paramiko |
2.9.2 |
parso |
0.8.2 |
表“感觉” |
0.6.2 |
容易受骗的人 |
0.5.2 |
petastorm |
0.11.4 |
pexpect |
4.8.0 |
phik |
0.12.2 |
pickleshare |
0.7.5 |
枕头 |
8.4.0 |
皮普 |
21.2.4 |
bob体育客户端下载platformdirs |
2.5.2 |
情节 |
5.8.2 |
pmdarima |
1.8.5 |
棒 |
3.0.6 |
prompt-toolkit |
3.0.20 |
先知 |
1.0.1 |
protobuf |
3.19.4 |
psutil |
5.8.0 |
psycopg2 |
2.9.3 |
ptyprocess |
0.7.0 |
pyarrow |
7.0.0 |
pyasn1 |
0.4.8 |
pyasn1-modules |
0.2.8 |
pybind11 |
2.9.2 |
pycparser |
2.20 |
pydantic |
1.8.2 |
Pygments |
2.10.0 |
PyGObject |
3.36.0 |
PyJWT |
测试盒框 |
PyMeeus |
0.5.11 |
PyNaCl |
1.5.0 |
pyodbc |
4.0.31 |
pyparsing |
3.0.4 |
pyrsistent |
0.18.0 |
pystan |
2.19.1.1 |
python-apt |
2.0.0 + ubuntu0.20.4.7 |
python-dateutil |
2.8.2 |
python编辑器 |
1.0.4 |
pytz |
2021.3 |
PyWavelets |
1.1.1 |
PyYAML |
6.0 |
pyzmq |
22.2.1 |
正则表达式 |
2021.8.3 |
请求 |
2.26.0 |
requests-oauthlib |
1.3.1 |
requests-unixsocket |
0.2.0 |
rsa |
4.8 |
s3transfer |
0.5.2 |
scikit-learn |
0.24.2 |
scipy |
1.7.1上 |
seaborn |
0.11.2 |
Send2Trash |
1.8.0 |
setuptools |
58.0.4 |
setuptools-git |
1.2 |
世鹏科技电子 |
0.40.0 |
simplejson |
3.17.6 |
六个 |
1.16.0 |
切片机 |
0.0.7 |
smart-open |
5.2.1 |
smmap |
5.0.0 |
宽大的 |
3.3.1 |
spacy-legacy |
3.0.9 |
spacy-loggers |
1.0.2中 |
spark-tensorflow-distributor |
1.0.0 |
sqlparse |
0.4.2 |
srs |
2.4.3 |
ssh-import-id |
5.10 |
statsmodels |
0.12.2 |
汇总 |
0.8.9 |
tangled-up-in-unicode |
0.1.0 |
韧性 |
8.0.1 |
tensorboard |
2.9.1 |
tensorboard-data-server |
0.6.1 |
tensorboard-plugin-profile |
2.8.0 |
tensorboard-plugin-wit |
1.8.1 |
tensorflow |
2.9.1 |
tensorflow-estimator |
2.9.0 |
tensorflow-io-gcs-filesystem |
0.26.0 |
termcolor |
1.1.0 |
terminado |
0.9.4 |
testpath |
0.5.0 |
thinc |
8.0.17 |
threadpoolctl |
2.2.0 |
分词器 |
0.12.1 |
火炬 |
1.11.0 + cu113 |
torchvision |
0.12.0 + cu113 |
龙卷风 |
6.1 |
tqdm |
4.62.3 |
traitlets |
5.1.0 |
变形金刚 |
4.20.0 |
打字机 |
0.4.2 |
typing-extensions |
3.10.0.2 |
ujson |
4.0.2 |
unattended-upgrades |
0.1 |
urllib3 |
1.26.7 |
virtualenv |
20.8.0 |
愿景 |
0.7.4 |
芥末酱 |
0.9.1 |
wcwidth |
0.2.5 |
webencodings |
0.5.1 |
websocket-client |
1.3.1 |
Werkzeug |
2.0.2 |
轮 |
0.37.0 |
widgetsnbextension |
3.6.0 |
打包 |
1.12.1 |
xgboost |
1.5.2 |
氧化锌碘仿糊 |
3.6.0 |
Java和Scala库(Scala 2.12集群)
除了Java和Scala库在Databricks Runtime 11.1, Databricks Runtime 11.1 ML包含以下jar:
CPU集群
组ID |
工件ID |
版本 |
---|---|---|
com.typesafe.akka |
akka-actor_2.12 |
2.5.23 |
ml.combust.mleap |
mleap-databricks-runtime_2.12 |
0.20.0-db1 |
ml.dmlc |
xgboost4j-spark_2.12 |
1.5.2 |
ml.dmlc |
xgboost4j_2.12 |
1.5.2 |
org.graphframes |
graphframes_2.12 |
0.8.2-db1-spark3.2 |
org.mlflow |
mlflow-client |
1.27.0 |
org.mlflow |
mlflow-spark |
1.27.0 |
org.scala-lang.modules |
scala-java8-compat_2.12 |
0.8.0 |
org.tensorflow |
spark-tensorflow-connector_2.12 |
1.15.0 |
GPU集群
组ID |
工件ID |
版本 |
---|---|---|
com.typesafe.akka |
akka-actor_2.12 |
2.5.23 |
ml.combust.mleap |
mleap-databricks-runtime_2.12 |
0.20.0-db1 |
ml.dmlc |
xgboost4j-spark_2.12 |
1.5.2 |
ml.dmlc |
xgboost4j_2.12 |
1.5.2 |
org.graphframes |
graphframes_2.12 |
0.8.2-db1-spark3.2 |
org.mlflow |
mlflow-client |
1.27.0 |
org.mlflow |
mlflow-spark |
1.27.0 |
org.scala-lang.modules |
scala-java8-compat_2.12 |
0.8.0 |
org.tensorflow |
spark-tensorflow-connector_2.12 |
1.15.0 |