计算新工作区的子网大小

当你使用帐户控制台创建一个新的工作空间, Databricks创建了一个谷歌云GKE集群.缺省情况下,子网的IP范围由Databricks决定。您可以选择使用高级配置显式地设置子网大小。

准确地配置Databricks工作空间使用的GKE子网非常重要,因为在部署工作空间后不能更改它们。如果Databricks子网的地址范围太小,则工作空间将耗尽其IP空间,从而导致Databricks作业失败。

为确定所需的地址范围大小,Databricks提供了microsoftexcel电子表格(.xlsx格式)。电子表格返回结果CIDR格式。

使用谷歌云工作空间网络大小数据表

  1. 下载分级表格

  2. 在microsoftexcel中打开大小电子表格。

    GCP网络规模电子表格
  3. 在两个黄色单元格中输入您的数据:

    • 在单元格B2中,输入期望在工作区中运行的最大节点数。请记住同时考虑您的作业集群和通用集群。有关这两种集群类型的比较,请参见砖的概念

    • 在单元格B6中,输入工作区中的最大集群数量。在最坏的情况下,所有集群都是单节点集群,这将等于工作空间中的节点数量。要正确地确定大小,首先要估计平均集群大小。接下来,用每个工作区的最大节点数除以平均集群大小。

    不要修改电子表格中的任何其他单元格。

  4. 控件下面行中的计算值输出标签大小你的网络:

    • GKE主子网大小(仅用于私有GKE集群):这总是/ 28因为谷歌云需要这个大小。

    • 节点子网大小:范围内的值/ 9通过/ 29,这取决于工作空间(单元格B2)中的最大节点数量。

    • Pods子网大小:范围内的值/ 9通过/ 21,这取决于工作空间(单元格B2)中的最大节点数量。

    • 业务子网大小:范围内的值/ 16通过/ 27日,这取决于工作空间中集群的最大数量(单元格B6)。

    使用这些值时创建一个新的工作空间