开始:免费试用和安装

如果您是Databricks的新手,那么您已经找到了开始的地方。学习如何建立一个免费试用和云帐户。有关更多在线培训资源的信息,请参见获得免费的Databricks培训

在谷歌Cloud上开始Databricks免费试用

这些是关于如何使用免费试用订阅Databricks的详细说明,在免费试用期满后,免费试用订阅将变成现收现付订阅。

请注意

  • 如果您的公司有合同订阅,请不要使用这些说明。向您的Databricks代表咨询如何使用谷歌市场私人优惠创建您的订阅。

  • 如果您已经熟悉在谷歌Marketplace中设置新应用程序,则可以使用更短的应用程序关于创建新的免费试用订阅的快速入门说明

要让用户在谷歌云上的Databricks上运行,您必须:

  1. 在谷歌云市场创建您的Databricks订阅。这将创建一个Databricks帐户。您是帐户所有者,只有您可以执行初始设置,但您可以将其他用户分配为帐户管理员来执行后续帐户管理任务。

  2. 至少创建一个数据库工作空间.工作区是您的团队将用于访问所有Databricks资产的环境。

  3. 向工作区中添加用户和组。

在谷歌云部署数据对于这个过程的概述。

需求

在创建谷歌云帐户Databricks之前:

  • 你必须有一个谷歌计费账号

  • 您必须具备以下角色谷歌IAM (Identity and Access Management)

    • 计费管理员角色/ billing.admin)为目标云帐单帐户项目所在的谷歌云组织。如果您没有此角色,请联系组织管理员请求访问。

    • 查看器角色/查看器)用于与计划使用的帐单帐户相关联的项目。如果您不是查看者,您可以联系项目所有者以请求访问,或者创建一个新项目以授予自己正确的权限.如果创建一个新项目,则必须这样做使计费并将项目链接到所需的云计费帐户。

    要了解谷歌云组织、项目和计费之间的关系,请参阅谷歌文档云计费访问控制.要了解BOB低频彩关于谷歌Cloud中的角色和权限的更多信息,请参阅关于理解角色

    您可能不是组织中唯一可以取消Databricks订阅的用户。权限的谷歌云用户可以取消订阅consumerprocurement.orders.cancel对于帐单帐户中具有帐单管理员角色或在父组织中具有组织所有者角色的人来说是这样。

    重要的

    Databricks建议确认可以取消Databricks订阅的谷歌云用户集是正确的用户集。过于广泛的访问可能会导致意外取消订阅,这会删除Databricks帐户中的所有工作区。工作区删除是不可逆的。

  • 你必须有一个谷歌云项目来部署你的工作空间。在创建Databricks工作区时需要项目ID。这并需要与您的计费帐户相关联的谷歌云项目相同。在工作空间创建过程中,Databricks . exe在项目中启用一些必需的谷歌api如果它们尚未启用。

    如果你还没有一个谷歌云项目来部署你的工作空间,现在创建一个:

    1. 确认您的谷歌帐户已启用谷歌的工作空间云的身份

    2. 确认您在谷歌云控制台中定义了谷歌云标识组织对象。如果需要,您可以查看谷歌文档创建和管理组织

    3. 创建项目。请参阅谷歌文档文章创建和管理组织.您必须定义项目的父组织。如果在创建项目时不指定项目ID,系统会自动生成项目ID。

    4. 复制谷歌云项目ID。您需要它来创建Databricks工作空间。

    如果您有一个项目,但不知道它的ID,请转到您的谷歌云平台控制台资源管理bob体育客户端下载页面。找到您的项目并复制其ID。

  • 计划与工作区一起使用以运行集群的谷歌Cloud项目必须具有适当的配额。检查项目所需的资源配额.您可能需要请求增加配额并等待批准。如果您更改了配额,请等待15分钟使更改生效,然后再创建工作空间。如果你要求加薪,在收到邮件确认加薪后15分钟就可以了。

  • 要为创建工作空间做准备,请确认创建工作空间所需的权限。

    对于每个工作空间,Databricks都会创建一个服务帐户,该帐户具有创建和管理工作空间所需的最低权限。您的谷歌OAuth标识将用于向项目上的服务帐户授予权限。你所要做的就是点击好吧在标准OAuth对话框中。创建工作空间的Databricks帐户admin必须对创建工作空间时指定的项目具有正确的权限。

    如果您计划创建工作区,请确保以下其中之一适用于您:

    • 您是在工作空间创建期间指定的谷歌Cloud项目的项目所有者。

    • 您是在工作空间创建期间指定的谷歌Cloud项目的项目编辑器和IAM管理员。

    Databricks授予服务帐户的项目权限集包括与以下角色关联的权限:

    • Kubernetes管理员(内置角色)

    • 计算存储管理员(内置角色)

    • Databricks在启动工作区时自动创建的自定义角色的权限。

    您可以查看所需的权限集以及Databricks如何使用每个权限:

  • 如果您的谷歌云组织策略启用域限制共享,请确保Databricks的谷歌云客户id (C01p0oudw)和您自己组织的客户ID都在策略的允许列表中。请参阅谷歌文章设置组织策略.如果需要帮助,请在配置工作空间之前联系Databricks代表。

设置Databricks免费试用版和第一个工作空间

请注意

如果您的公司有合同订阅,请不要使用这些说明。向您的Databricks代表咨询如何使用谷歌市场私人优惠创建您的订阅。

  1. Databricks在谷歌云市场上市

    还有其他方法可以到达这个页面。去谷歌云市场浏览器,使用市场搜索框搜索“Databricks”,然后单击.你也可以去谷歌云控制台,然后在左侧导航中,在合作伙伴解决方案下,单击

  2. 在顶部导航的项目选择器中,选择与希望与Databricks一起使用的计费帐户相关联的谷歌Cloud项目。这并不要求与用于部署工作区的项目相同。

    市场列表项目选择器
  3. 审查定价、取消、更改政策和服务条款。

    Databricks对使用Databricks单元(DBUs)中的Databricks收费。工作负载消耗的DBUs数量取决于许多因素,包括Databricks计算类型(多用途或工作)和谷歌云机类型。详细信息请参见定价页.如果您对价格有疑问,请联系Databricks代表。

    您的谷歌云账户会产生额外的费用:

    • 谷歌Cloud向您收取Databricks为Databricks基础设施在您的帐户中创建的GKE集群的每个工作空间的额外费用。截至2021年3月30日,该GKE集群的成本约为200美元/月,与GKE集群运行的天数成比例。价格可以变化,所以检查最新的价格

    • 即使Databricks集群空闲,GKE集群成本也会生效。为减少此空闲时间成本,如果Databricks Runtime集群五天内没有活动,Databricks将删除帐户中的GKE集群。其他资源如VPC、GCS桶等保持不变。下一次Databricks Runtime集群启动时,Databricks将重新创建GKE集群,这将增加初始Databricks Runtime集群启动时间。对于删除GKE集群如何降低每月成本的示例,假设您在每月的第一天使用了Databricks Runtime集群,但在每月的其余时间都没有使用:您的GKE使用量将是空闲超时生效前的五天,没有其他时间,每月成本约为33美元。

  4. 在页面顶部,单击订阅

  5. 在订单汇总页面:

    1. 选择订阅周期。

    2. 选择计费帐户。选择器中显示的默认计费帐户基于您在预览页顶部导航中选择的项目。如果您可以访问多个项目,则计费帐户选择器将显示其他计费帐户选项。

    3. 阅读条款部分。

    4. 选择复选框以确认同意计费和服务条款。

    5. 点击订阅

  6. 在弹出的“您的订单请求已发送到Databricks”窗口中,单击在Databricks注册

  7. 在Welcome to Databricks弹出窗口中:

    1. 输入你的公司名称。请勿输入电子邮件地址。

    2. 点击用谷歌登录.谷歌可能会要求您选择您的谷歌帐户电子邮件地址。

  8. 确认身份并确认访问后,您将在谷歌云市场中看到Databricks清单。在顶部,单击蓝色按钮在提供者上管理.如果上面的蓝色按钮显示在Databricks注册,等待几秒钟,重新加载网页。重复,直到蓝色按钮显示在提供者上管理,然后按那个按钮。

    重要的

    点击是非常重要的在提供者上管理激活您的订阅。

  9. 在“You 're Leaving谷歌”弹出框中,单击好吧.您可能需要选择一个谷歌帐户电子邮件地址并确认您的身份。

  10. 选择一个计划。一开始你使用的是标准套餐,但你可以升级到高级套餐。您可以比较不同的数据库定价计划.稍后,您可以升级或降级您的帐户计划。升级和降级都会影响未来的工作空间,但是升级和降级对现有工作空间的工作方式有重要区别。看到确认或更改您的订阅计划

  11. 你看到数据库了账户控制台,在这里您可以创建和管理您的工作空间。您可能希望将帐户控制台网页添加为书签。看到管理您的Databricks帐户

  12. 在Databricks帐户控制台中,单击创建工作区创建第一个工作空间。看到使用帐户控制台创建和管理工作区更多细节。

    请注意

    如果您计划使用大型集群或许多工作空间,请确保您的工作空间有足够的IP空间来运行Databricks作业网络大小计算器

登录到Databricks工作空间

Databricks工作区用户使用其谷歌云身份帐户(或GSuite帐户)进行身份验证谷歌的OAuth 2.0实现,它符合OpenID连接规范,并通过了OpenID认证。Databricks向谷歌提供身份验证请求中的openid配置文件作用域值。可选地,您可以配置您的谷歌云身份帐户(或GSuite帐户)与外部SAML 2.0身份提供程序(IdP)联合以验证用户凭据。谷歌云身份可以与Azure Active Directory, Okta, Ping和其他idp联合。但是,Databricks只与谷歌身份平台api直接交互。bob体育客户端下载

Databricks无法访问用户凭据。这种架构降低了与存储或保护用户凭据相关的风险,因为Databricks无法访问这些凭据。

工作空间用户登录工作空间有两种方式:

  • 所有用户都可以直接使用他们的工作区URL:普通用户、工作空间管理员和帐户管理员可以直接使用工作空间URL。用户通过Databricks与谷歌的云身份OAuth 2.0实现集成进行身份验证。将用户添加到工作区时,用户将收到一封包含URL的电子邮件。

  • 帐户管理员也可以使用谷歌云控制台要访问工作区:帐户管理员使用谷歌身份OAuth 2.0进行身份验证以访问Databricks帐户控制台。帐户控制台提供了可供选择的可用工作区列表。您将被重定向到具有身份验证令牌的工作区登录页面。如果令牌被接受,则不会提示您再次登录。在第一次登录时,您将面临是否同意OAuth作用域的挑战。

配置工作空间和数据权限

Databricks将某些活动限制为工作空间管理员,以确保客户能够安全地配置对数据和代码的访问。某些Databricks特性必须由工作区管理员启用,用户才能使用它们。有关常见任务,请参见开始Databricks管理

在完成大多数常见任务之前,管理员需要配置Databricks SQL。看到Databricks SQL的管理员登录而且设置查询表的用户

请注意

当您创建Databricks工作区时,您将被授予管理员权限。