使用帐户控制台管理存储配置
本文描述了如何:
创建并配置一个S3桶,以存储一组有限的Databricks工作区信息,如库、一些日志和笔记本版本历史。
使用数据库账户控制台要创建存储配置它引用S3桶。
请注意
本文描述了使用帐户控制台的过程。若要了解如何使用帐户API创建存储配置,请参见使用Account API创建一个新的工作空间.有关遗留帐户类型,请参见配置AWS存储(遗留).
存储配置中包含的桶被称为工作区的根存储。不要使用根存储存储生产客户数据。相反,可以为生产数据创建额外的S3桶或其他数据源创建DBFS挂载点对他们来说。
定义存储配置并生成桶策略
这些说明向您展示了如何在创建新工作区之前从帐户控制台创建存储配置。您还可以创建存储配置,作为创建新工作区流程的一部分。看到创建和管理工作空间.
创建S3桶
以具有管理员权限的用户登录AWS控制台,然后转到S3服务。
使用在Databricks存储配置中输入的名称创建S3桶。
看到创建桶在AWS文档中。
重要的
S3桶必须与Databricks工作空间部署在同一个AWS区域中。
Databricks建议使用一个专用于Databricks的S3桶作为最佳实践,不与其他资源或服务共享。
桶名不能包含点表示法(
.
).不要重用遗留工作区中的桶。例如,如果要迁移到E2,则为E2设置创建一个新的AWS桶。
单击权限选项卡。
在桶的政策部分中,点击编辑.
中生成和复制的桶策略添加存储配置对话在数据库。
保存桶。
启用对象级日志记录(推荐)
Databricks强烈建议为根存储桶启用S3对象级日志记录。这样可以更快地调查可能出现的任何问题。请注意,S3对象级日志记录可能会增加AWS的使用成本。
有关说明,请参见关于S3桶和对象的CloudTrail事件日志记录的AWS文档.
查看存储配置
在账户控制台,点击云资源.
点击存储配置.
列出了所有存储配置Bucket名称和创建为每个显示日期。
单击存储配置名称可查看更多详细信息。
删除存储配置
存储配置创建后不能进行编辑。如果配置数据有误或不再需要,请删除存储配置。
在账户控制台,点击云资源.
点击存储配置.
在存储配置行中,单击“Actions”菜单图标,选择删除.
您也可以单击存储配置名称,单击删除在弹出对话框中。
在弹出的确认对话框中,单击确认删除.
使用客户管理的密钥加密根S3桶(可选)
可以使用客户管理的密钥加密根S3桶,这需要使用帐户API 2.0.
你可以添加加密密钥使用Account API创建一个新的工作空间或者稍后再添加密钥。有关更多信息,请参见用于工作空间存储的客户管理密钥.