Git与Databricks Repos的集成

Databricks Repos是Databricks中的一个可视化Git客户端。它支持常见的Git操作,例如克隆存储库、提交和推送、拉取、分支管理以及提交时的差异可视化比较。

在Repos中,您可以在笔记本或其他文件中开发代码,并使用Git进行版本控制、协作和CI/CD,遵循数据科学和工程代码开发的最佳实践。

你可以用Databricks回购做什么?

Databricks Repos通过与Git提供商集成,为数据和人工智能项目提供源代码控制。

在Databricks Repos,你可以使用Git功能:

  • 克隆、推入和从远程Git存储库中提取。

  • 为开发工作创建和管理分支。

  • 创建笔记本,并编辑笔记本和其他文件。

  • 在提交时直观地比较差异。

有关详细说明,请参见克隆一个Git repo和其他常见的Git操作.Databricks Repos也有一个API可以集成到CI/CD管道中。例如,您可以通过编程方式更新Databricks repo,使其始终拥有最新版本的代码。有关使用Databricks Repos进行代码开发的最佳实践的信息,请参见CI/CD工作流程与Git集成和Databricks Repos

对于以下任务,在Git提供程序中工作:

  • 创建一个拉请求。

  • 解决合并冲突。

  • 合并或删除分支。

  • 重新建立分支的基础。

支持的Git提供者

Databricks支持以下Git提供程序:

  • GitHub

  • Bitbucket都云

  • GitLab

  • Azure DevOps

  • AWS CodeCommit

  • GitHub AE

看到获取一个Git访问令牌,并连接一个远程回购到Databricks

Databricks Repos还支持Bitbucket服务器,GitHub企业服务器和GitLab自管理集成,如果服务器是互联网可访问的。要与不能通过互联网访问的私有Git服务器实例集成,请与Databricks代表联系。

对Databricks Repos中的任意文件的支持在Databricks Runtime 8.4及以上版本中可用。看到什么是工作区文件?

下一个步骤

设置Databricks回购