Git与Databricks Repos的集成
Databricks Repos是Databricks中的一个可视化Git客户端。它支持常见的Git操作,例如克隆存储库、提交和推送、拉取、分支管理以及提交时的差异可视化比较。
在Repos中,您可以在笔记本或其他文件中开发代码,并使用Git进行版本控制、协作和CI/CD,遵循数据科学和工程代码开发的最佳实践。
你可以用Databricks回购做什么?
Databricks Repos通过与Git提供商集成,为数据和人工智能项目提供源代码控制。
在Databricks Repos,你可以使用Git功能:
克隆、推入和从远程Git存储库中提取。
为开发工作创建和管理分支。
创建笔记本,并编辑笔记本和其他文件。
在提交时直观地比较差异。
有关详细说明,请参见克隆一个Git repo和其他常见的Git操作.Databricks Repos也有一个API可以集成到CI/CD管道中。例如,您可以通过编程方式更新Databricks repo,使其始终拥有最新版本的代码。有关使用Databricks Repos进行代码开发的最佳实践的信息,请参见CI/CD工作流程与Git集成和Databricks Repos.
对于以下任务,在Git提供程序中工作:
创建一个拉请求。
解决合并冲突。
合并或删除分支。
重新建立分支的基础。
支持的Git提供者
Databricks支持以下Git提供程序:
GitHub
Bitbucket都云
GitLab
Azure DevOps
AWS CodeCommit
GitHub AE
看到获取一个Git访问令牌,并连接一个远程回购到Databricks.
Databricks Repos还支持Bitbucket服务器,GitHub企业服务器和GitLab自管理集成,如果服务器是互联网可访问的。要与不能通过互联网访问的私有Git服务器实例集成,请与Databricks代表联系。
对Databricks Repos中的任意文件的支持在Databricks Runtime 8.4及以上版本中可用。看到什么是工作区文件?.