为Delta Lake配置存储凭证
Databricks将Delta Lake表的数据存储在云对象存储中。配置对云对象存储的访问需要包含您的存储帐户的云帐户中的权限。看到与Databricks上的外部数据交互。
将存储凭证作为DataFrame选项传递
Delta Lake支持将存储凭证指定为dataframerader和DataFrameWriter的选项。如果需要与由不同访问键控制的多个存储帐户中的数据进行交互,则可以使用此方法。
请注意
该特性在Databricks Runtime 10.1及以上版本中可用。
例如,你可以通过DataFrame选项传递你的存储信用:
df1=(火花。读。选项(“fs.s3a.access.key”,“< access-key-1 >”)。选项(“fs.s3a.secret.key”,“< secret-key-1 >”)。读(“…”))df2=(火花。读。选项(“fs.s3a.access.key”,“< access-key-1 >”)。选项(“fs.s3a.secret.key”,“< secret-key-2 >”)。读(“…”))(df1。联盟(df2)。写。模式(“覆盖”)。选项(“fs.s3a.access.key”,“< access-key-3 >”)。选项(“fs.s3a.secret.key”,“< secret-key-3 >”)。保存(“…”))
瓦尔df1=火花。读。选项(“fs.s3a.access.key”,“< access-key-1 >”)。选项(“fs.s3a.secret.key”,“< secret-key-1 >”)。读(“…”)瓦尔df2=火花。读。选项(“fs.s3a.access.key”,“< access-key-2 >”)。选项(“fs.s3a.secret.key”,“< secret-key-2 >”)。读(“…”)df1。联盟(df2).写。模式(“覆盖”)。选项(“fs.s3a.access.key”,“< access-key-3 >”)。选项(“fs.s3a.secret.key”,“< secret-key-3 >”)。保存(“…”)