凭据修订

Databricks编辑审计日志和log4j Apache Spark日志中的密钥和凭据,以保护您的数据免受信息泄露。Databricks在登录时编撰三种类型的凭据:AWS访问密钥、AWS秘密访问密钥和URI中的凭据。一旦发现这些秘密,Databricks就会用占位符替换它们。对于某些凭据类型,Databricks还附加hash_prefix,这是用于验证的凭据的md5校验和的前8个十六进制字节。

AWS访问密钥编校

对于AWS访问密钥,Databricks搜索以AKIA然后用REDACTED_AWS_ACCESS_KEY (hash_prefix).例如Databricks日志2017/02/08:访问AWS使用AKIADEADBEEFDEADBEEF作为2017/01/08:访问AWS使用REDACTED_AWS_ACCESS_KEY (655 f9d2f)

AWS秘密访问密钥编校

Databricks将AWS秘密访问密钥替换为REDACTED_POSSIBLE_AWS_SECRET_ACCESS_KEY没有附加它的哈希值。例如Databricks日志2017/01/08:访问AWS使用99 abcdeuw + zXXAxllliupwqqqzDEUFdAtaBrickX作为2017/01/08:访问AWS使用REDACTED_POSSIBLE_AWS_SECRET_ACCESS_KEY

由于AWS没有为秘密访问密钥提供显式标识符,因此Databricks可能编录了一些看似随机生成的40个字符长的字符串,而不是AWS秘密访问密钥。

URI编校中的凭证

砖检测/ /用户名:password@mycompany.com在URI中替换用户名:密码REDACTED_CREDENTIALS (hash_prefix).Databricks计算哈希从用户名:密码(包括).例如Databricks日志2017/01/08:访问https://admin:admin@mycompany.com作为2017/01/08:访问https://REDACTED_CREDENTIALS (d2abaa37) @mycompany.com