跳到主要内容
公司博客上

使用Databricks实现Apache Spark的端到端安全

通过戴夫王

2016年6月8日 公司博客上

分享这篇文章

今天,我们激动地宣布,第一阶段的完成企业安全数据库(DBES)框架。我们可以自豪地说,这使得Databricks成为第一家也是唯一一家在Apache Spark基础上提供全面企业安全的公司。

数以百计的组织已经部署了Databricks来提高他们的数据团队的生产力,为他们的生产Spark应用程序提供动力,并使数据访问民主化。随着Databricks继续在注重安全的行业(如金融服务和医疗保健)中获得采用,我们也专注于使他们能够最大化其数据的价值,同时满足各自行业(如Sarbanes-Oxley或HIPAA)严格的安全性和合规性要求。

大数据生命周期的整体安全

传统上,企业组织只有解决部分大数据基础设施的安全解决方案。如今,企业需要覆盖其大数据生命周期的整体安全性:从文件处理、大数据集群、代码管理、作业工作流、应用程序部署、仪表板到报告。

Databricks即时数据平台采用全面的方法,通过构建安全的所有bob体育客户端下载方面来解决企业安全挑战加密、身份管理、基于角色的访问控制、数据治理和遵从性标准-原生导入数据平台配合DBES。bob体育客户端下载

  • 加密:在静止和飞行中提供强大的加密,采用一流的标准,如SSL和存储在AWS密钥管理系统(KMS)中的密钥。
  • 综合身份管理:通过SAML 2.0和Active Directory促进与企业标识提供者的无缝集成。
  • 基于角色访问控制:支持对企业数据基础设施的每个组件进行细粒度管理访问,包括文件、集群、代码、应用程序部署、仪表板和报告。
  • 数据治理:确保能够监视和审计企业数据基础设施的各个方面所采取的所有操作。
  • 符合标准:作为Databricks持续DBES战略的一部分,实现了超过FedRAMP高标准的安全合规标准。

简而言之,DBES将在整个大数据生命周期的各个方面提供整体安全性。

DBES第一阶段的主要成就

DBES建立在已有的大量Databricks访问管理和加密功能的基础上。随着今天DBES第一阶段的完成,企业可以在个人基础上控制对Apache Spark集群的访问,使用SAML 2.0兼容的标识管理提供者服务管理用户身份,以及端到端可审计性。

集群访问控制列表

集群访问控制列表(或集群acl)使Databricks管理员能够根据企业安全策略微调Databricks用户的自主权。例如,可以严格限制启动新集群的能力以控制成本,同时给予团队以自助服务方式在现有集群上运行代码的完全自由。

具体来说,管理员将能够定义是否允许用户单独执行以下操作:

  • 启动一个新的集群
  • 终止现有集群
  • 在现有集群上运行(附加到)代码
  • 修改现有集群的配置
  • 重新启动现有集群

SAML 2.0支持

SAML 2.0在Databricks

企业现在可以使用SAML 2.0兼容的标识提供程序来验证和授权对Databricks平台的访问。bob体育客户端下载由于许多企业已经利用了身份提供者服务,而且几乎所有主要的身份提供者(例如Okta、PingIdentity)都支持SAML 2.0,这将极大地简化Databricks平台上帐户的设置和管理。bob体育客户端下载Databricks用户也将享受更简化的登录过程,因为现在他们只需点击一下就可以登录平台,而不必记住(可能还需要恢复)密码。bob体育客户端下载

端到端审计日志

审计日志将为具有安全意识的行业(如医疗保健或金融服务)的企业提供工具,以满足严格的合规要求,如HIPAA或Sarbanes-Oxley。Databricks审计日志是平台上活动的全面记录,允许企业根据业务需要监视Databricks的详细使用模式。bob体育客户端下载这使得中央权威机构可以轻松地重建关键事件:

  • 动作的时间和细节。
  • 触发操作的用户(包括管理员)。
  • 以及其他重要信息。

这些日志以人类可读的格式存储,因此可以轻松地查看日志,管理员还可以使用Databricks平台本身分析审计日志中的信息。bob体育客户端下载

让大数据变得简单(和安全)

Databricks的愿景是让任何人都能轻松地构建和部署高级分析解决方案。与Databricks企业安全框架数据库可以满足现代企业端到端保护大数据的各种(有时是相互竞争的)需求。第一阶段只是开始,请继续关注在不久的将来会有更多的进展。

对使用Databricks保护Apache Spark工作负载感兴趣?通过免费试用来测试平台bob体育客户端下载联系我们为个性化的演示

免费试用Databricks
看到所有公司博客上的帖子