为旧HIPAA支持创建和验证集群

重要的

本文适用于遗留的HIPAA遵从性特性。有关E2平台上HIPAA遵从性特性的概述,请参阅文章bob体育客户端下载符合HIPAA的特性

如果您的工作空间使用遗留HIPAA支持,请使用以下说明创建和验证HIPAA遵从性特性的集群,以处理PHI数据。

  1. 创建集群

    请按照创建集群.作为配置步骤的一部分,您必须选择砖运行时

    警告

    Databricks运行时机器学习包括使用的高性能分布式机器学习包MPI(消息传递接口)和其他底层通信协议。因为这些协议本身不支持在线加密,所以这些ML包可能会通过网络发送未加密的敏感数据。如果您的工作流不依赖于这些包,则这些包不会通过网络更改数据加密。

    这些ML包通过网络发送的消息通常是ML模型参数或关于训练数据的汇总统计信息。因此,通常不希望敏感数据(如受保护的健康信息)不加密地通过网络发送。然而,这些包的某些配置或使用(例如特定的模型设计)可能导致通过网络发送包含此类信息的消息。

    受影响的软件包如下:

  2. 使用EBS卷配置集群(遗留HIPAA支持)

    提供EBS卷,因为Databricks的EBS卷是加密的,而默认的本地存储不是加密的。

    EBS卷
  3. 验证加密是否已启用。

    1. 在工作区中创建一个笔记本,并将该笔记本附加到上一步中创建的集群。

    2. 在笔记本上执行如下命令:

      scala火花相依得到“spark.ssl.enabled”

      如果返回值为true,则创建开启加密的集群成功。如果没有,请联系帮助@com

重要的

spark-submit在符合hipaa的集群上不支持。