笔记本隔离

笔记本隔离是指变量的可见性和类之间的笔记本。砖支持两种类型的隔离:

  • 变量和类隔离

  • 火花会话隔离

请注意

因为所有的笔记本电脑连接到相同的集群上执行相同的集群vm,即使火花会话隔离使没有保证用户隔离在一个集群中。

变量和类隔离

变量和类只能在当前的笔记本。例如,两个笔记本电脑连接到相同的集群可以定义变量和类同名的,但这些对象是不同的。

定义一个类,它是可见的所有笔记本连接到相同的集群,定义类包细胞。然后你可以访问类通过使用它的完全限定名称,这是一样的访问一个类的附加Scala或Java库。

火花会话隔离

每一个笔记本连接到一个集群都有预定义的变量命名火花表示一个SparkSessionSparkSession的入口点是使用火花api以及设置运行时配置。

引发会话隔离是默认启用。您还可以使用全球临时视图在笔记本共享临时视图。看到创建视图。禁用火花会话隔离,集spark.databricks.session.share真正的火花配置

重要的

设置spark.databricks.session.share真正打破流笔记本电池和流使用的监测工作。具体地说:

  • 在流式细胞图不显示。

  • 工作不块只要流运行(他们只是完成“成功”,停止流)。

  • 流工作未受监控终止。相反,您必须手动调用awaitTermination ()

  • 调用创建一个新的可视化流媒体DataFrames行不通。

细胞触发命令在其他语言中(也就是说,细胞使用% scala,% python,r %,%的sql)和细胞,包括其他笔记本电脑(也就是说,使用运行%当前笔记本)的一部分。因此,这些细胞在同一个会话与其他笔记本电池。相比之下,笔记本的工作流运行一个笔记本和一个孤立的SparkSession,这意味着临时视图中定义这样的一个笔记本不可见的在其他笔记本。