笔记本隔离
笔记本隔离是指变量的可见性和类之间的笔记本。砖支持两种类型的隔离:
变量和类隔离
火花会话隔离
请注意
因为所有的笔记本电脑连接到相同的集群上执行相同的集群vm,即使火花会话隔离使没有保证用户隔离在一个集群中。
变量和类隔离
变量和类只能在当前的笔记本。例如,两个笔记本电脑连接到相同的集群可以定义变量和类同名的,但这些对象是不同的。
定义一个类,它是可见的所有笔记本连接到相同的集群,定义类包细胞。然后你可以访问类通过使用它的完全限定名称,这是一样的访问一个类的附加Scala或Java库。
火花会话隔离
每一个笔记本连接到一个集群都有预定义的变量命名火花
表示一个SparkSession
。SparkSession
的入口点是使用火花api以及设置运行时配置。
引发会话隔离是默认启用。您还可以使用全球临时视图在笔记本共享临时视图。看到创建视图。禁用火花会话隔离,集spark.databricks.session.share
来真正的
在火花配置。
重要的
设置spark.databricks.session.share
真正打破流笔记本电池和流使用的监测工作。具体地说:
在流式细胞图不显示。
工作不块只要流运行(他们只是完成“成功”,停止流)。
流工作未受监控终止。相反,您必须手动调用
awaitTermination ()
。调用创建一个新的可视化流媒体DataFrames行不通。
细胞触发命令在其他语言中(也就是说,细胞使用% scala
,% python
,r %
,%的sql
)和细胞,包括其他笔记本电脑(也就是说,使用运行%
当前笔记本)的一部分。因此,这些细胞在同一个会话与其他笔记本电池。相比之下,笔记本的工作流运行一个笔记本和一个孤立的SparkSession
,这意味着临时视图中定义这样的一个笔记本不可见的在其他笔记本。