工作失败典型错误消息

工作运行压制和失败是由于观察到典型的错误消息。

写的亚当Pavlacka

去年发表在:2022年5月11日

问题

你的工作运行失败的扼杀了由于观察典型错误错误消息。

集群成为遥不可及的在运行原因:xxx-xxxxxx-xxxxxxx压制是由于观察典型错误

导致

返回的工作在这个集群太多大结果Apache火花司机节点。

结果,司机服务耗尽内存,和集群变得遥不可及的。

这可能发生在调用.collect,告诉API。

解决方案

你可以减少工作负载集群或增加的价值spark.memory.chauffeur.size

司机服务引发司机在同一主机上运行。当你司机服务分配更多的内存,那么总体内存都可以引发司机。

设定的值spark.memory.chauffeur.size:

  1. 在您的工作区中打开集群配置页面。
  2. 点击编辑
  3. 扩大高级选项
  4. 输入的值spark.memory.chauffeur.size在mb火花配置字段。
  5. 点击确认并重新启动
删除

信息

的默认值spark.memory.chauffeur.size是1024字节。这是写成spark.memory.chauffeur.size1024mb在火花配置。最大值是16 GB的较小或司机节点的总内存的20%。


这篇文章有用吗?