pyspark.RDD.countByValue

抽样。 countByValue ( )→Dict类型(K,int]

返回每个独特的计算值在这个抽样的字典(价值,计数)对。

例子

> > >排序(sc并行化([1,2,1,2,2),2)countByValue()项目())[(1、2),(2,3)]