DataFrame¶
构造函数¶
|
pandas-on-Spark DataFrame对应于熊猫DataFrame逻辑。 |
属性和基础数据¶
该指数DataFrame(行标签)列。 |
|
DataFrame的列标签。 |
|
返回true,如果当前DataFrame是空的。 |
返回dtypes DataFrame。 |
|
返回一个元组代表DataFrame的维度。 |
|
返回一个列表代表DataFrame的轴。 |
|
返回一个int数组维数代表的数量。 |
|
返回一个int代表该对象的元素数量。 |
|
|
返回的一个子集DataFrame dtypes基于列的列。 |
返回一个Numpy DataFrame或系列的代表。 |
转换¶
|
复制这个对象的指标和数据。 |
检测项目在当前Dataframe缺失值。 |
|
|
把指定dtype pandas-on-Spark对象 |
检测项目在当前Dataframe缺失值。 |
|
检测项目在当前Dataframe non-missing值。 |
|
检测项目在当前Dataframe non-missing值。 |
|
|
的同义词DataFrame.fillna ()或Series.fillna ()与 |
返回布尔值的单个元素在当前对象。 |
索引、迭代¶
获取一个值,一双行/列标签。 |
|
获取一个值为一对行/列整数位置。 |
|
|
返回第一个n行。 |
|
回报指数首次出现的最大要求轴。 |
|
回报指数首次出现的最低要求的轴。 |
访问一组行和列的标签(s)或一个布尔系列。 |
|
纯粹基于integer-location索引选择的位置。 |
|
这是一个别名 |
|
迭代器/(列名,系列)对。 |
|
遍历DataFrame行(指数系列)对。 |
|
|
遍历DataFrame namedtuples行。 |
返回列的别名。 |
|
返回项目,从框架。 |
|
|
返回最后一个n行。 |
|
返回从DataFrame截面。 |
|
获取项目从对象给定键(DataFrame列,板片等)。 |
|
替换值的条件是错误的。 |
|
更换条件为真值。 |
|
查询的列DataFrame布尔表达式。 |
二元运算符函数¶
|
除了dataframe和其他,element-wise(二元运算符+)。 |
|
除了dataframe和其他,element-wise(二元运算符+)。 |
|
获得浮动dataframe分工和其他element-wise(二元运算符/)。 |
|
获得浮动dataframe分工和其他element-wise(二元运算符/)。 |
获得浮动dataframe分工和其他element-wise(二元运算符/)。 |
|
获得浮动dataframe分工和其他element-wise(二元运算符/)。 |
|
|
乘法dataframe和其他,element-wise(二元运算符*)。 |
|
乘法dataframe和其他,element-wise(二元运算符*)。 |
|
减法dataframe和其他,element-wise(二元运算符- - - - - -)。 |
|
减法dataframe和其他,element-wise(二元运算符- - - - - -)。 |
|
得到指数dataframe系列和其他的力量,element-wise(二元运算符* *)。 |
|
得到指数dataframe和其他的力量,element-wise(二元运算符* *)。 |
|
dataframe模等,element-wise(二元运算符%)。 |
|
dataframe模等,element-wise(二元运算符%)。 |
得到整数dataframe分工和其他,element-wise(二元运算符/ /)。 |
|
得到整数dataframe分工和其他,element-wise(二元运算符/ /)。 |
|
|
比较如果当前值小于另一个。 |
|
比较如果当前值大于另一个。 |
|
比较如果当前值小于或等于另一个。 |
|
比较当前值是否大于或等于另一个。 |
|
比较,如果当前值不等于另一个。 |
|
比较如果当前值等于另一个。 |
|
计算DataFrame和其他之间的矩阵乘法。 |
更新null元素值在同一位置其他。 |
函数的应用程序,GroupBy &窗口¶
|
应用一个函数DataFrame沿着一个轴。 |
一个函数应用于Dataframe elementwise。 |
|
|
应用函数(自我,* args, * * kwargs)。 |
|
总轴指定使用一个或多个操作。 |
总轴指定使用一个或多个操作。 |
|
|
使用一系列列组DataFrame或系列。 |
|
提供轧制转换。 |
|
提供扩展转换。 |
|
调用 |
计算/描述性统计¶
返回一个系列/ DataFrame与每个元素的绝对数值。 |
|
|
返回所有元素是否正确。 |
|
返回任何元素是否为真。 |
|
调整值在输入阈值(s)。 |
|
计算两两相关的列,不包括NA / null值。 |
|
计算两两相关。 |
|
对每一列数non-NA细胞。 |
|
协方差计算两两列,不包括NA / null值。 |
|
产生描述性统计,总结集中趋势,分散和形状数据集的分布、排除 |
|
返回不偏峰度使用费舍尔峰度的定义(峰度正常= = 0.0)。 |
|
返回不偏峰度使用费舍尔峰度的定义(峰度正常= = 0.0)。 |
|
返回值的平均绝对偏差。 |
|
返回值的最大。 |
|
返回值的均值。 |
|
返回的最小值。 |
|
返回所请求的轴的值的中值。 |
|
当前和前一个元素之间的百分比变化。 |
|
返回值的乘积。 |
|
返回值的乘积。 |
|
返回值在给定的分位数。 |
|
返回对象的独特的元素数量。 |
|
返回所请求无偏平均数标准误差在轴。 |
|
返回无偏斜规范化的n - 1。 |
|
返回值的总和。 |
|
返回样本标准差。 |
|
均方差的回报。 |
|
返回累积在DataFrame最低或系列轴。 |
|
返回在DataFrame累积最大或系列轴。 |
|
返回累积求和DataFrame或系列轴。 |
|
返回在DataFrame累积产品或系列轴。 |
|
圆一个DataFrame数量可变的位小数。 |
|
第一个离散元素的差异。 |
|
评估一个字符串描述DataFrame列的操作。 |
重建索引/选择/标签操作¶
前缀标签用绳子前缀。 |
|
后缀标签用绳子后缀。 |
|
|
使两个物体的轴与指定的连接方法。 |
|
选择在一天中的特定时间值(例如:)早上九时三十分。 |
|
选择在一天的特定时间之间的值(例如:9:00-9:30点)。 |
|
从列指定的标签。 |
|
返回所请求DataFrame与索引/列级(s)移除。 |
|
返回DataFrame删除重复的行,选择只考虑某些列。 |
|
返回布尔系列表示重复的行,选择只考虑某些列。 |
|
比较如果当前值等于另一个。 |
|
行或列的子集dataframe根据标签指定的索引。 |
|
选择第一个基于日期的时间序列数据偏移量。 |
|
返回第一个n行。 |
|
选择最终的时间序列数据基于日期抵消。 |
|
改变轴标签。 |
|
设置轴为索引或列的名称。 |
|
重置指数水平。 |
|
设置DataFrame指数(行标签)使用一个或多个现有的列。 |
|
适当的交换和交换值轴轴。 |
|
交换水平i和j在特定MultiIndex轴。 |
|
返回给定的元素位置指数沿着一个轴。 |
DataFrame中的每个元素是否包含在价值观。 |
|
|
返回一个随机样本的物品从一个轴的对象。 |
|
截断或一系列DataFrame之前和之后的一些索引值。 |
缺失的数据处理¶
|
的同义词DataFrame.fillna ()或Series.fillna ()与 |
|
删除缺失值。 |
|
填补NA / NaN值。 |
|
返回一个新的DataFrame值替换为另一个值。 |
|
的同义词DataFrame.fillna ()或Series.fillna ()与 |
|
的同义词DataFrame.fillna ()或Series.fillna ()与 |
|
填补NaN值使用插值法。 |
重塑、排序置换¶
|
创建一个spreadsheet-style DataFrame数据透视表。 |
|
返回重塑DataFrame由给定的索引/列值。 |
|
类对象的标签(沿着一个轴) |
|
通过值沿轴。 |
|
返回第一个n行命令列在降序排列。 |
|
返回第一个n行命令列以升序排序。 |
堆栈(s)规定的级别从列索引。 |
|
主(一定层次)索引标签。 |
|
|
透视的DataFrame宽格式长格式,选择离开标识符变量集。 |
|
行变换的每个元素类似,复制索引值。 |
|
挤压1维轴标量对象。 |
转置索引和列。 |
|
转置索引和列。 |
|
|
符合DataFrame与可选填新索引逻辑,把NA /南在前面的位置没有价值指数。 |
|
像其他对象返回一个DataFrame与匹配指数。 |
|
计算数值数据(1到n)沿轴。 |
结合/加入/合并¶
|
行其他附加到调用者,返回一个新对象。 |
|
DataFrame分配新列。 |
|
合并DataFrame对象数据库样式加入。 |
|
另一个DataFrame的连接列。 |
|
从另一个DataFrame使用non-NA值修改到位。 |
|
在指定位置插入列DataFrame。 |
序列化/ IO /转换¶
|
结构化或记录ndarray DataFrame进行转换。 |
|
打印一个简明的总结DataFrame。 |
|
写DataFrame火花表。 |
|
写DataFrame三角洲湖表。 |
|
写DataFrame拼花文件或目录。 |
|
写DataFrame火花数据源。 |
|
对象写入一个逗号分隔值(csv)文件。 |
返回一个熊猫DataFrame。 |
|
|
呈现一个DataFrame作为HTML表。 |
一个NumPy ndarray DataFrame或系列的代表值。 |
|
|
引发相关功能。 |
|
呈现一个友好的控制台DataFrame表格输出。 |
|
将对象转换为一个JSON字符串。 |
|
DataFrame转换为一本字典。 |
|
对象写入一个Excel表。 |
|
将对象复制到系统剪贴板。 |
|
打印系列或DataFrame Markdown-friendly格式。 |
|
DataFrame转换为NumPy记录数组中。 |
|
呈现一个对象乳胶表格环境表。 |
属性返回一个斯泰勒对象包含的方法构建一个风格DataFrame HTML表示。 |
策划¶
DataFrame.plot
既是一个可调用的方法和一个名称空间属性为特定形式的策划方法DataFrame.plot。<一>
。
的别名 |
|
|
画一个堆放区域的。 |
|
单杠的阴谋。 |
|
竖线阴谋。 |
|
画一个直方图DataFrame的列。 |
|
做一个系列的箱线图列。 |
|
情节DataFrame /系列。 |
|
生成饼图。 |
|
创建一个散点图不同大小和颜色标记点。 |
|
使用高斯内核生成核密度估计的阴谋。 |
|
画一个直方图DataFrame的列。 |
|
做一个系列的箱线图列。 |
|
使用高斯内核生成核密度估计的阴谋。 |
Pandas-on-Spark特定¶
DataFrame.pandas_on_spark
提供pandas-on-Spark特定功能,只存在于熊猫API火花。这些可以访问DataFrame.pandas_on_spark。<函数/属性>
。
应用一个函数需要熊猫熊猫DataFrame DataFrame和输出。 |
|
变换块的功能需要熊猫熊猫DataFrame DataFrame和输出。 |