熊猫DataFrame

回到术语表

熊猫的标志

说到数据科学,可以毫不夸张地说,通过使用pandas DataFrame充分发挥其潜力,您可以改变您的业务工作方式。为此,您需要正确的数据结构。这些将帮助您在操作和分析数据时尽可能高效。

为此目的可以使用的最有用的数据结构之一是pandas DataFrame。

pandas是一个为Python编程语言编写的开源库,提供快速且可适应的数据结构和数据分析工具。Wes McKinney最初编写了这个易于使用的数据操纵工具。它构建在NumPy包上,其关键数据结构称为DataFrame。

如果你在想,“等等。慢下来。什么是熊猫数据框架?“’,那就别担心,我们很快就会深入讨论这件事。现在,您只需要知道pandas DataFrame是一个用户友好的工具,非常适合在严重依赖数据的领域中使用。这包括科学计算、机器学习以及前面提到的数据科学。

我们将在下面详细介绍熊猫。我们将讨论的一些主题包括如何制作pandas DataFrame,如何开始使用pandas DataFrame,以及使用pandas DataFrame的优点。

Pandas提供两种类型的数据结构:

  • pandas数据框架(二维)
  • 熊猫系列(一维)
Pandas数据结构类型

pandas使用CSV或TSV文件或SQL(结构化查询语言)数据库等数据,并将它们转换为带有行和列的Python对象,称为DataFrame。这些对象与统计软件(如Excel或SPSS)中的表格非常相似。类似于Excel的工作方式,pandas DataFrames允许您在观察数据行和变量列中存储和操作表格数据,以及从给定的数据集中提取有价值的信息。

你可以执行Apache Spark 3.2上的pandas API.这可以让你平均分配pandas工作负载,确保每件事都能以应有的方式完成。

现在我们已经介绍了pandas提供的两种类型的数据结构,是时候后退一步,看看pandas DataFrame实际上是什么。我们将给出一个快速的定义,然后是DataFrame可以接受的输入类型的方便列表。

什么是熊猫数据框架?

pandas DataFrame是一种表示和处理表格数据的方法。可以将其视为将数据组织为行和列的表,使其成为二维数据结构。DataFrame可以从头创建,也可以使用其他数据结构,如NumPy数组。

当您使用pandas DataFrame时,您可以从各种来源导入各种格式的数据。例如,您可以导入NumPy数组,同时还可以导入pandas内容。

以下是DataFrame接受的主要输入类型:
  • 单维字典,列表,字典或系列
  • 二维numpy.ndarray
  • 结构化或记录ndarray
  • 一个系列
  • 另一个DataFrame

关于如何使用pandas数据框架的常见问题

知道熊猫提供了哪些结构以及熊猫数据框架到底是什么并不一定等于知道熊猫数据框架的一切。这就是为什么我们在本节专门回答一些关于如何使用pandas dataframe的最常见的问题。

如果你的问题不在下面我们将回答的六个问题之列,请继续阅读。在本文结束之前,我们将讨论其他几个主题,并回答其他几个关键问题。

1.如何删除索引,行或列从熊猫数据框架

并非所有的DataFrame列(或行或索引)都是同样必要的。事实上,有时你会发现你需要删除一个DataFrame对象,这就是为什么我们将向你展示如何这样做。

我们将依次介绍如何删除每个对象,从索引开始。对于这些以及本文中接下来的所有示例,我们将在代码中将“DataFrame”缩写为“df”,因为这是一种常见的做法。

虽然dataframe总是有某种索引,这使得完全删除索引变得困难,但您可以修改索引标签或完全删除它的名称。通过执行del df.index.name命令可以删除名称。

你也可以选择重置你的DataFrame索引。当你有重复的索引值时,这很有用。您所需要做的就是重置索引,删除任何重复项,然后恢复新的无重复项的列索引。

删除列更容易一些。通过使用drop()方法,可以删除列。这要求您输入想要删除的列标签,因此在发出drop()命令之前,请确保您已经记下了正确的列名。同样,如果你将inplace设置为True,你将能够在不重新分配DataFrame的情况下删除列。

最后,我们将向您展示如何删除DataFrame行。

执行df。drop_duplicate()将根据您为行标签提供的条件删除重复的行。您还可以选择同样适用于列的.drop()方法,只不过您需要提供一个行索引。确保在执行此操作后重新设置索引。

要明确地删除缺少值的行,可以使用DataFrame。dropna(轴=0,how='any', thresh=None,子集=None, inplace=False)。这将自动删除任何具有空值的行。还可以调整函数的参数,以确定是否在特定的数据选择中删除缺失的值。

如果你想用特定的值替换空值,你可以使用.fillna()命令而不是用.dropna()删除它们。

2.如何重命名一个熊猫数据框架的索引或列

重命名索引和列要比删除它们简单得多。要重命名这些对象,您所要做的就是使用.rename()方法并填充您想要给出新值的索引(或列)。

如果在重命名任务中将inplace参数更改为False,则在更改列名时不会重新分配DataFrame。

3.如何格式化你的熊猫数据框架的数据

大多数时候,DataFrame用户需要编辑、更改和格式化他们的DataFrame中的值。我们来看看一些最重要的策略,如果这是你想要做的。

当您想要替换字符串的每个实例时,可以使用.replace()命令,填充格式中的空白(您正在更改的值,您正在将其更改为的值)。

然后,程序会自动替换您希望更改的字符串或值的每个实例。

您可能需要的另一种格式是删除不需要的部分字符串的能力。map()命令将您所选择的lambda函数应用到该列中的每个元素,如果您在“result”列上使用它。

您还可以将列文本拆分为多行,尽管这有点复杂,所以请耐心等待,我们将带您完成一个简短的教程。

首先,您必须确定太长的行,以便知道要分割哪些行。一旦你把它们写下来,你会想要取它们所在的列和空格上的字符串。下一步是获取将跨行分割的值,并将它们放入Series对象中。

如果您的级数中有NaN值,不要担心,您正在朝着正确的方向前进。简单地堆叠Series,就可以保证Series的最终副本不会有任何不需要的NaN值。

为了让堆叠的系列变成想要的格式,你必须放下关卡,让它与DataFrame对齐。在此之后,只需将您的Series转换为DataFrame,将其放回它来自的DataFrame中,然后从原始DataFrame中删除错误的列。最后一步(删除列)可以防止生成重复项。

可以应用于DataFrame中的数据的最后一种格式是将函数应用于DataFrame的行或列。

首先使用.loc[]或.iloc[]选择要处理的行。但由于我们在DataFrame中,你会更具体地使用df。Loc和df.iloc。然后,一旦选择了正确的行,就可以使用apply()将doubler之类的函数应用到行或列。

4.如何创建一个空的数据框架

创建一个空的DataFrame可以归结为使用pandas DataFrame()函数。

如果希望使用nan初始化DataFrame,可以简单地选择使用numpy。Nan,它有一个类型float。这意味着新DataFrame中的数据值默认情况下也将是float类型。通过输入dtype属性,然后填充您正在寻找的类型,您可以绕过这个默认设置。

DataFrame()函数依赖于您传递要放入DataFrame的数据,例如,您的索引和列。该数据可以根据需要拥有任意多的不同类型。另外,正如我们已经建立的,您可以使用dtype属性强制其数据类型为您想要的数据类型。

您可以选择指定空DataFrame将使用的轴标签或索引。如果您不这样做,pandas DataFrame将使用常识性规则自动为您构造它们。

5.熊猫在导入数据时能识别日期吗?

原则上,是的。实际上,这有点复杂。

熊猫可以注意到输入的日期,但当你向正确的方向轻轻推动它时,效果最好。更具体地说,无论何时从CSV文件或类似文件导入数据,都需要添加parse_dates参数。对于一个CSV文件,它看起来像这样:

pd。read_csv (yourFile, parse_dates = True)

这种方法最适用于使用数字格式的日期。然而,并不是所有的日期都采用这种格式。

对于不寻常的日期格式,或者DataFrame难以识别的日期格式,您需要创建自己的解析器。这些可能采用lambda函数的形式,该函数使用格式字符串来控制输入识别的日期和时间。

无论你选择哪种方式给熊猫轻推,在你完成后,它都会识别日期和时间。这意味着在您端输入最少的情况下,您可以指示DataFrame接收您提供给它的任何基于日期的信息。

6.什么时候,为什么和如何重塑你的熊猫数据框架

数据分析是pandas DataFrame最重要的用途之一。这就是为什么能够塑造和重塑DataFrame是很重要的,这样你塑造它的结构就非常适合你的数据分析需求。

所以,问题的答案是“什么时候应该重塑我的数据框架?”,即当前格式对计划执行的数据分析没有用处,并且不打算为此目的创建新列或新行。你应该重塑它的原因是你正在寻找最适合你的数据分析的形状。

现在只剩下一个问题:“怎么做到的?”

你可以选择枢轴或堆栈。你也可以使用“拆解和熔化”方法。我们将详细分析这三种方法是如何工作的,以及如何使用它们来重塑DataFrame。

用Pivot方法重塑你的数据框架

让我们从主元选项开始。这将在原始表的基础上创建一个新表,允许您按照您想要的方式塑造新副本。使用此函数依赖于传递三个参数。

首先是价值观。这个参数是您选择原始DataFrame的值的点,这些值将被合并到新的DataFrame中,因此您可以选择包含什么,以及您宁愿省略什么。

接下来,您将传递列。你传递的所有元素都将成为最终表中的列。

最后,您必须选择希望在新表中使用哪些索引。

明确想要在结果表中合并哪些数据是很重要的。例如,您不能在指定的列中包含包含重复值的行,因为会出现错误消息。另一个例子是,如果您没有准确地选择想要包含在最终表中的值,那么您将以多个列为枢轴。

接下来我们将讨论如何堆叠。

用Stacking方法重塑你的数据帧

堆叠数据帧使它们更高。你可能认识到这个事实。在如何格式化DataFrame中的数据的演练中,我们在第三个问题中谈到了堆叠。

技术上的解释是,您正在移动最内层的列索引,而将其更改为最内层的行索引。这将为您提供一个DataFrame,该DataFrame具有新的索引和新的行标签级别,该索引将位于最内层。

现在是时候考虑如何拆解堆栈了。正如你所想象的,这是一个反向的堆叠过程;其中堆叠移动最内层的列索引,而非堆叠移动最内层的行索引。当你解栈时,你移动了最内层的行索引这样它就可以被用作最内层的列索引。解堆是和熔化一起使用的,所以我们接下来会看一下。

用熔融方法重塑你的数据框架

当您的DataFrame使用一个或多个列作为标识符变量,而其余列作为度量变量时,熔融是理想的。在这些情况下,融化基本上可以让你的DataFrame更长,而不是更宽。

实际上,您可以将测量的变量移到行轴上,这样melt就可以确保测量的变量被放置在DataFrame的高度而不是宽度上。最终产品将包含两列:一列用于变量,一列用于值。

如何使用熊猫数据框架

您可以像使用Excel电子表格一样使用DataFrame, pandas DataFrame也不例外。

本质上,您可以使用pandas DataFrame作为数据结构。它还可以用于处理和分析数据,就像电子表格一样。

当您获得需要阅读或操作的数据时,pandas是帮助您实现这一目标的有用工具。我们已经描述了如何将数据输入pandas DataFrame,由于pandas与许多不同类型的数据兼容,因此可以将许多类型的数据导入其中。这确保您可以使用您的信息,无论它采取何种格式。

然后,您可以使用我们上面概述的格式化过程将数据转换为所需的格式。您可以转换已经获得的数据,将其塑造成更适合您需要的更可用的格式。

由于pandas是专门为与Python一起使用而设计的,所以几乎在任何时候都可以将两者结合使用。这意味着你可以轻松地完成任务使用PySpark和pandas缩放SHAP计算

我们将更具体地了解如何在pandas dataframe中执行特定的任务和功能。在详细介绍使用pandas的优点之前,我们将介绍创建pandas数据框架、索引和迭代等内容。

如何创建一个熊猫数据框架

由于pandas dataframe是一种多功能工具,可以以许多不同的方式使用,因此也可以使用一些不同的策略来创建它们。

在回答问题4时,我们已经介绍了如何设置一个空的熊猫数据框架。这是可以用来创建新的pandas DataFrame的方法之一。当您还没有另一个数据结构可以“重新定位”为pandas时,或者换句话说,当您想从一个完全空白的石板开始时,这种方法是最好的。

我们将看看如何从NumPy ndarray创建一个熊猫数据帧。

简而言之,你可以很容易地从NumPy数组创建dataframe。你所需要做的就是将你所选择的数组传递给pandas数据参数中的DataFrame()函数,然后它将使用你的NumPy数据来塑造你的新DataFrame。参数看起来像这样:

打印(pd。Dataframe [])

你输入的数据放在尖括号里。

值、索引和列名应该已经包含在NumPy数组中,以便pandas可以使用您的特定信息为您创建正确的DataFrame。

使用pandas DataFrame的一个好处是DataFrame()函数可以采用许多不同的结构作为输入。当您使用非numpy结构创建结构时,该过程的工作方式几乎相同。也就是说,您仍然需要将数组传递到DataFrame()函数中,然后指示pandas使用该信息来创建新的DataFrame。

你甚至可以使用一个数据帧作为输入来创建新的数据帧。为此,您可以使用my_df = pd。DataFrame(),将输入数据插入公式。

原始字典的键将包含在Series和DataFrame的索引中。导入完成后,您的密钥将自动排序。

您可以使用shape属性和.index属性来了解新创建的DataFrame的尺寸。这将显示它的宽度和高度。如果你想要找出它的高度,你会想要使用LEN()函数(同样,与.index属性一起),它会显示你的DataFrame的高度。

这两种方法都显示了包含所有NaN值的DataFrame的维度。另一方面,使用df[0]。count()将显示DataFrame的高度,而不包含任何NaN值。

在pandas数据框架中索引

您可以用索引集合中的物理项的方式来考虑数据索引。换句话说,pandas中的索引包括对数据进行排序,并通过挑选出要使用的特定值、行和列来组织数据。

pandas DataFrame允许您执行的索引类似于您可以在Excel中执行的索引。最大的区别是pandas索引更加详细和通用,使您能够以您想要的方式处理数据,从而获得更广泛的选项。

在pandas中,您可以通过选择您希望使用的DataFrame中的特定数据行和/或列来开始索引。确切的选择可以有很多种形式。有时,你想要只使用几行,但全部列;其他时候,情况正好相反。您可能还需要一些特定的行和列。

因为要选择特定的数据子集,所以索引有时也称为子集选择。

让我们讨论一下在pandas数据框架中索引是如何工作的。

实际上,您可以使用四种不同的方法在pandas中进行索引,因此我们将对每种方法进行快速概述。首先是df[],这是一个索引操作符函数。你也可以用df。Loc[]当你在处理标签时。df。Iloc[]主要用于关注位置和/或基于整数的数据。最后是df。Ix[],一个用于基于标签和基于整数的数据的函数。

我们刚才提到的四种索引样式称为索引器,它们是一些最常用的数据索引方法。

遍历熊猫数据框架

当您需要在pandas DataFrame中重复执行同一组语句时,或者,换句话说,当您想要遍历各行时,做好准备是个好主意。

这是熊猫的另一个很容易实现的功能。您需要同时使用for循环和iterrows()命令来设置迭代。这允许您以(index, Series)对的形式将DataFrame行放入循环中。

这样,您就可以在结果中获得(index, row)元组。

当你在pandas中迭代时,你是在指示DataFrame像字典一样迭代。也就是说,您在对象的键上迭代,在行和列中一个接一个地获取项。

使用pandas数据框架的优点

  • 可以轻松加载不同数据库和数据格式的数据:
    • 可以用于许多不同的数据类型
  • 有直观的合并和连接数据集,使用一个公共键,以获得完整的视图
  • 段记录在一个数据帧内
  • 允许基于标签的智能切片,创造性索引和大型数据集的子集
  • 通过访问pandas DataFrames内的内置函数,快速聚合和总结以从数据中获得雄辩的统计数据
  • 定义自己的Python函数,这些函数具有特定的计算任务,并将它们应用到DataFrame记录上
  • 有语法可以帮助你用更少的写作完成更多的工作
    • 允许您在两行或更少的代码内完成在c++或Java中可能需要15行代码的相同任务
    • 简化工作流程,每天做更多的事情,增加你实际能够处理和分析的数据量
  • 访问各种各样的特性,所有这些特性都与Python完全兼容,因为pandas被设计为与Python一起使用
    • 考虑到许多行业专业人士都精通Python, Python-pandas的组合是否更容易访问
  • 轻松高效地处理大量数据,而且由于我们已经提到的语法,速度也很快
  • 由于灵活的数据处理,您可以轻松地编辑数据,并对其应用任何必要的函数,因此可以自定义数据方法
  • 由于它们是开源的,确保任何需要它们的人都可以使用它们,所以它们更容易访问吗
  • 与许多不同类型的编程语言兼容,甚至超出了它们的设计范围。例如,它可以与Java和HTML一起工作
  • 可以很容易地转换成其他格式,如_json

top5熊猫DataFrame可视化工具

虽然pandas DataFrame为用户提供了使用许多不同特性和功能的机会,并灵活地操作他们输入到pandas库中的任何数据,但它并不是一个高度可视化的工具。基本上,它能给你更多的后台视角。

这在很多方面都非常有用。例如,有时确实需要对所输入的数据进行可视化表示。

例如,将pandas与Excel等类似工具进行比较。在Excel中,你可以点击几个按钮,自动将纯数字数据转换为具有视觉吸引力的图形、图表或其他表示形式。熊猫没有这样的功能。

出于这个原因,您需要在pandas DataFrame本身之外寻找数据可视化工具。

下面是五个最好的DataFrame可视化工具。前两个是JavaScript工具,而其他三个是与Java无关的数据分析应用程序。我们将分解每个工具的细节,向您展示为什么它有用,以及是什么让它获得了我们给它的排名。

说了这么多,让我们先来看看前两种工具,以及为什么JavaScript工具占据了这些位置。

JavaScript工具

JavaScript最初被称为LiveScript,由于其灵活、动态的特性,它是当今最流行的编程语言之一。它使用的语法类似于另一种广泛使用的编程语言C。

当你使用JavaScript时,你可以创建交互式网页。您还可以调整现有的网页。与pandas DataFrame一样,JavaScript能够操纵数据,因此可以使用它来执行计算或验证基于数据的结论。对于希望将动态文本插入HTML或CSS文档的人来说,它也很有用。

在本例中,我们将研究可用于pandas DataFrame可视化的JavaScript工具。

JavaScript工具之所以能够在我们的最佳可视化工具列表中占据前两名的位置,是因为JavaScript作为一种语言,一直在发展。它被广泛使用不仅是因为它的广泛用途,还因为它在不断增长和发展,越来越多的人使用它。因此,使用这种语言创建的工具可以更加灵活,并且能够满足用户的需求。

现在,让我们看看Qgrid,这是用于熊猫数据框架可视化的顶级JavaScript工具,其次是数据透视表.js,这是用于此目的的第二佳工具。

1.Qgrid

Qgrid由Quantopian开发,通过使用SlickGrid组件,为您的DataFrame提供额外的交互性,允许您在显示版本中对pandas DataFrame中的数据进行排序和筛选。Qgrid是一个Jupyter笔记本小部件。

使用Qgrid,您可以根据数据类型筛选数据。这意味着您可以使用Qgrid访问一个易于使用的过滤系统。

谈到数据可视化,Qgrid的一个特别有用的特性是允许您配置呈现特性。完成配置后,就可以在DataFrame中读取所选数据。这使得Qgrid特别适合于数据操作或需要仔细检查数据的任何人。

让我们快速浏览一下Qgrid的工作原理。

要使用它,您可以使用QGridLayout的父布局或parentWidget()为QGridLayout分配特定数量的空间。然后,该工具将此空间分割为行和列,将分配给它的每个小部件放置到适当的单元格中。

2.PivotTable.js

数据透视表.js是一个使用透视表库的JavaScript模块,在我们关于pandas的顶级工具列表中排名第二。它可以让您总结和枢轴数据,帮助您更容易和更容易地与数据交互。

数据透视表.js的一个主要好处是它非常容易使用。你所需要做的就是点击和拖动,你就可以充分利用它的功能。

这些特性包括简单的可视化,以及对pandas DataFrame中的数据进行统计分析。它是旋转和汇总数据的一个很好的工具,这样您就可以在pandas DataFrame中获得更容易理解的数据概述。此外,在构建了一个表之后,您可以过滤其中包含的数据,从而使用相同的小部件为您提供额外的实用程序。

js对于将数据透视图和表格拖放到pandas DataFrame中也很有用。您可以使用此方法从Jupyter和IPython Notebook传输表,为您输入到pandas库的数据提供了更大的灵活性。

数据分析应用

熊猫数据图,正如我们所建立的,对于任何想要分析他们的数据的人来说都非常有用。

处理数据可能很复杂。当数据生成时,除非您将其插入正确的工具或应用正确的公式,否则它不会自动组织。这是数据分析应用程序如此有价值的部分原因;分析数据,即使是组织良好的数据,当您可以编写一个函数来为您做这件事时,会快得多。

在本节中,我们将考虑最适合帮助您可视化存储在pandas DataFrame中的信息的三个数据分析应用程序。

3.pandasGUI

pandasGUI是一个基于python的库,用于帮助进行数据操作和汇总统计。它们使用GUI(图形用户界面)应用于DataFrame库中的数据,这涉及在界面中执行任何预期的操作。pandasGUI的设计目的是让你在UI(用户界面)中输入命令,然后程序自己执行它们。

对于任何想要安装pandasGUI的人来说,一个简单的提示是,最好为这个特定的目的设置一个新的、单独的虚拟环境。然后,您可以在此环境中安装您的pandasGUI库。这样,您将有一个更干净的安装,并能够更快地使用工具。

一旦安装和设置完成,您就可以立即开始了。将您的DataFrame传递给函数,pandasGUI将自动填充从您的数据集中绘制的行和列。使用此方法,您甚至可以一次加载多个数据集,使您可以一次轻松地概述大量信息。

一旦成功地将数据传递给函数,您就可以从GUI访问数据。从那里,你可以用很多不同的方式与这些数据交互、编辑、分析和操作。在可用功能和布局外观方面,它或多或少像Excel电子表格。

GUI格式的数据也可以复制和粘贴到其他格式。如果您正在寻找的可视化类型是图表或图形之类的东西,这使得将数据传输到所选的可视化工具特别容易。

本质上,pandasGUI使用起来特别简单。它也非常友好,即使是对缺乏经验的程序员。这就是为什么它成为pandas DataFrame第三大最有用的数据可视化工具的原因。

4.Tabloo

Tabloo将自己描述为“用于可视化表格数据的极简仪表板应用程序”。您可以从Python运行它,这意味着它也完全兼容pandas。

这个数据可视化工具使用了Flask后端,尽管它也与其他类型的后端语言兼容。后端为您提供了一个简单的界面,可以让您直观地了解放入pandas DataBase中的数据。

Tabloo还允许你绘制数据图。这意味着你不必求助于外部软件就可以看到你需要的图形和图表,如果你正在寻找一个快速可视化的工具,而不想寻找更多的工具来提供给你,这是很方便的。

就使用方式而言,Tabloo与熊猫gui有很多相似之处。它还将数据组织到单元格中,然后可以使用与pandasGUI同样能够运行的功能对单元格进行操作。然而,在Tabloo中一次应用多个过滤器有点困难,这是pandasGUI非常能够处理的事情。

Tabloo操作的语法是查询语法,如pandasGUI。

熊猫gui和Tabloo的一个重要区别是前者功能更丰富。当你使用pandasGUI时,你可以获得更多处理数据的选择,这就是为什么Tabloo在这个列表中排名较低,尽管它为用户提供了不可否认的有用功能。

5.维加拉

以与Tabloo的架构相媲美的架构为特色,D-Tale占据了这个列表的最后一个位置。D-Tale使用一个Flask后端,很像Tabloo,以及一个React前端,帮助你充分利用D-Tale让你使用的广泛选项数组。

正如应用程序的名字所示,使用D-Tale时看到的用户界面非常详细。你可以通过将你的熊猫数据导入D-Tale来访问它。然后它会自动被组织成行和列,这带来了大量的排序功能,您可以使用它来让数据集看起来完全像您想要的那样。例如,您可以对所选择的任何行或列使用锁定、隐藏、删除和重命名等功能。

D-Tale还允许您绘制数据的可视化表示形式,范围从图表到直方图等等。

一个有用的D-Tale特性是您可以在任何时候从应用程序导出代码。然后可以很容易地将该代码粘贴到另一个应用程序中,以检查其有效性或以其他方式处理数据。

D-Tale还允许您处理数据的格式。例如,假设数据集中包含了日期。如果您希望使用反斜杠而不是句号将日期分开月和日,您可以在D-Tale中进行调整。

熊猫数据框架概括

当您希望处理、操作和分析数据时,pandas DataFrame是您的朋友。

它是一个设计用于与Python结合使用的库,使几乎任何对Python稍有了解的人都可以访问它。它还能够处理多种不同格式的数据,确保无论数据采用何种形式,您都可以轻松地输入数据。

在本文中,我们已经介绍了使用熊猫带来的最大优势,但无论如何,我们将对它们进行快速总结。pandas DataFrame可以让你快速轻松地聚合数据。它还兼容多种可视化工具,提供最大的灵活性。与其他脚本语言不同,它能够用几行代码命令完成很多事情,使其在常规基础上使用更快。

一言以蔽之,pandas DataFrame非常有用,对于任何想要处理数据的人来说都是如此。

额外的资源


回到术语表