熊猫入门
熊猫入门
我想对 Pandas 库做一个简短的介绍,介绍一些基本概念并已经将它们应用到实际示例中。
与 Python 中的任何库一样,第一步是导入。可以使用以下代码:
将熊猫导入为 pd
我们要做的第一个动作是操作一个表。要打开文件,我们使用 read 函数。因此,可以打开不同格式的文件,包括:csv、excel、json、html、sql、xml 等。
该函数的语法是 pd.read_filetype('文件位置')
.例如,让我们打开一个 Excel 表格,其中包含过去 4 周的汽油/乙醇价格:
pd.read_excel('\content\last-4-weeks-gasoline-ethanol-2.xlsx')
作为输出,我们将有以下内容:
现在,让我们将上面的代码分配给一个“电子表格”变量:
电子表格 = pd.read_excel('\content\last-4-weeks-gasoline-ethanol-2.xlsx')
如果我想从表中选择任何列,我可以使用 worksheet[“column name”] 访问它。例如,让我们选择具有销售额值的列:
表[“销售价值”]
作为输出,我们将有:
如果我们想知道哪个是最大值或最小值,我们可以分别使用 max() 和 min() 函数:
- 对于最大值:
sheet[“销售价值”].max()
- 对于最低金额:
sheet[“销售价值”].min()
最后,让我们绘制两种类型的图表:折线图和直方图。
要绘制折线图,我们需要使用 plot() 函数。在示例中,让我们用汽油数据的日期和值绘制图表:
电子表格.plot("收款日期", "销售金额")
作为输出,我们将看到下图:
要绘制直方图,我们使用 hist() 函数。让我们用销售价值绘制一个直方图:
电子表格.hist("销售价值")
作为输出,我们在 x 轴上有一个销售价值图表,以及销售该价值的点或城市的数量:
这是对如何使用 Pandas 的概述。我们可以在 Pandas 中使用许多功能,我们将在未来介绍这些功能。
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明