摘要: 使用NumPy需要先导入,约定俗成地为它起别名np。使用np.array 可传入一个元组或列表。如果是二维数据,可以是由列表组成的列表或 由元组组成的列表等形式。 import numpy as np np.array([1, 2, 3]) np.array((1, 2, 3)) # 同上 # ar 阅读全文
posted @ 2023-12-31 06:43 myrj 阅读(6) 评论(0) 推荐(0) 编辑
摘要: 可以对字符串进行切片访问(同时适用于字符、列表、元组等)。 字符串从左往右,索引从0开始;从右往左,索引从–1开始。可以取字 符串中的片段,切片索引按左闭右开原则: var = 'Hello World!' # 按索引取部分内容,索引从0开始, 左必须小于右 # 支持字符、列表、元组 var[0] 阅读全文
posted @ 2023-12-31 06:23 myrj 阅读(26) 评论(0) 推荐(0) 编辑
摘要: 也可以用isinstance来判断数据是不是指定的类型: isinstance(123, int) # 123是不是整型值 # True isinstance('123', int) # False isinstance(True, bool) # True 阅读全文
posted @ 2023-12-31 06:20 myrj 阅读(3) 评论(0) 推荐(0) 编辑
摘要: Pandas利用plot()调用Matplotlib快速绘制出数据可视化图形。注 意,第一次使用plot()时可能需要执行两次才能显示图形。可以使用plot()快速绘制折线图。 df['Q1'].plot() # Q1成绩的折线分布 可以先选择要展示的数据,再绘图。 df.loc['Ben','Q1 阅读全文
posted @ 2023-12-31 06:18 myrj 阅读(87) 评论(0) 推荐(0) 编辑
摘要: df.mean() # 返回所有列的均值 df.mean(1) # 返回所有行的均值,下同 df.corr() # 返回列与列之间的相关系数 df.count() # 返回每一列中的非空值的个数 df.max() # 返回每一列的最大值 df.min() # 返回每一列的最小值 df.median( 阅读全文
posted @ 2023-12-31 06:03 myrj 阅读(4) 评论(0) 推荐(0) 编辑
摘要: 增加列: df['one'] = 1 # 增加一个固定值的列 df['total'] = df.Q1 + df.Q2 + df.Q3 + df.Q4 # 增加总成绩列 # 将计算得来的结果赋值给新列 df['total'] = df.loc[:,'Q1':'Q4'].apply(lambda x:s 阅读全文
posted @ 2023-12-31 06:02 myrj 阅读(138) 评论(0) 推荐(0) 编辑
摘要: df.groupby('team').sum().T df.groupby('team').sum().stack() df.groupby('team').sum().unstack() 阅读全文
posted @ 2023-12-31 05:57 myrj 阅读(17) 评论(0) 推荐(0) 编辑
摘要: 我们可以实现类似SQL的groupby那样的数据透视功能:df.groupby('team').sum() # 按团队分组对应列相加df.groupby('team').mean() # 按团队分组对应列求平均# 不同列不同的计算方法df.groupby('team').agg({'Q1': sum 阅读全文
posted @ 2023-12-31 05:54 myrj 阅读(5) 评论(0) 推荐(0) 编辑