摘要:
使用NumPy需要先导入,约定俗成地为它起别名np。使用np.array 可传入一个元组或列表。如果是二维数据,可以是由列表组成的列表或 由元组组成的列表等形式。 import numpy as np np.array([1, 2, 3]) np.array((1, 2, 3)) # 同上 # ar 阅读全文
摘要:
可以对字符串进行切片访问(同时适用于字符、列表、元组等)。 字符串从左往右,索引从0开始;从右往左,索引从–1开始。可以取字 符串中的片段,切片索引按左闭右开原则: var = 'Hello World!' # 按索引取部分内容,索引从0开始, 左必须小于右 # 支持字符、列表、元组 var[0] 阅读全文
摘要:
也可以用isinstance来判断数据是不是指定的类型: isinstance(123, int) # 123是不是整型值 # True isinstance('123', int) # False isinstance(True, bool) # True 阅读全文
摘要:
Pandas利用plot()调用Matplotlib快速绘制出数据可视化图形。注 意,第一次使用plot()时可能需要执行两次才能显示图形。可以使用plot()快速绘制折线图。 df['Q1'].plot() # Q1成绩的折线分布 可以先选择要展示的数据,再绘图。 df.loc['Ben','Q1 阅读全文
摘要:
df.mean() # 返回所有列的均值 df.mean(1) # 返回所有行的均值,下同 df.corr() # 返回列与列之间的相关系数 df.count() # 返回每一列中的非空值的个数 df.max() # 返回每一列的最大值 df.min() # 返回每一列的最小值 df.median( 阅读全文
摘要:
增加列: df['one'] = 1 # 增加一个固定值的列 df['total'] = df.Q1 + df.Q2 + df.Q3 + df.Q4 # 增加总成绩列 # 将计算得来的结果赋值给新列 df['total'] = df.loc[:,'Q1':'Q4'].apply(lambda x:s 阅读全文
摘要:
df.groupby('team').sum().T df.groupby('team').sum().stack() df.groupby('team').sum().unstack() 阅读全文
摘要:
我们可以实现类似SQL的groupby那样的数据透视功能:df.groupby('team').sum() # 按团队分组对应列相加df.groupby('team').mean() # 按团队分组对应列求平均# 不同列不同的计算方法df.groupby('team').agg({'Q1': sum 阅读全文